Первый в России: Яндекс запустил сервис быстрого синтеза речи для бизнеса

Загрузив 20–40 минут записи речи диктора, компании могут создать уникальный голос своего бренда и использовать его для голосовых ботов в контакт‑центрах, озвучки подкастов, образовательных материалов и других бизнес‑проектов.

Brand Voice Lite доступен компаниям на платформе Yandex Cloud. Как отметили в пресс-службе, это первый подобный сервис в России.

Для синтеза голоса требуется озвучить текст в интерфейсе сервиса или загрузить в него уже готовую запись. Дикторами могут стать, например, приглашенные актеры или владельцы и представители бизнеса. Они могут синтезировать голос в разных амплуа: для каждой дополнительной эмоции (например, грустной или агрессивной речи) требуется записать еще от 20 минут речи. Модель синтеза станет доступна в течение семи дней после загрузки записей в сервис.

В Яндексе подчеркнули:

Технология Brand Voice Lite соответствует принципам Яндекса при работе с синтезом речи. Бизнес должен получить согласие человека на использование записи его голоса. Доступ к результатам синтеза будет только у заказчика. При этом он соглашается с правилами использования сервиса, которые ограничивают сценарии применения синтеза.

В основе Brand Voice Lite – собственные ML-модели Yandex SpeechKit, которые дообучаются под каждого клиента на их датасетах. Данные для обучения хранятся в дата-центрах компании.