Yandex представил новый сервис Brand Voice Lite, который позволяет компаниям создавать уникальные голосовые боты на основе записей дикторов. Достаточно всего 20-40 минут записи, чтобы синтезировать голос, который можно использовать в контакт-центрах, подкастах и других креативных проектах. Сервис уже доступен через платформу Yandex Cloud.

Для синтеза голоса в системе достаточно озвучить текст или загрузить готовую запись. В роли дикторов могут выступать не только профессиональные озвучиватели, но и владельцы бизнеса или амбассадоры. Однако для разных эмоциональных окраски необходимо записать дополнительно 20 минут, чтобы обеспечить более естественное звучание. Первую модель синтеза можно получить в течение семи дней после загрузки записей.

Как отмечают разработчики, использование технологии Brand Voice Lite соответствует принципам Яндекса, включая необходимость согласия диктора на использование его голоса. Доступ к синтезированным голосам остается только у заказчика, который соглашается с условиями использования сервиса, ограничивающими сферы применения.

По словам представителя Яндекса, по данным Fortune Business Insights, прогнозируемый объем глобального рынка разговорного искусственного интеллекта достигнет 12,2 миллиарда долларов в 2024 году, что на 21% больше по сравнению с 2025 годом. Ожидается, что российский рынок диалогового ИИ вырастет до 7,45 миллиарда рублей в 2024 году.

Синтезированные голоса уже активно используются в таких секторах, как банковская сфера, ритейл и телекоммуникации, где они помогают автоматизировать первую линию поддержки клиентов. CTO Yandex Cloud Иван Пузыревский сообщил, что технология SpeechKit на данный момент смогла синтезировать более 50 голосов, и с запуском новой версии ожидается значительно больше таких проектов.

Основой сервиса служат ML-модели Yandex SpeechKit, которые адаптируются под требования каждого клиента на основе их данных. Все данные для обучения хранятся в безопасных дата-центрах Яндекса, соответствующих строгим стандартам в области информационной безопасности. Также ИТ-гигант подчеркивает важность соблюдения условий работы с синтезом речи и принятых регуляторных норм.

От Дмитрий Соколов

Гик-писака🤓