Платформа Podcastle представила свою новую модель преобразования текста в речь под названием Asyncflow v1.0, вступив в конкуренцию с другими компаниями, такими как ElevenLabs и Speechify. Теперь разработчики смогут интегрировать этот инструмент непосредственно в свои приложения через доступный API. Модель поддерживает более 450 голосов, предоставляя пользователям возможность выбрать нужный стиль озвучивания.

Основатель Podcastle, Арто Ерицян, рассказал в интервью TechCrunch, что стремление создать эффективную модель для преобразования текста в речь всегда было частью стратегии компании. Однако ранее высокие затраты на обучение и требования к данным задерживали развитие этого продукта. С недавними достижениями в области больших языковых моделей, Podcastle добилась прогресса, значительно снизив затраты и повысив качество своего решения.

Вместе с новым продуктом Podcastle также обновила функцию клонирования голосов. Раньше для создания клона требовалось прочитать около 70 различных предложений, теперь достаточно всего нескольких секунд записи. Это стало возможным благодаря технологии Magic Dust AI, которая была внедрена в прошлом году для улучшения качества аудио.

Следует отметить, что Podcastle предлагает конкурентные цены на свои услуги. За 500 минут преобразования текста в речь пользователю придется заплатить 40 долларов, тогда как у некоторых конкурентов цена может доходить до 99 долларов за тот же объем.

Данная инициатива Podcastle демонстрирует большую тенденцию среди стартапов, занимающихся разработкой технологий на базе искусственного интеллекта для преобразования текста в речь, что охватывает такие сферы, как маркетинг, образование и создание контента. Возможность интеграции голосовых моделей в разнообразные приложения открывает новые возможности для пользователей и компаний, что, в свою очередь, может привести к еще большему развитию технологий в данной области.

Поддерживая свои амбиции, Podcastle также хочет расширить функционал платформы, объединяя инструменты для работы с подкастами, аудио и видео в одном месте. Это даст пользователям возможность более эффективно использовать разнообразные ресурсы и технологии в своей практике, на что также указывает рост интереса к видео-контенту среди пользователей.

От Дмитрий Соколов

Гик-писака🤓