Команда «VK Видео» значительно повысила удобство просмотра контента, увеличив объем видео с субтитрами в 10 раз и улучшив точность обработки расшифровки речи. Теперь слова, произнесенные в видео, оформляются в виде четких предложений с заглавными буквами и знаками препинания, учитывающих разговорную речь, специализированные термины и неологизмы.
На главном экране ленты пользователя 8 из 10 видео будут теперь содержать обновленные субтитры. Их генерация осуществляется с помощью моделей машинного обучения. Аудиопоток видео проходит через несколько этапов обработки: сначала нейросеть исключает посторонние шумы, затем выделяет речь и преобразует ее в текст, а другие модели синхронизируют финальный текст с аудиодорожкой. По данным VK, новая ИИ-модель допускает на 30% меньше ошибок, чем аналогичные технологии в других сервисах.
Это обновление охватывает как профессиональные ролики, так и контент, создаваемый пользователями. Улучшение автоматических субтитров может оказаться особенно полезным для людей с нарушениями слуха, а также в ситуациях, когда использование звука в видео нежелательно.
Внедрение таких технологий соответствует общей тенденции к повышению доступности контента в цифровой среде. Сервис «VK Видео» постоянно стремится улучшать пользовательский опыт, обеспечивая все более качественные инструменты для потребления информации. Нововведения также подчеркивают растущую важность автоматизации и ИИ в повседневной жизни пользователей, позволяя им наслаждаться контентом с минимальными помехами.
