Компания Google представила Veo 3, свою новейшую модель для генерации видео. Эта нейросеть теперь способна создавать качественные видеоролики длиной более 5 секунд с музыкальным сопровождением, речью или целыми диалогами между персонажами. Усовершенствования в алгоритме позволяют Veo 3 лучше понимать текстовые и визуальные запросы по сравнению с предыдущими версиями.
Одной из ключевых функций Veo 3 является реалистичная синхронизация губ персонажей с речью, что делает создание анимаций более естественным. Доступ к Veo 3 уже открыт для подписчиков плана Ultra в приложении Gemini на территории США, а также для корпоративных пользователей через платформу Vertex AI. Это подчеркивает стремление Google сделать передовые инструменты искусственного интеллекта доступными для широкого круга создателей контента.
Помимо запуска Veo 3, популярная модель Veo 2 также получила важные обновления, разработанные в сотрудничестве с профессиональными кинематографистами. В числе нововведений – возможность использования референсных изображений для контроля стиля и внешности персонажей, продвинутые элементы управления камерой и функция outpainting, позволяющая адаптировать видео под различные форматы экранов.
Обновления Veo 2 включают интеллектуальные функции добавления и удаления объектов из видео, что позволяет создавать естественные и реалистично выглядящие сцены. В ближайшие недели все новые функции Veo 2 станут доступны через API Vertex AI, а в последующие месяцы – в других продуктах компании. Эти обновления сделали Veo 2 еще более конкурентоспособной в области генерации видео с помощью искусственного интеллекта.
Инструменты для создания видео с использованием ИИ, такие как Sora и Pika, уже способны генерировать крайне реалистичные фрагменты видео, но они не могут одновременно создавать и аудио. Теперь, с выходом Veo 3, Google обещает изменить правила игры в этой области. Новая модель может автоматически создавать видеоролики, включая звуковые эффекты и диалоги в одном процессе.
На выставке Google I/O 2025 была продемонстрирована возможность создания анимационного CGI-клипа, где звук и изображение были идеально синхронизированы. Это событие подчеркивает потенциал новой технологии в области автоматического создания контента, что может значительно расширить горизонты видеопроизводства с минимальными затратами времени и ресурсов.
