На конференции Google I/O компания Google анонсировала новую модель генерации видео — Veo 3. Она уже доступна подписчикам тарифа Google AI Ultra в США и позволяет создавать видеоконтент, практически неотличимый от реального.
Главное отличие Veo 3 от других аналогичных систем, включая Sora от OpenAI, — наличие озвучки, фоновых звуков и реалистичной синхронизации речи. Модель способна следовать сложным текстовым описаниям, преобразуя их в видео с высокой детализацией, соблюдением физики реального мира и сохранением визуальной целостности сцен. Среди особенностей: точное движение губ в соответствии с речью; детализированные образы людей с анатомически корректной внешностью (например, пять пальцев на руках); стабильность кадров без нарушений логики действия.
Многие пользователи, просматривая созданные ролики, не могут отличить их от снятых с участием реальных актёров и съёмочной группы. Один из вирусных примеров — видео, опубликованное биологом и режиссёром Хашемом Аль-Гайли. В нём сгенерированные актёры рассуждают о своей «искусственной» природе. Многие зрители признали ролики впечатляющими, но при этом выразили обеспокоенность тем, насколько тонкой стала грань между настоящим и созданным машиной.
В промо-ролике нового сервиса Flow, включающего Veo 3, режиссёры делятся впечатлениями от работы с системой. «Кажется, будто она развивается сама по себе», — отметил один из участников, режиссёр Дэйв Кларк. Возможность массового создания гиперреалистичных видео вызывает дискуссии среди профессиональных режиссёров и художников. Некоторые воспринимают любой ИИ-контент как «бесполезную имитацию», независимо от его технического уровня.
Эксперты отмечают, что Veo 3 может быть полезен в маркетинге и коммерческой съёмке. Однако остаются вопросы к обучению модели — источникам данных и влиянию на креативность результата. Издание 404 Media обнаружило, что несколько пользователей получили практически одинаковые шутки в роликах, сгенерированных на основе запроса «стендап-комик на сцене». Подобный эффект ранее наблюдал YouTube-блогер Маркес Браунли — в ролике, созданном Sora, появился декоративный куст, похожий на тот, что стоит на его столе.
Распространение инструментов наподобие Veo 3 поднимает вопросы об авторских правах, согласии на использование внешности, а также будущем киноиндустрии в условиях автоматизации творчества. Пока единых стандартов регулирования в этой области не существует. Google представила Flow — новую мощную платформу для генерации видео с использованием искусственного интеллекта. Она ориентирована, в первую очередь, на профессионалов в сфере кино.
Платформа интегрирует передовые технологии компании, включая модели Veo 3 для видео, Imagen 4 для изображений и Gemini для обработки текста. Flow позволяет пользователям создавать 8-секундные видеоклипы, используя обычные текстовые описания. С помощью функции Scenebuilder можно объединять ролики, редактировать кадры и создавать плавные переходы между сценами, при этом сохраняя персонажей и динамику движения.
Модель Veo 3 не только генерирует изображения, но и звук, включая диалоги. Одной из ключевых особенностей Flow является возможность управления виртуальной камерой: пользователи могут задавать углы, перспективу и движения. Платформа также предлагает удобный интерфейс для работы с «ингредиентами» — как сгенерированными, так и загруженными изображениями и подсказками.
Кроме того, Flow включает в себя коллекцию Flow TV, где представлены клипы, созданные с помощью данной платформы. Пользователи могут изучать точные команды и приёмы, использованные в каждом видео, и применять их в своих проектах. Flow уже доступна в США для подписчиков новых тарифов: Google AI Pro за $20 (примерно 1 595 рублей) в месяц и Google AI Ultra за $250 (около 20 000 рублей) в месяц. В будущем Google планирует расширить доступ к платформе и в других странах.
