Google представила на выставке MWC 2025 дуэт новых функций для своего искусственного интеллекта Gemini, который вскоре позволит пользователям демонстрировать экран смартфона и транслировать видео с камеры. Эти обновления нацелены на улучшение взаимодействия с ИИ-помощником, предоставляя пользователям возможность более эффективно получать информацию и задавать вопросы о содержимом, которое они видят на экране.

Интерфейс Gemini на Android дополнится кнопкой «Поделиться экраном с Live» (Share screen with Live), которая расположится над текстовым полем «Спросить Gemini» (Ask Gemini). Пользователи могут начать диалог с ИИ-помощником, демонстрируя ему изображение своего экрана. Это действие переводит пользователя в интерфейс телефонного звонка, создавая возможность задавать вопросы о том, что появляется перед ним на дисплее.

Дополнительно, в полноэкранном формате Gemini Live будет доступна кнопка трансляции видео, которая позволит пользователям делиться своими видеоматериалами с ИИ-помощником. Google обновила дизайн кнопок, уменьшив размеры предыдущих круглых форм до более компактных вытянутых вариантов, что делает использование интерфейса более удобным.

Эти функции подробно рассматривались на конференции Google I/O в мае 2024 года и были представлены более широко на последующих мероприятиях, включая демонстрацию в январе на презентации новых смартфонов Samsung Galaxy S25. Стартовый доступ к функциям Gemini Live получают владельцы Android-устройств и подписчики уровня Gemini Advanced уже в марте.

Новые функции являются частью проекта Google под названием «Astra», который предполагает создание универсального мультимодального ИИ-помощника, способного обрабатывать текстовые, видео- и аудиоданные в реальном времени. Ожидается, что возможность работать в мультимодальном режиме повысит эффективность ИИ-помощников.

На MWC также было упомянуто, что Google планирует внедрение технологии анализа видео в реальном времени в Gemini, что позволит ИИ-помощнику предоставлять комментарии на основе видеоизображений, поступающих с камеры. Подписчики Google One AI Premium получат доступ к данным функциям в конце марта 2025 года.

Согласно недавним сведениям, новые функции направлены на консолидацию позиций Google в конкуренции с аналогами, такими как OpenAI и его ChatGPT, который также внедряет поддержку потоковой трансляции и демонстрации экрана. Актуальность и внедрение популярных функций ИИ в Gemini может значительно повысить его привлекательность для пользователей, стремящихся к более интерактивному опыту.

От Дмитрий Соколов

Гик-писака🤓