Компания Google анонсировала обновлённую версию своей нейросети под названием Gemini 2.0 Flash. Главной особенностью новой модели является возможность редактирования изображений на основе текстовых описаний пользователей. Эта функция открывает новые горизонты для креативного подхода к визуальному контенту и делает взаимодействие с искусственным интеллектом более интуитивным.

Согласно информации от Google, Gemini 2.0 Flash сочетает мультимодальный ввод, расширенные логические способности и повышенное понимание естественного языка. Это позволяет модели выполнять разнообразные задачи, среди которых генерация иллюстрированных историй, разговорное редактирование изображений и создание реалистичных визуализаций.

Пользователи смогут использовать Gemini 2.0 Flash для генерации рассказов с сопровождающими иллюстрациями, что может быть полезно не только для контент-креаторов, но и для образовательных проектов. Также модель позволяет редактировать фотографии в режиме реального времени, заменять лица и одежду, раскрашивать черно-белые изображения, реставрировать старые фотографии и добавлять текст на изображения.

Эти возможности являются значительными шагами вперёд по сравнению с предыдущими версиями продуктов Google, которые уже включали базовые функции редактирования. Новая версия будет доступна для тестирования в Google AI Studio и через Gemini API. Однако стоит отметить, что в России без изменения IP-адреса доступ к ней будет затруднён.

Согласно заявлениям Google, нейросеть также способна запоминать контекст беседы в реальном времени, что значительно улучшает качество взаимодействия с пользователями. Однако, как и в большинстве новых технологий, некоторые функции могут находиться в стадии доработки и работать некорректно.

С запуском Gemini 2.0 Flash Google укрепляет свои позиции на рынке искусственного интеллекта и предоставления уникального контента. Ожидается, что эта версия проложит путь к новым возможностям для пользователей и разработчиков, в том числе в сфере образования и развлечений, создавая более доступные и интерактивные средства работы с изображениями.

От Дмитрий Соколов

Гик-писака🤓