Приложение чат-бота Gemini от Google теперь позволяет изменять как изображения, созданные искусственным интеллектом, так и загруженные с устройств пользователей. Эта новая функция, как сообщает компания в своем блоге, постепенно внедряется и вскоре станет доступна более чем 45 языкам и большинству стран.

Запуск редактирования изображений в Gemini следует за экспериментами компании с аналогичными функциями в AI Studio, которые ранее стали популярными благодаря своей возможности удалять водяные знаки с изображений. Новый инструмент редактирования изображений Gemini имеет теоретическое преимущество перед традиционными генераторами изображений на основе AI, предлагая множество возможностей для редактирования.

Gemini предлагает многошаговый поток редактирования, который объединяет текст и изображения для создания «более богатых, более контекстных» ответов на запросы. Пользователи могут изменить фон, заменить объекты и добавлять новые элементы к изображениям. Например, Gemini может создать иллюстрацию для сказки на ночь, изображая драконов, или показать, как пользователь будет выглядеть с другим цветом волос.

Тем не менее, функция редактирования несет в себе риски связанные с использованием технологий deepfake. Чтобы минимизировать эти опасения, Google добавляет невидимый водяной знак к изображениям, созданным или отредактированным с помощью Gemini, и тестирует видимые водяные знаки на всех изображениях.

Редактирование происходит через естественные языковые запросы, позволяя пользователям постепенно вносить изменения в изображения. Например, можно легко заменить зеленый газон на пляж или изменить цвет шляпы у собаки. Это особенно удобно для образовательных задач, презентаций и создания контента в социальных сетях, комбинируя текст и визуальные элементы в единый стиль.

Gemini уже начинает появляться у пользователей, и на протяжении ближайших недель доступ к этой функции будет расширен. Пользователи смогут редактировать любые изображения, включая генерацию, стилизацию и трансформацию по текстовому описанию, что значительно расширяет возможности работы с графическим контентом.

Таким образом, нововведение Google может изменить подход к работе с изображениями в будущем, предлагая интуитивные и адаптивные инструменты для пользователей, что делает процесс редактирования более доступным и многообразным.

От Дмитрий Соколов

Гик-писака🤓