Google представила Nano Banana Pro — обновление своего генератора изображений в составе Gemini 3 Pro. Новая модель делает акцент на работу с реальными данными, улучшенную генерацию текста и согласованность персонажей. Также она включает набор профессиональных инструментов для редактирования, позволяя пользователям изменять угол обзора, фокус, освещение и цветовые настройки. Выход изображений в разрешении до 4K делает этот инструмент особенно полезным для дизайнеров и бизнеса.

Nano Banana Pro, доступный через приложение Gemini, предлагает пользователям возможность создания изображений в режиме ‘Размышления’. Бесплатные пользователи имеют ограниченные квоты, и после их исчерпания возвращаются к базовой версии Nano Banana. Владельцы подписок AI Pro и Ultra получают повышенные лимиты и возможность использования модели в Поиске и в NotebookLM.

Главным отличием Nano Banana Pro от предшественника является способность работать с контекстом и данными в реальном времени. Подключение к базе знаний Google Поиска позволяет ей генерировать изображения, основанные на актуальной информации, что делает модель полезной для создания инфографики и диаграмм.

Также усовершенствована генерация текста: Nano Banana Pro обеспечивает качественные надписи на разных языках и поддерживает широкий спектр текстур, шрифтов и стилей. Google отметила, что модель стала точнее в следовании сложным текстовым инструкциям, что улучшает качество макетов и постеров.

Функционал включает возможность смешивания до 14 снимков, при этом внешний вид до пяти человек сохраняется. Данные инструменты окажутся полезными для дизайнеров, которым требуется быстро трансформировать наброски в визуальные материалы или комбинировать несколько продуктов в одном изображении.

В наборе инструментов появились продвинутые функции, включая детализацию отдельных фрагментов, локальное редактирование, коррекцию освещения и цвета, а также поддержку различных соотношений сторон с выводом в 2K и 4K. Это делает Nano Banana Pro пригодной как для социальных сетей, так и для печати.

Доступ к Nano Banana Pro расширяется за пределы приложения Gemini, и разработчики могут использовать модель через Gemini API, Google AI Studio и Antigravity. Подписчики Google AI Ultra получают интеграцию с новым инструментом Flow для создания фильмов на базе ИИ. Кроме того, Nano Banana 3 была интегрирована в Adobe Firefly и Photoshop в рамках партнерской программы.

Nano Banana Pro не только генерирует иллюстрации, но и создает инфографику и эскизы, а также может дорабатывать логотипы и создавать графики на основе рукописных заметок. Интеграция с поисковой инфраструктурой Google позволяет использовать актуальные данные для создания контента и получения более контекстно точных визуальных материалов.

Новая технология поддерживает комбинирование до 14 объектов в одной сцене и предлагает расширенные инструменты постобработки, включая управление ракурсом камеры и цветокоррекцию. Также в модель была добавлена возможность генерации многоязычного текста с различными шрифтами.

Важно отметить, что сгенерированные изображения будут иметь незаметный цифровой водяной знак SynthID для отличия от оригиналов. Пользователи смогут проверить, было ли изображение создано ИИ от Google, загрузив его в приложение Gemini.

Nano Banana Pro уже доступна в приложении Gemini, при этом расширенные возможности предусмотрены для подписчиков Google AI Plus, Pro и Ultra. Ранее группа ученых из Института AIRI, «Сколтеха», MWS AI и МФТИ представила программное решение для быстрой проверки изображений на соответствие здравому смыслу, основанное на ИИ-алгоритме.

От Дмитрий Соколов

Гик-писака🤓