Компания Google представила обновленную версию своей языковой модели Gemini 2.5 Pro, которая улучшает производительность в генерации кода и исправляет недостатки предыдущих сборок. По словам представителя компании Логана Килпатрика, новая версия модели набрала рекордные 82,2% в бенчмарке Aider Polyglot, обойдя конкурентов от OpenAI, Anthropic и DeepSeek.

Команда разработчиков учла критику пользователей, поступившую после релиза версии 03-25. В результате, Gemini 2.5 Pro демонстрирует улучшения в креативности и форматировании ответов. Также была добавлена поддержка конфигурируемых вычислительных бюджетов для разработчиков, что позволяет более эффективно контролировать затраты и время обработки.

Новая модель уже показывает лидерство в пользовательских тестах LMArena и WebDevArena, где отрыв от ближайших конкурентов составляет 24 и 35 пунктов Elo соответственно. Хотя Gemini 2.5 Pro все еще находится в статусе «Preview», ожидается, что ее следующая версия станет финальной стабильной и будет внедрена в основное приложение Gemini и веб-интерфейс в ближайшие недели.

Проблема, которую пытается решить Google, заключается в растущих требованиях к ИИ-моделям. Бизнес-клиенты ищут более быстрые, мощные и экономически эффективные решения для создания сложных приложений. Gemini 2.5 Pro нацелена на удовлетворение этих потребностей, показывая значительный скачок в производительности, что подтверждается тестами.

В числах, новая модель демонстрирует рост на 24 пункта в рейтинге Elo по LMArena, достигнув отметки 1470, и на 35 пунктов в WebDevArena, до 1443. Модель также занимает лидирующие позиции в сложных бенчмарках, таких как Aider Polyglot, и показывает высокие результаты в тестах на математику, научные знания и логику, таких как GPQA и Humanity’s Last Exam.

В Gemini 2.5 Pro не только улучшена производительность, но и внесены изменения в оформление и структуру ответов. Для разработчиков добавлена новая важная функция — «бюджеты мышления», которая позволит более эффективно управлять затратами и задержками при работе с моделью. Начать работу с обновленной версией разработчики могут через Gemini API в Google AI Studio и Vertex AI, а также в приложении Gemini.

От Дмитрий Соколов

Гик-писака🤓