OpenAI представила новый ИИ-агент, который интегрирован в интерфейс ChatGPT и способен выполнять сложные задачи от имени пользователей. Этот инструмент сочетает в себе возможности ChatGPT, Operator и Deep Research, позволяя пользователям взаимодействовать с ним на естественном языке. Агента можно подключить к Gmail, календарю и GitHub для извлечения релевантной информации.
Новый агент может сёрфить в интернете, создавать исследовательские отчёты, делать презентации, писать код и оформлять онлайн-заказы. Он управляет компьютером, используя разрешения и отображая процесс выполнения задач в реальном времени. Пользователи могут остановить или изменить запрос в любой момент.
Согласно данным OpenAI, агент набрал 41,6% в сложном тесте, демонстрируя значительно более высокие результаты по сравнению с предшествующими моделями. Этот инструмент уже доступен подписчикам планов Pro, Plus и Team, где его можно активировать в контекстном меню ChatGPT.
Ранее ChatGPT мог находить информацию, но не мог применять её для выполнения практических заданий, таких как бронирование поездок или анализ данных. Новый агентный режим объединяет возможности взаимодействия с веб-сайтами, глубокого анализа информации и диалогового интеллекта в единую систему.
ChatGPT в новом режиме может переключаться между различными инструментами, такими как визуальный и текстовый браузеры, терминал и API. Например, новый ИИ-агент способен собрать и проанализировать данные о конкурентах, представив их в виде редактируемого слайд-шоу. Пользователь сохраняет контроль над действиями, подтверждая важные решения, включая покупки.
Эта новая функция представляет собой ключевой шаг для монетизации ChatGPT, предлагая автоматизацию рутинных задач для платных пользователей. OpenAI также приводит цифры производительности: агент набрал 45.5% на бенчмарке SpreadsheetBench, что намного выше 20% у Copilot в Excel.
С расширением возможностей также возникают новые риски, связанные с безопасностью. OpenAI внедрила многоуровневые меры защиты от потенциальных угроз, таких как “инъекции промптов”, позволяя пользователям подтверждать критические действия и отказываясь от высокорисковых задач.
