OpenAI анонсировала Aardvark, новый автономный ИИ-агент, который предназначен для анализа программного кода, поиска уязвимостей и предложения исправлений. Работающий на базе GPT-5, Aardvark в настоящее время доступен для закрытого бета-тестирования и уже используется внутри компании.
Aardvark соединяется с репозиториями, такими как GitHub, и изучает кодовую базу проекта. Он способен выявлять потенциально уязвимые участки, тестировать их в безопасной среде и генерировать отчеты, классифицируя найденные проблемы по уровню риска. Когда уязвимость подтверждена, инструмент подключает модель Codex для создания патчей и комментариев к коду.
Такой подход позволяет Aardvark эффективно совмещать навыки аудитора, тестировщика и помощника-разработчика. Его возможности включают сканирование кода на наличие уязвимостей, оценку возможности эксплуатации найденных фрагментов и интеграцию с системами CI/CD, что позволяет реагировать на изменения кода в реальном времени.
Инструмент особенно полезен для разработчиков, команд DevSecOps и аудиторов безопасности, особенно в крупных проектах, где ручная проверка может занимать много времени. По данным OpenAI, Aardvark смог обнаружить 92% известных и синтетических уязвимостей при тестировании на репозиториях, что значительно превышает показатели традиционных статических анализаторов кода.
Новый проект развивает идею автоматизации в сфере кибербезопасности, поднимая вопрос об использовании ИИ не только для анализа данных, но и для активной работы с кодом и разработкой решений. Это противостоит традиционным инструментам, которые требуют участия человека для внесения изменений.
На данный момент Aardvark доступен в закрытой бета-версии, и OpenAI приглашает команды для участия в тестировании, предоставляя возможность отправлять обратную связь. Все операции проходят в защищенной песочнице, что обеспечивает безопасность данных пользователей.
Подводя итог, можно сказать, что OpenAI представила новый шаг в области ИИ для разработки, который активно взаимодействует с кодом, понимает его и самостоятельно находит ошибки без необходимости вмешательства человека. Разработка таких инструментов обещает сделать процесс проверки кода более быстрым и эффективным, потенциально изменяя подход к кибербезопасности в будущем.
