Российские ученые представят решение MAPF-GPT для многоагентного планирования на ежегодной конференции по искусственному интеллекту AAAI 2025. Система, созданная специалистами Института AIRI, ФИЦ ИУ РАН и МФТИ, использует новый подход к координации действий множества роботов или программных агентов.

Многоагентное планирование играет критическую роль в автоматизированных логистических системах и умных складах, где десятки и сотни роботов должны одновременно перемещаться в одном пространстве без столкновений. В то время как традиционные решения используют статические графы с заранее рассчитанными маршрутами, предложенная система способна принимать решения в режиме реального времени, адаптируясь к меняющимся условиям.

Архитектура MAPF-GPT основана на модели трансформера, которая анализирует наблюдения и строит оптимальные решения на их основе. Механизм внимания позволяет системе выделять критически важную информацию и учитывать действия других агентов, что существенно повышает точность принимаемых решений. Система обрабатывает входные данные в виде последовательностей фиксированного размера — 256 токенов, кодируя информацию о среде и действиях всех участников.

Особую ценность разработка представляет для динамичных сценариев, где условия могут меняться непредсказуемо. Например, она успеет среагировать на появление человека в рабочей зоне роботов или на изменение конфигурации склада. MAPF-GPT прогнозирует последствия принимаемых решений и корректирует действия роботов на лету, чтобы обеспечить безопасность и эффективность работы.

В ходе работы исследователи создали крупнейший датасет для мультиагентного принятия решений, содержащий миллиард пар «наблюдение-действие». Этот датасет размещен в открытом доступе, что позволит другим исследователям воспроизводить результаты или совершенствовать модель. Антон Андрейчук, научный сотрудник группы «RL агенты» лаборатории «Когнитивные системы ИИ» Института AIRI, заявил: “Мы уверены, что MAPF-GPT поможет сообществу в развитии методов многоагентного планирования.”

Будущие версии MAPF-GPT можно будет применять в задачах многоагентного обучения с подкреплением, где агенты обучаются в аналогичной среде, основанной на популярной игре StarCraft II. Эти возможности открывают путь для более умного и безопасного взаимодействия между независимыми агентами. Ранее «Евраз НТМК» также внедрил автономные электрогрузовики для перевозки материалов, что подчеркивает растущий интерес к автоматизации в логистике.

От Дмитрий Соколов

Гик-писака🤓