Ant Group и HKUST(GZ) представили Skill-MAS: превращаем “Multi-Agent” оркестрацию в развивающиеся мета-навыки

Llm ии-агенты мультиагентные системы Skill-Mas мета-навыки pandaily.com

Ant Group и HKUST(GZ) представляют Skill-MAS — фреймворк, который преобразует опыт проектирования мультиагентных систем в многократно используемые мета-навыки, проверенные на DeepSeek-V4-Flash и других моделях.

Большие языковые модели выводят ИИ-агентов от одноразового ответа на вопросы к многоролевому сотрудничеству. В сложных задачах, таких как глубокие исследования, математические рассуждения экспертного уровня, многоэтапный ответ на вопросы и использование реальных инструментов, одна модель часто не может самостоятельно справиться с каждым этапом. Идеальный подход — это совместная работа нескольких агентов: одни декомпозируют задачи, другие извлекают информацию, третьи проверяют результаты, а четвертые синтезируют ответы.

Однако главная проблема заключается в том, как автоматически проектировать такие мультиагентные системы. Существующие подходы к автоматическому проектированию мультиагентных систем делятся на два лагеря: оркестровка во время инференса (inference-time orchestration), которая использует замороженные передовые модели для многократного поиска и оптимизации архитектур, но не накапливает опыт; и оркестровка во время обучения (training-time orchestration), которая дообучает меньшие модели для генерации мультиагентных систем, но ограничена мощностью малой модели и с трудом переносится на закрытые передовые модели.

Чтобы решить эту дилемму, Ant Group и дальновосточный Университет науки и технологий (Гуанчжоу) (Hong Kong University of Science and Technology (Guangzhou)) предложили Skill-MAS (Multi-Agent Systems via Evolving Meta*-Skill). Вместо обновления параметров модели Skill-MAS абстрагирует знание о проектировании мультиагентных систем в эволюционируемый текстовый мета-навык. Это позволяет даже замороженным передовым LLM непрерывно накапливать опыт проектирования систем посредством многораундового выполнения, рефлексии и коррекции.

Мета-навык состоит из трех модулей: шаблонов декомпозиции задач для разбиения сложных проблем, стратегий распределения ролей для назначения обязанностей агентам и паттернов топологии рабочего процесса для определения структур коммуникации. Эта структура позволяет системе точно определить, вызваны ли проблемы некорректной декомпозицией задачи, неподходящим назначением ролей или плохим дизайном рабочего процесса.

В каждом цикле эволюции Skill-MAS выполняет многотраекторный прогон (multi-trajectory rollout), многократно запуская одну и ту же задачу под руководством текущего мета-навыка и записывая каждую сгенерированную архитектуру, промежуточный процесс и итоговый балл. Система использует метрики неопределенности и сложности для различения случайного шума выполнения от структурных недостатков проектирования.

Экспериментальные результаты на четырех сложных бенчмарках показали значительные улучшения. Фреймворк был протестирован на DeepResearchBench, Humanity’s Last Exam-Math, BrowseComp-Plus и VitaBench с использованием таких моделей, как Gemini 3.1 Flash, GPT 5.4 Nano, Qwen 3.5 Plus и DeepSeek-V4-Flash. Оптимизированная версия Skill-MAS превзошла базовые модели в большинстве сценариев, достигнув наивысшей средней производительности среди всех четырех моделей. Ключевое преимущество заключается в том, что после эволюции мета-навыка генерация мультиагентной системы во время тестирования является одноэтапным процессом без поиска для каждой задачи, что обеспечивает лучший баланс производительности и стоимости, чем методы оркестровки во время инференса и обучения.

Facebook*, Instagram* и WhatsApp* принадлежат компании Meta* Platforms Inc., деятельность которой признана экстремистской и запрещена на территории Российской Федерации.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Похожие новости: