Искусственный интеллект (ИИ) становится все более распространенным и мощным, однако консенсуса и стандартов его поведения нет, заявляют ученые.
Об этом сообщает Лаборатория информатики и искусственного интеллекта Массачусетского технологического института (CSAIL), проанализировавшая 30 ИИ-агентов для своего Индекса ИИ-агентов 2025 года. Индекс оценивает модели машинного обучения, которые могут действовать в сети благодаря доступу к программным сервисам.
ИИ-агенты могут принимать форму чат-приложений с инструментами (Manus AI, ChatGPT Agent, Claude Code), браузерных агентов (Perplexity Comet, ChatGPT Atlas, ByteDance Agent TARS) или корпоративных агентов рабочих процессов (Microsoft Copilot Studio, ServiceNow Agent).
В сопровождающей Индекс ИИ-агентов статье отмечается, что, несмотря на растущий интерес и инвестиции в ИИ-агентов, «ключевые аспекты их реальной разработки и внедрения остаются непрозрачными, и исследователям или политикам предоставляется мало информации».
Ажиотаж в сообществе ИИ вокруг платформы для агентов с открытым исходным кодом OpenClaw и связанной с ней сети взаимодействия агентов Moltbook, а также продолжающееся разочарование по поводу предложений кода, сгенерированного ИИ, для проектов с открытым исходным кодом – подчеркивают последствия выпуска агентов без правил поведения.
В статье авторы отмечают, что склонность ИИ-агентов игнорировать Протокол исключения роботов, использующий файлы robots.txt для обозначения отсутствия согласия на сбор данных с веб-сайтов, предполагает, что установленные веб-протоколы могут больше не быть эффективными для остановки агентов.
Это своевременная тема. Anthropic, один из основных поставщиков ИИ-агентов, в среду опубликовал свой анализ автономии ИИ-агентов, сосредоточенный скорее на использовании агентов, чем на последствиях их применения.
«ИИ-агенты уже здесь, и они развертываются в самых разных контекстах, от сортировки электронной почты до кибершпионажа», — заявили в компании. «Понимание этого спектра имеет решающее значение для безопасного развертывания ИИ, однако мы удивительно мало знаем о том, как люди на самом деле используют агентов в реальном мире».
По данным консалтинговой компании McKinsey, к 2030 году ИИ-агенты могут принести экономике США 2,9 триллиона долларов, при условии, что огромные капитальные затраты OpenAI и других технологических компаний не остановят «поезд ажиотажа». Отметим, что предприятия пока не видятзначительнойотдачи от своих инвестиций в ИИ. А исследователи в прошлом году обнаружили, что ИИ-агенты могут выполнять лишь около трети многоэтапных офисных задач. Однако с тех пор модели ИИ улучшились.
Индекс ИИ-агентов MIT CSAIL 2025 года охватывает 30 ИИ-агентов. Это меньше, чем его предшественник 2024 года, который рассматривал 67 систем, основанных на агентах. Авторы утверждают, что издание 2025 года идет глубже, анализируя агентов по шести категориям: юридические аспекты, технические возможности, автономия и контроль, взаимодействие с экосистемой, оценка и безопасность. Сайт Индекса ИИ-агентов предоставляет эту информацию по каждому указанному агенту, с 45 полями аннотаций.
По данным исследователей, 24 из 30 изученных агентов были выпущены или получили крупные обновления функций в период 2024-2025 годов. Однако разработчики агентов больше говорят о функциях продукта, чем о мерах безопасности.
«Из 13 агентов, демонстрирующих передовой уровень автономии, только четыре раскрывают какие-либо оценки безопасности агентов (ChatGPT Agent, OpenAI Codex, Claude Code, Gemini 2.5 Computer Use)», — согласно исследователям.
Разработчики 25 из 30 рассматриваемых агентов не предоставляют никаких сведений о тестировании безопасности, а 23 — никаких данных сторонних тестов.
Усугубляет ситуацию тот факт, что большинство агентов полагаются на несколько базовых моделей – большинство из них являются оболочками или обертками для моделей, созданных Anthropic, Google и OpenAI, поддерживаемых каркасами и уровнями оркестрации.
Результатом является серия зависимостей, которые трудно оценить, поскольку ни одна организация не несет ответственности, как утверждают специалисты MIT.
13 агентов, оцененных авторами, были созданы компаниями, зарегистрированными в Делавэре. Пять — организациями, зарегистрированными в Китае, а четыре — имеют происхождение вне США и Китая: в частности, Германия (SAP, n8n), Норвегия (Opera) и Каймановы острова (Manus).
Среди пяти китайских производителей агентов у одного есть опубликованная система безопасности, а у одного – стандарт соответствия.
Для агентов, происходящих за пределами Китая, 15 ссылаются на системы безопасности, такие как Responsible Scaling Policy от Anthropic, Preparedness Framework от OpenAI или Responsible AI Standard от Microsoft. Остальные десять не имеют документации по системе безопасности. Корпоративные стандарты обеспечения соответствия встречаются чаще: только у пяти из 30 агентов отсутствуют документированные стандарты соответствия.
23 оцененных агента являются закрытыми. Разработчики семи агентов опубликовали свои фреймворки или оболочки агентов с открытым исходным кодом: Alibaba MobileAgent, Browser Use, ByteDance Agent TARS, Google Gemini CLI, n8n Agents, OpenAI Codex и WRITER.
В целом, Индекс показал, что производители агентов раскрывают слишком мало информации о безопасности, а рынок доминирует горстка компаний. Другие основные выводы включают сложность анализа агентов из-за их многоуровневых зависимостей и тот факт, что агенты не всегда приветствуются на каждом веб-сайте.
В статье перечислены следующие авторы: Леон Штауфер (Кембриджский университет), Кевин Фэн (Университет Вашингтона), Кевин Вэй (Гарвардская юридическая школа), Люк Бейли (Стэнфордский университет), Явэнь Дуань (Concordia AI), Мик Янг (Пенсильванский университет), А. Пинар Озисик (MIT), Стивен Каспер (MIT) и Ноам Кольт (Еврейский университет в Иерусалиме). ®
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Thomas Claburn




