«Stack Overflow для агентов» от разработчика Mozilla бьет по главному слабому месту ИИ в программировании

Mozilla ии-агенты Cq Rag безопасность arstechnica.com

Mozilla представила cq — «Stack Overflow для агентов», систему обмена знаниями. Однако для широкого внедрения предстоит решить серьезные проблемы, связанные с безопасностью и точностью данных. — arstechnica.com

Разработчик Mozilla Питер Уилсон в своем блоге Mozilla.ai анонсировал проект cq, который он описывает как «Stack Overflow для агентов». Этот зарождающийся проект намекает на нечто действительно полезное, но для широкого внедрения ему придется решить проблемы безопасности, отравления данных и точности.

Он призван решить пару проблем. Во-первых, кодирующие агенты часто используют устаревшую информацию при принятии решений, например, пытаются вызывать устаревшие API. Это связано с ограничением даты обучения и отсутствием надежного, структурированного доступа к актуальному контексту времени выполнения. Иногда они используют такие методы, как RAG (Retrieval Augmented Generation), для получения обновленных знаний, но делают это не всегда, когда это необходимо — как говорится, «неизвестные неизвестные» — и даже тогда это никогда не бывает исчерпывающим.

Во-вторых, множеству агентов часто приходится обходить одни и те же барьеры, но после точки отсечения обучения совместное использование знаний отсутствует. В результате сотни или тысячи отдельных агентов постоянно тратят дорогие токены и потребляют энергию на решение уже решенных проблем. В идеале, одну проблему нужно решить один раз, а остальные будут опираться на этот опыт.

Именно это и пытается обеспечить cq. Вот как Уилсон описывает его работу:

Прежде чем агент займется незнакомой работой — интеграцией API, конфигурацией CI/CD, фреймворком, с которым он раньше не сталкивался — он запрашивает общую базу cq. Если другой агент уже узнал, что, например, Stripe возвращает код 200 с телом ошибки для запросов с ограничением скорости, ваш агент знает это, прежде чем написать хоть одну строку кода. Когда ваш агент обнаруживает что-то новое, он предлагает эти знания обратно. Другие агенты подтверждают то, что работает, и помечают то, что устарело. Доверие к знаниям зарабатывается через использование, а не через авторитет.

Идея состоит в том, чтобы выйти за рамки claude.md или agents.md — текущего решения проблем, которые пытается решить cq. В настоящее время разработчики добавляют инструкции для своих агентов методом проб и ошибок: если они обнаруживают, что агент постоянно пытается использовать что-то устаревшее, они указывают ему в файлах .md делать что-то другое.

,

Это иногда работает, но не обеспечивает перекрестного опыления знаниями между проектами.

Текущее состояние

Уилсон описывает cq как proof of concept, но это концепт, который можно скачать и использовать уже сейчас; он доступен в виде плагина для Claude Code и OpenCode. Кроме того, существует MCP-сервер для управления библиотекой знаний, хранящейся локально, API для совместного использования знаний командами и пользовательский интерфейс для проверки человеком.

Я лишь поверхностно затрагиваю детали; документация доступна в репозитории GitHub, если вы хотите узнать больше деталей или внести свой вклад в проект.

Помимо публикации в блоге Mozilla.ai, Уилсон анонсировал проект и запросил отзывы разработчиков на Hacker News. Реакции в ветке неоднозначны. Большинство участников согласны с тем, что cq нацелен на нечто полезное и необходимое, но существует длинный список потенциальных проблем, которые необходимо решить.

Например, некоторые комментаторы отметили, что модели не всегда надежно описывают или отслеживают предпринятые ими шаги — проблема, которая в масштабе множества агентов может привести к накоплению большого количества «мусорных» знаний. Существуют также несколько серьезных проблем безопасности, например, как система будет справляться с угрозами внедрения промптов (prompt injection) или отравления данных.

Это не единственная попытка удовлетворить эти потребности. В разработке находятся различные проекты, работающие на разных уровнях стека, чтобы заставить ИИ-агентов тратить меньше токенов, предоставляя им доступ к более актуальной или проверенной информации.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Похожие новости: