Загадочная китайская команда ИИ, действующая под кодовым названием «MopMonk», ворвалась в мировую семерку лидеров по результатам эталонного теста CyberGym в области кибербезопасности, продемонстрировав 73,1% успешности. Это ставит их в непосредственную близость к передовым моделям OpenAI. Это достижение вызвало настоящий шок в сообществе специалистов по безопасности ИИ, поскольку команда появилась из полной неизвестности, не имея никакого предыдущего опыта.
CyberGym, разработанный Калифорнийским университетом в Беркли и отобранный для ICLR 2026, широко признан самым строгим публичным бенчмарком для оценки возможностей ИИ в сфере кибербезопасности. Он включает 1507 реальных примеров уязвимостей, взятых из 188 проектов с открытым исходным кодом из базы данных OSS-Fuzz от Google, что делает его в 7,5 раз больше, чем предыдущий крупнейший публичный эталон. В отличие от традиционных тестов, проверяющих воспроизведение знаний, CyberGym требует от агентов ИИ глубокого анализа кода в кодовых базах, содержащих тысячи файлов и миллионы строк кода, с последующей генерацией рабочих эксплойтов, доказывающих наличие уязвимости, которые срабатывают в незакрытых версиях, но остаются неактивными в пропатченных.
Достижение MopMonk примечательно не только своим рейтингом, но и полной анонимностью команды. Работая без веб-сайта, присутствия в социальных сетях или какой-либо публичной истории, команда опубликовала лишь один технический отчет, описывающий их подход. Само кодовое название отсылает к архетипу «подметающего монаха» в классической литературе уся — неприметной фигуре, скрывающей глубокое боевое мастерство, — что отражает сознательное избегание командой публичности, несмотря на мировое техническое достижение.
Ключевым фактором успеха MopMonk является использование базовой модели MiniMax M3. Эта модель с открытым исходным кодом, разработанная в Шанхае, предоставляет три ключевые возможности: передовые навыки кодирования, контекстные окна объемом 1 миллион токенов и нативную мультимодальную обработку. Запатентованная технология Harness команды обеспечивает точное управление памятью уязвимостей в сложных путях кода, что оказалось решающим отличием от конкурентов, таких как OpenAI и Anthropic.
Появление MopMonk сигнализирует о более широком сдвиге в конкуренции в сфере ИИ: от сырых параметров моделей к практическим агентным возможностям — способности выполнять сложные многоэтапные задачи в реальных условиях. Это также подчеркивает быстро созревающую экосистему кибербезопасности ИИ в Китае, где анонимные команды теперь могут конкурировать с самыми крупными и хорошо финансируемыми лабораториями ИИ в мире и достигать результатов, которые еще несколько месяцев назад казались немыслимыми.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Pandaily




