Китайская ИИ-команда MopMonk ворвалась в топ-7 мирового рейтинга бенчмарка безопасности CyberGym

Pandaily

30.06.2026

Загадочная китайская команда ИИ «MopMonk» ворвалась в топ-7 мирового рейтинга кибербезопасности CyberGym с результатом 73,1%, бросив вызов лидерам вроде OpenAI.

Загадочная китайская команда ИИ, действующая под кодовым названием «MopMonk», ворвалась в мировую семерку лидеров по результатам эталонного теста CyberGym в области кибербезопасности, продемонстрировав 73,1% успешности. Это ставит их в непосредственную близость к передовым моделям OpenAI. Это достижение вызвало настоящий шок в сообществе специалистов по безопасности ИИ, поскольку команда появилась из полной неизвестности, не имея никакого предыдущего опыта.

CyberGym, разработанный Калифорнийским университетом в Беркли и отобранный для ICLR 2026, широко признан самым строгим публичным бенчмарком для оценки возможностей ИИ в сфере кибербезопасности. Он включает 1507 реальных примеров уязвимостей, взятых из 188 проектов с открытым исходным кодом из базы данных OSS-Fuzz от Google, что делает его в 7,5 раз больше, чем предыдущий крупнейший публичный эталон. В отличие от традиционных тестов, проверяющих воспроизведение знаний, CyberGym требует от агентов ИИ глубокого анализа кода в кодовых базах, содержащих тысячи файлов и миллионы строк кода, с последующей генерацией рабочих эксплойтов, доказывающих наличие уязвимости, которые срабатывают в незакрытых версиях, но остаются неактивными в пропатченных.

Достижение MopMonk примечательно не только своим рейтингом, но и полной анонимностью команды. Работая без веб-сайта, присутствия в социальных сетях или какой-либо публичной истории, команда опубликовала лишь один технический отчет, описывающий их подход. Само кодовое название отсылает к архетипу «подметающего монаха» в классической литературе уся — неприметной фигуре, скрывающей глубокое боевое мастерство, — что отражает сознательное избегание командой публичности, несмотря на мировое техническое достижение.

Ключевым фактором успеха MopMonk является использование базовой модели MiniMax M3. Эта модель с открытым исходным кодом, разработанная в Шанхае, предоставляет три ключевые возможности: передовые навыки кодирования, контекстные окна объемом 1 миллион токенов и нативную мультимодальную обработку. Запатентованная технология Harness команды обеспечивает точное управление памятью уязвимостей в сложных путях кода, что оказалось решающим отличием от конкурентов, таких как OpenAI и Anthropic.

Появление MopMonk сигнализирует о более широком сдвиге в конкуренции в сфере ИИ: от сырых параметров моделей к практическим агентным возможностям — способности выполнять сложные многоэтапные задачи в реальных условиях. Это также подчеркивает быстро созревающую экосистему кибербезопасности ИИ в Китае, где анонимные команды теперь могут конкурировать с самыми крупными и хорошо финансируемыми лабораториями ИИ в мире и достигать результатов, которые еще несколько месяцев назад казались немыслимыми.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Автор – Pandaily

Оригинал статьи

В тренде:

cybergym, mopmonk, pandaily.com, бенчмарк, ИИ, кибербезопасность, Китай

Искать на сайте

Китайская ИИ-команда MopMonk ворвалась в топ-7 мирового рейтинга бенчмарка безопасности CyberGym

В тренде:

Похожие новости:

Китайская ИИ-команда MopMonk ворвалась в топ-7 мирового рейтинга бенчмарка безопасности CyberGym

В тренде:

Похожие новости:

Криптобиржа OKX планирует дать AI-агентам возможность нанимать друг друга и

Успешный статический огневой тест Zhuque-3 от LandSpace: коммерческая космонавтика набирает

Google продвигает Spanner как единую базу данных для всех ИИ-агентов

Триллионная оценка Zhipu AI заставляет рынок переосмыслить потенциал MiniMax