На прошлой неделе компания Anthropic объявила об ограничении первоначального выпуска своей модели Mythos Preview для «ограниченной группы ключевых отраслевых партнеров», предоставив им время для подготовки к работе с моделью, которая, по заявлению компании, «поразительно способна в задачах компьютерной безопасности». Теперь Институт безопасности ИИ (AISI) правительства Великобритании опубликовал первоначальную оценку возможностей модели по кибератакам, которая добавляет независимую публичную проверку отчетам Anthropic.
Выводы AISI показывают, что Mythos не сильно отличается от других недавних передовых моделей в тестах на выполнение отдельных задач, связанных с кибербезопасностью. Однако Mythos может выделиться на фоне предыдущих моделей благодаря своей способности эффективно связывать эти задачи в многоэтапную серию атак, необходимых для полного проникновения в некоторые системы.
«Последние» наконец сдаются
AISI подвергает различные модели ИИ специально разработанным испытаниям Capture the Flag (CTF) с начала 2023 года, когда GPT-3.5 Turbo с трудом справлялась с выполнением любых относительно простых задач уровня «Ученик» (Apprentice) этой группы. С тех пор производительность последующих моделей неуклонно росла, достигнув того, что Mythos Preview может выполнять более 85 процентов тех же задач CTF уровня «Ученик».
Хотя это технически является рекордом для тестов CTF от AISI, недавние конкурирующие модели, такие как GPT-5.4 и собственные Opus 4.6 и Codex 5.3 от Anthropic, в последние месяцы демонстрировали сопоставимые результаты (с погрешностью точности от 5 до 10 процентов) на различных уровнях сложности CTF. Это не похоже на такой уровень улучшения, который потребовал бы протекционистского ограниченного выпуска, который Anthropic предприняла для Mythos Preview.
Однако там, где Mythos продемонстрировала больший относительный потенциал кибератаки, так это в «The Last Ones» (TLO) — тестовом полигоне, созданном AISI для имитации 32-этапной атаки по извлечению данных на корпоративную сеть. Тест, который требует «связывания десятков шагов по множеству хостов и сегментов сети», был разработан для имитации устойчивых операций, на выполнение которых обученному человеку потребовалось бы около 20 часов, по оценкам AISI.
,
Здесь Mythos превзошла все предыдущие модели, став «первой моделью, решившей TLO от начала до конца», — заявили в AISI. Хотя новая модель Anthropic добилась успеха только в 3 из 10 попыток, даже средний запуск Mythos Preview прошел 22 из 32 необходимых шагов проникновения, что значительно выше среднего показателя в 16 шагов, достигнутого Claude 4.6.
Тем не менее, у Mythos Preview все еще есть свои ограничения. AISI отмечает, что модель по-прежнему испытывает трудности с «Cooling Tower» — еще более сложным семиэтапным тестом, предназначенным для имитации попытки нарушения управляющего программного обеспечения электростанции. Но AISI также пишет, что ожидает, что «наши оценки продолжат улучшаться с увеличением вычислительных ресурсов для инференса» сверх бюджета в 100 миллионов токенов, установленного для их тестов.
Остерегайтесь небольших, слабо защищенных систем
В целом, производительность Mythos на TLO предполагает, что модель «как минимум способна автономно атаковать небольшие, слабо защищенные и уязвимые корпоративные системы, в которых получен доступ к сети», — пишет AISI. При этом группа предупреждает, что их симулированные киберполигоны лишены активных защитников и инструментов защиты, которые часто присутствуют в критически важных реальных системах. Тест TLO от AISI также разработан с учетом специфических уязвимостей, которые могут отсутствовать в реальных системах, и не наказывает модели за обнаружение, которое могло бы привести к сбою реальной попытки проникновения.
По этим причинам AISI заявляет, что не может быть уверена, падут ли «хорошо защищенные системы» перед автоматизированной атакой с использованием Mythos Preview. Но по мере того, как будущие модели будут соответствовать или превосходить возможности Mythos, AISI предупреждает, что те, кто разрабатывает системную защиту, должны аналогичным образом использовать модели ИИ для укрепления своей обороны.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Kyle Orland




