GPT-5.5 на уровне распиаренного Mythos Preview в новых тестах кибербезопасности

Kyle Orland

01.05.2026

ии кибербезопасность Openai Anthropic Gpt-5.5 Mythos arstechnica.com

Новые результаты показывают, что киберугроза Mythos не является «прорывом, специфичным для одной модели». GPT-5.5 от OpenAI сравнима с Mythos Preview в тестах AISI. — arstechnica.com

В прошлом месяце компания Anthropic громко заявила о якобы чрезмерной угрозе кибербезопасности, исходящей от их модели Mythos Preview, что побудило компанию ограничить первоначальный выпуск «критически важными отраслевыми партнерами». Однако новое исследование Института безопасности ИИ Великобритании (AISI) предполагает, что GPT-5.5 от OpenAI, выпущенная на прошлой неделе, достигла «схожего уровня производительности в наших кибер-оценках», что и Mythos Preview, которую группа оценивала в прошлом месяце.

С 2023 года AISI подвергала различные передовые модели ИИ 95 различным испытаниям Capture the Flag (CTF), разработанным для проверки возможностей в задачах кибербезопасности, таких как обратная разработка, веб-эксплуатация и криптография. В задачах самого высокого уровня «Эксперт» GPT-5.5 прошла в среднем 71,4 процента, что немного выше, чем 68,6 процента, достигнутых Mythos Preview (хотя и в пределах погрешности). В одной особенно сложной задаче, связанной с созданием дизассемблера для декодирования бинарного файла на Rust, AISI отмечает, что «GPT-5.5 решила задачу за 10 минут и 22 секунды без посторонней помощи при стоимости в 1,73 доллара» за вызовы API.

GPT-5.5 также сравнялась с Mythos Preview по прогрессу в «The Last Ones» (TLO), тестовом полигоне AISI, созданном для симуляции 32-шагового сценария извлечения данных из корпоративной сети. GPT-5.5 преуспела в 3 из 10 попыток на TLO по сравнению с 2 из 10 у Mythos Preview — ни одна предыдущая модель ранее не добивалась успеха в этом тесте даже один раз. Однако GPT-5.5 по-прежнему не справляется с более сложной симуляцией AISI «Cooling Tower», имитирующей попытку нарушения работы управляющего программного обеспечения электростанции, как и все ранее протестированные модели ИИ.

Это просто «маркетинг, основанный на страхе»?

Новые результаты для GPT-5.5 предполагают, что, когда речь идет о риске кибербезопасности, Mythos Preview, вероятно, не была «прорывом, специфичным для одной модели», а скорее «побочным продуктом более общих улучшений в долгосрочной автономии, рассуждении и кодировании», пишет AISI.

В недавнем интервью подкасту Core Memory генеральный директор OpenAI Сэм Альтман раскритиковал то, что он называет «маркетингом, основанным на страхе», при продвижении ограниченных выпусков определенных моделей ИИ. Хотя он сказал, что «уверен, что Mythos — отличная модель для кибербезопасности», он добавил, что «это, безусловно, невероятный маркетинг — заявить: „Мы создали бомбу. Мы собираемся сбросить ее вам на голову. Мы продадим вам бомбоубежище за 100 миллионов долларов“».

«Будет гораздо больше риторики о моделях, которые слишком опасны для выпуска», — продолжил Альтман. «Будут и по-настоящему опасные модели, которые придется выпускать по-разному».

В феврале OpenAI запустила пилотную программу Trusted Access for Cyber, позволив исследователям безопасности и предприятиям подтвердить свою личность и зарегистрировать свой интерес к изучению передовых моделей OpenAI для «законной защитной работы». В прошлом месяце OpenAI сообщила, что использует этот список доверенного доступа для контроля ограниченного запуска GPT-5.4-Cyber — варианта модели, который, по их словам, «специально доработан для дополнительных кибервозможностей и с меньшими ограничениями по возможностям».

В четверг генеральный директор OpenAI Сэм Альтман сообщил в социальных сетях, что первоначальный выпуск GPT-5.5-Cyber будет аналогичным образом ограничен «критически важными защитниками киберпространства в ближайшие дни».

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Автор – Kyle Orland

Оригинал статьи