Самая опасная модель Anthropic была взломана в первый же день, и она до сих пор не выйдет в публичный доступ

Tom Kong

17.05.2026

Claude Mythos ии кибербезопасность уязвимости Anthropic Exploitbench techtimes.com

Циркулирует онлайн-утверждение, что самая мощная и «слишком опасная для выпуска» модель ИИ от Anthropic — под кодовым названием Claude Mythos — тайно появилась в консоли Google Cloud без метки «Preview», якобы повторяя точную схему развертывания, которая предшествовала публичному запуску. — techtimes.com

25 апреля исследователи из калифорнийской фирмы безопасности Calif обнаружили пару уязвимостей в macOS. К 1 мая, всего через шесть дней, у них уже был рабочий эксплойт ядра, обходящий аппаратную защиту Apple по обеспечению целостности памяти (Memory Integrity Enforcement), на создание которой компания потратила пять лет и миллиарды долларов для своего чипа M5. Инструментом, который помог им в этом, стала Claude Mythos Preview — передовая модель ИИ от Anthropic. Команда лично сообщила об обнаружении Apple в Купертино и 14 мая опубликовала пост в блоге, который прозвучал как глубинный заряд в сообществе безопасности.

Apple еще не выпустила исправление.

Вот что действительно важно. Не слухи, циркулирующие в социальных сетях и некоторых частях ИИ-прессы, о том, что Mythos вот-вот будет выпущен для широкой публики. Anthropic прямо заявила — в своей системной карте, на странице Проекта Glasswing и в неоднократных публичных заявлениях — что Claude Mythos Preview не будет предоставлена в общем доступе. Рынки предсказаний оценивают вероятность публичного релиза к 30 июня примерно в 7%. Нарратив о том, что «метка „Preview“ удалена, публичный запуск неминуем», не подтверждается никакими достоверными сообщениями и прямо противоречится компанией, создавшей модель.

Фактическая версия этой истории, если на что-то и указывает, то она более тревожная, чем приукрашенная.

Что Mythos может делать на самом деле: цифры ExploitBench реальны

Claude Mythos Preview — это реальная, не выпущенная передовая модель. Anthropic анонсировала ее 7 апреля вместе с Проектом Glasswing — инициативой, предоставляющей доступ двенадцати крупным партнерам по запуску — включая Amazon Web Services, Apple, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation и Microsoft — и более чем 40 дополнительным проверенным организациям, и все это исключительно для целей оборонительной кибербезопасности.

Бенчмарк, вызвавший большинство освещения, также реален и прошел рецензирование. ExploitBench — статья на arXiv под номером 2605.14153, написанная исследователем безопасности Сынхёном Ли и ученым-компьютерщиком Дэвидом Брамли — тестирует девять передовых моделей ИИ на 41 реальной, ранее использовавшейся уязвимости в V8, движке JavaScript, используемом в Chrome, Edge, Node.js и Cloudflare Workers. Оценки подтверждают широко циркулирующие цифры: Mythos Preview, при периодическом руководстве исследователей, в среднем набрала 9,90 из возможных 16 баллов и достигла высшего уровня — полного произвольного выполнения кода — по 21 из 41 протестированной уязвимости. GPT-5.5 от OpenAI, показавшая второй лучший результат, достигла того же уровня всего по двум. В полностью автономном режиме разрыв увеличился: Mythos набрала 9,55 балла, GPT-5.5 — 4,30. Авторы бенчмарка и статьи, опубликованной на этой неделе, также подтвердили, что запуск сессии Mythos стоит примерно в двенадцать раз дороже, чем эквивалентный запуск GPT-5.5, — существенная асимметрия, которая редко фигурирует в более громких пересказах.

Значимость этих цифр заключается в дизайне ExploitBench. Большинство предыдущих кибер-бенчмарков сводят процесс эксплуатации к бинарному результату: сбила ли модель цель? ExploitBench вместо этого отображает 16 измеримых флагов по пяти уровням — от простого доступа к уязвимому коду до получения полного произвольного контроля над работающей системой. Каждый флаг проверяется детерминированным оракулом с использованием рандомизированных проверок «запрос-ответ», что устраняет цикличность, присущую оценкам LLM-как-судьи.

Ключевой вывод не в том, что одна модель превосходит другую. Он в том, что общедоступные передовые модели регулярно выводят цели из строя, но почти ни одна из них не может достичь надежного выполнения кода против защищенной системы. Mythos может. Почти идентичные результаты в режимах с помощью человека и полностью автономном режиме — это по-настоящему тревожный показатель: в данном классе задач модели едва требуется участие человека для достижения того же результата.

Соавтор ExploitBench Сынхён Ли, лично сообщивший о более чем 20 уязвимостях браузеров, проанализировал стенограммы сессий Mythos индивидуально. Его оценка: модель работает как «довольно компетентный исследователь безопасности движков браузера/JS». В одном случае Mythos разработала технику эксплойта, которую Ли и его коллега ранее отвергли как слишком сложную для реализации. Две оговорки, которые не отражают заголовки: протестированные уязвимости общеизвестны, а значит, нельзя исключать загрязнение обучающих данных, и ExploitBench специально не измеряет способность обнаруживать новые уязвимости или полностью превращать эксплойт в оружие для реальной атаки.

Неавторизованные пользователи получили доступ к Mythos через учетные данные подрядчика в день запуска

За три недели до раскрытия информации о macOS от Calif, системы контроля доступа Anthropic были скомпрометированы в первый же день их работы. В тот же день, когда компания анонсировала Проект Glasswing — 7 апреля — частная группа в Discord получила несанкционированный доступ к Mythos Preview через среду стороннего поставщика.

По данным Bloomberg, группа объединила учетные данные, полученные через стороннего подрядчика, который оценивает модели Anthropic, с информацией об утечке данных в Mercor, стартапе по найму ИИ-специалистов. Они использовали свои знания о формате URL-адресов идентификаторов моделей Anthropic, чтобы угадать конечную точку Mythos. Anthropic подтвердила, что проводит расследование: «Мы расследуем сообщение о несанкционированном доступе к Claude Mythos Preview через одну из наших сред сторонних поставщиков». Компания заявила, что не обнаружила никаких свидетельств активности за пределами среды поставщика.

Группа — публично не идентифицированная — сообщила Bloomberg, что заинтересована в изучении модели, а не в причинении вреда. Сообщалось, что использование не было связано с кибербезопасностью. Но инцидент выявляет центральное противоречие в предпосылках Glasswing: оборонительное окно, которое призвана создать программа, зависит от того, что доступ остается ограниченным для проверенных партнеров. В день запуска это ограничение было обойдено в самом слабом звене цепочки поставок — учетные данные подрядчика и угаданный URL-адрес, а не в результате действий самой модели. Генеральный директор Acalvio Technologies Рам Варадараджан заявил SiliconAngle, что инцидент «не потребовал сложной атаки — ему потребовались только подрядчик, шаблон URL-адреса и догадка в первый же день».

Где рассыпается нарратив «скоро будет выпущен»

Утверждение, вызывающее наибольший резонанс — что Anthropic тайно готовится выпустить Mythos для широкой публики — основано на специфической интерпретации изменений в консоли Google Cloud Vertex AI, которые якобы повторяют схему развертывания, предшествовавшую выходу Claude Opus 4.7.

Эта интерпретация прямо противоречит формулировкам самой Anthropic. На странице Проекта Glasswing указано: «Мы не планируем делать Claude Mythos Preview общедоступной, но наша конечная цель — дать нашим пользователям возможность безопасно развертывать модели класса Mythos в масштабе». В системной карте модели прямо говорится, что ее «значительный рост возможностей заставил нас решить не делать ее общедоступной». Стандартные API-аккаунты не могут видеть или получать доступ к идентификатору модели. Утвержденные партнеры Glasswing получают к ней доступ через Claude API, Amazon Bedrock, Google Cloud Vertex AI и Microsoft Foundry — но только после проверки.

Вероятность публичного релиза к 30 июня, составляющая 7% на Polymarket, отражает трейдеров, которые поставили реальные деньги на этот вопрос. Наблюдение за консолью Google Cloud смешивает маркировку инфраструктуры с решением о коммерческом выпуске. Никакие достоверные сообщения от Bloomberg, The Wall Street Journal, TechCrunch или CNBC не подтверждают версию о неминуемом выпуске.

Хейди Хлааф, ложные срабатывания и проблема «человек в цикле»

Не все исследователи принимают заявления Anthropic на веру. Хейди Хлааф, главный научный сотрудник по ИИ в AI Now Institute — которая руководила аудитами безопасности в различных отраслях, от БПЛА до атомных электростанций, и помогала создавать методологию оценки уязвимостей в OpenAI — предостерегала от того, чтобы принимать заявления компании за проверенный факт. Как задокументировал Гэри Маркус, Хлааф указала на отсутствие сравнительных бенчмарков, непрозрачные условия тестирования и неоднозначное участие человека в первоначальных раскрытиях информации Anthropic о кибербезопасности.

Ее практическое возражение касается оборонительного аргумента в пользу Glasswing: Palo Alto Networks, партнер по запуску Glasswing, обнаружила уровень ложных срабатываний около 30% при развертывании как Mythos, так и GPT-5.5 в своих продуктах безопасности — это означает, что примерно одна из трех отмеченных уязвимостей на самом деле не могла быть использована. Этот показатель снизился по мере того, как компания настраивала модель под свою конкретную среду, но это подчеркивает основную озабоченность Хлааф. Модель, которая выдает сотни результатов, требующих дней экспертной сортировки, может перегрузить защитников, которым она призвана помогать, сводя на нет преимущество в пропускной способности еще до его появления.

XBOW, стартап по тестированию на проникновение на базе ИИ, участвовавший в тестировании Glasswing, счел Mythos «чрезвычайно мощным для аудита исходного кода», но «менее мощным для проверки эксплойтов» и в некоторых случаях «слишком буквальным и консервативным», преувеличивая практическую серьезность находок. Ян ЛеКун, главный научный сотрудник Meta* по ИИ, назвал заявления о Mythos «чушью от самообмана». Институт кибербезопасности Великобритании (UK AI Security Institute) счел Mythos самой способной моделью из протестированных для задач кибербезопасности, но отметил, что их оценки проводились в контролируемых средах без активных защитников или оборонительных инструментов — это существенное ограничение на то, насколько прямо эти оценки применимы к реальной защите.

С другой стороны, компании, использующие модель, уже сообщают о конкретных результатах. Palo Alto Networks обнаружила 75 уязвимостей с помощью Mythos и GPT-5.5 в тестовые периоды, когда обычно выявляла от пяти до десяти в месяц. Отчет CrowdStrike Global Threat Report 2026 задокументировал рост числа атак, управляемых ИИ, на 89% по сравнению с предыдущим годом — этот показатель технический директор Элиа Зайцев использовал для аргументации, что у индустрии нет выбора, кроме как принять защиту, основанную на ИИ: «Если вы хотите развернуть ИИ, вам нужна безопасность».

Поле битвы с правительством: федеральный запрет, иск и вмешательство Конгресса

Проект Glasswing стартовал в самый юридически сложный период в истории Anthropic.

27 февраля 2026 года президент Трамп распорядился всем федеральным агентствам прекратить использование технологий Anthropic. Министр обороны Пит Хегсет одновременно присвоил компании статус «риска для цепочки поставок» — впервые этот статус был применен к американской компании. Суть спора: Anthropic отказалась снять договорные ограничения, запрещающие Пентагону использовать Claude для полностью автономного оружия и массовой внутренней слежки за американцами. 9 марта 2026 года Anthropic подала два федеральных иска, утверждая, что это присвоение статуса было незаконным и нарушало ее права.

26 марта федеральный судья Рита Лин из Северного округа Калифорнии предоставила предварительный судебный запрет, временно блокирующий запрет, постановив, что присвоение статуса риска для цепочки поставок «вероятно, противоречит закону, а также является произвольным и капризным» и что ничто в законодательстве не поддерживает «орвелловское представление о том, что американская компания может быть заклеймена как потенциальный противник и саботажник США за выражение несогласия с правительством».

Впоследствии Белый дом встретился с генеральным директором Дарио Амодеи и начал разрабатывать руководство, которое может позволить агентствам обойти это присвоение и получить доступ конкретно к Mythos — сигнал о том, что возможности модели изменили политический расчет, даже несмотря на продолжающуюся юридическую борьбу.

Конгресс движется параллельным курсом. Комитет Палаты представителей по внутренней безопасности провел закрытый брифинг о киберрисках Mythos и готовит публичные слушания. Брифинг, о котором сообщила CyberScoop, состоялся на следующий день после того, как OpenAI анонсировала собственную инициативу по кибербезопасности, при этом комитет сосредоточился на угрозах со стороны китайского государства, использующих возможности ИИ. Помощник министра энергетики Кэтрин Саттон на этой неделе заявила на конференции, что Mythos представляет «огромную возможность» для создания безопасного кода — правительственная позиция, которая прямо противоречит юридической кампании администрации против компании, создавшей ее.

Реальный риск: диффузия, а не дата выпуска

Структурная проблема, которую не может решить ни одно отдельное событие раскрытия информации, — это та, которую сама Anthropic называет в анонсе Glasswing: «Работа по защите мировой кибернетической инфраструктуры может занять годы; возможности передовых ИИ, вероятно, существенно возрастут всего за несколько следующих месяцев».

По данным отраслевого отчета по безопасности за 2025 год, более 45% обнаруженных уязвимостей в крупных организациях остаются без исправлений спустя 12 месяцев. Многие операторы критической инфраструктуры по-прежнему используют устаревшее программное обеспечение, которое не поддерживается ни одним поставщиком. Это та группа, которая наиболее уязвима, если наступательные возможности ИИ распространятся за пределы более чем пятидесяти проверенных организаций Glasswing — будь то через выпуск конкурирующей лабораторией без ограничений Anthropic, через модели с открытым весом, которые уже подвергаются цензуре в течение нескольких дней после выпуска, или через такой тип взлома учетных данных подрядчика, который поставил Mythos в неавторизованные руки в первый же день.

Собственный аргумент Anthropic, явно изложенный в анонсе Glasswing, заключается в том, что сопоставимая возможность не останется дефицитной. Оборонительное окно, создаваемое Проектом Glasswing, зависит от того, будет ли это окно использовано. Читатель, которому нужно отреагировать на эту историю, — это не тот, кто ждет даты публичного выпуска. Это сотрудник службы безопасности, в бэклоге исправлений которого уже есть уязвимости, которые модель класса Mythos может превратить в рабочий эксплойт, — и который, возможно, работает с меньшим запасом времени, чем предполагают заголовки этой недели.

Facebook*, Instagram* и WhatsApp* принадлежат компании Meta* Platforms Inc., деятельность которой признана экстремистской и запрещена на территории Российской Федерации.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Автор – Tom Kong

Оригинал статьи

В тренде:

Anthropic, claude mythos, exploitbench, techtimes.com, ИИ, кибербезопасность, уязвимости

Искать на сайте

Самая опасная модель Anthropic была взломана в первый же день, и она до сих пор не выйдет в публичный доступ

Что Mythos может делать на самом деле: цифры ExploitBench реальны

Неавторизованные пользователи получили доступ к Mythos через учетные данные подрядчика в день запуска

Где рассыпается нарратив «скоро будет выпущен»

Хейди Хлааф, ложные срабатывания и проблема «человек в цикле»

Поле битвы с правительством: федеральный запрет, иск и вмешательство Конгресса

Реальный риск: диффузия, а не дата выпуска

В тренде:

Похожие новости:

Самая опасная модель Anthropic была взломана в первый же день, и она до сих пор не выйдет в публичный доступ

Что Mythos может делать на самом деле: цифры ExploitBench реальны

Неавторизованные пользователи получили доступ к Mythos через учетные данные подрядчика в день запуска

Где рассыпается нарратив «скоро будет выпущен»

Хейди Хлааф, ложные срабатывания и проблема «человек в цикле»

Поле битвы с правительством: федеральный запрет, иск и вмешательство Конгресса

Реальный риск: диффузия, а не дата выпуска

В тренде:

Похожие новости:

Новый GPT-5.5-Cyber от OpenAI обошел Claude Mythos 5 в бенчмарке

«Пять глаз» предупреждают ИБ-директоров: пора менять стратегию кибербезопасности под угрозой

OpenAI запускает новую инициативу для поиска и исправления багов в

Интернет-гиганты захватывают рынок AI-здравоохранения: ByteDance, Tencent, JD Health и Ant