Компания Anthropic восстановила глобальный доступ к Claude Fable 5 спустя день после того, как Министерство торговли США сняло экспортные ограничения, введенные в отношении модели 12 июня, согласно сообщению в блоге компании здесь. Устранение проблемы, положившее конец 18-дневному противостоянию, заключалось в настройке одного фильтра безопасности, блокирующего технику, выявленную исследователями Amazon. Центр стандартов и инноваций в области ИИ (CAISI) Министерства торговли провел проверку мер защиты до снятия ограничений.
Fable 5 снова доступна через Claude.ai, Claude Platform, Claude Code и Claude Cowork сегодня, а доступ через AWS, Google Cloud и Microsoft Foundry будет возобновлен позднее. Директива от 12 июня запрещала любому иностранному гражданину, включая персонал Anthropic, не являющийся гражданином США, использовать Fable 5 или более мощную Mythos 5, на которой она основана. Поскольку проверить гражданство пользователей было невозможно, Anthropic отозвала обе модели по всему миру.
Спорная техника была выявлена исследователями Amazon, которые нашли способ заставить Fable 5 идентифицировать уязвимости программного обеспечения и, в одном случае, написать код, демонстрирующий, как можно использовать такую уязвимость. Anthropic обучила новый классификатор, который блокирует эту конкретную технику более чем в 99% случаев и перенаправляет помеченные запросы на более старую Opus 4.8. Компания заявила, что это изменение также побочным эффектом затрагивает более безобидные запросы на кодирование и отладку.
Классификатор нацелен на заявленный промпт, а не на возможности самой модели. Fable 5 по-прежнему может выявлять уязвимости, описанные в отчете Amazon; фильтр обнаруживает запрос и перенаправляет его, а не лишает модель этой способности. Меры защиты, основанные на обнаружении, также были теми, что были скомпрометированы и вызвали первоначальный запрет, а классификатор, настроенный на одну известную технику, ничего не делает для тех, которые еще не обнаружены. Anthropic признает, что ни одна модель не может быть сделана полностью устойчивой к джейлбрейкам, и ожидает появления новых.
В ходе проверки Anthropic, проведенной совместно с правительством и Amazon, выяснилось, что Opus 4.8, GPT-5.5 от OpenAI и Kimi K2.7 из Китая могли выявлять те же уязвимости. Каждая протестированная модель, включая Haiku 4.5, Sonnet 4.6 и несколько версий Opus, смогла воспроизвести демонстрацию единственного эксплойта, подтверждая аргумент о том, что кибервозможности класса Mythos были переоценены.
Возвращение Fable 5 восстанавливает позиции в бенчмарках, которые удерживала китайская лаборатория Z.ai с моделью GLM-5.2 по умолчанию, пока Fable была недоступна, включая наивысший доступный балл в многонедельном тестовом задании AA-Briefcase. Mythos 5, которая имеет меньше ограничений и остается доступной только для партнеров Project Glasswing, была возвращена ряду американских организаций 26 июня.
Anthropic также запустила программу HackerOne для исследователей, чтобы они сообщали о новых джейлбрейках Fable 5, и обязалась предоставлять назначенным государственным партнерам ранний доступ для тестирования будущих передовых моделей до их выпуска. Для планов Pro, Max, Team и некоторых корпоративных планов Fable 5 учитывается в размере до 50% от недельных лимитов использования до 7 июля, после чего она переходит на кредиты использования.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Luke James




