Изначально Anthropic обязывала пользователей модели Claude Mythos Preview подписывать соглашения о неразглашении, чтобы предотвратить распространение результатов тестирования, сообщает The Wall Street Journal, однако, по данным издания, на прошлой неделе всё изменилось.
До недавнего времени самым важным, что нужно было знать о Claude Mythos Preview, которую называют самой пугающей моделью ИИ в мире, была её секретность. Чтобы пользоваться ею, нужно было входить в число VIP-персон, допущенных к участию в Project Glasswing — по слухам, это очень узкая группа, насчитывающая около 50 компаний и организаций.
Если вы являетесь одним из тестировщиков Claude Mythos Preview, участвующих в Project Glasswing, вы должны использовать модель для поиска уязвимостей в системе безопасности, и изначально казалось, что на участниках лежит огромная ответственность держать всё в тайне — будто от секретности зависит судьба мира.
Но, по данным The Journal, член Палаты представителей от Демократической партии Джош Готтхаймер направил письмо в Anthropic с жалобой на это. «Никакая организация не должна быть ограничена контрактом от предупреждения других, координации мер по смягчению последствий или информирования соответствующих и доверенных заинтересованных сторон о срочных киберрисках», — написал Готтхаймер.
В отчёте The Journal, опубликованном в понедельник, говорится, что Anthropic, похоже, испытывает трудности с определением того, что можно делать с результатами работы Mythos Preview. Анонимный представитель Anthropic сообщил изданию: «Защита конфиденциальности была тем, что партнёры запросили в самом начале и что было включено в соглашения, подписанные партнёрами», но добавил, что Glasswing «созрел», и пользовательские соглашения были изменены, «чтобы обеспечить широкое распространение ключевой информации», в том числе за пределами Project Glasswing.
Ещё одним событием, произошедшим неделю назад, стало объявление о запуске аналогичной программы под названием Daybreak от главного конкурента Anthropic, OpenAI. Daybreak с самого начала была гораздо менее секретной, чем Project Glasswing, позволяя любому заполнить короткую форму и запросить сканирование своего кода с помощью новейшей модели OpenAI для обеспечения кибербезопасности. Генеральный директор Сэм Альтман написал в X, что хотел бы работать «с как можно большим количеством компаний прямо сейчас».
Похоже, компании уже начали публично рассказывать о том, что им показала Mythos Preview. Например, я не мог не заметить, что Грант Бурзикас, главный специалист по безопасности в Cloudflare, опубликовал пост в блоге в понедельник о том, что он и его компания обнаружили, экспериментируя с Mythos Preview. Это информативный пост, в котором Mythos Preview описывается как похожая на другие LLM для поиска багов, но с добавлением: «Что изменилось с Mythos Preview, так это то, что модель теперь может брать эти баги с низким уровнем серьёзности (которые традиционно оставались бы незамеченными в бэклоге) и объединять их в один, более серьёзный эксплойт».
Но в конце поста есть интригующая приписка. Бурзикас обещает скоро поделиться дополнительными результатами с клиентами и заявляет: «Если ваша команда занимается аналогичной работой и вы хотите сравнить заметки, свяжитесь с нами», после чего предоставляет адрес электронной почты.
Таким образом, пелена секретности вокруг Claude Mythos Preview, похоже, немного приподнимается. Сотрудники Anthropic, несомненно, почувствуют, что их модель теряет часть своей загадочности, но аура таинственности вокруг LLM не может длиться вечно.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Mike Pearl




