Неизвестная группировка предположительно использует Claude Mythos без разрешения

Anthropic Claude Mythos ии взлом безопасность gizmodo.com

Модель ИИ от Anthropic, которую позиционируют как самую опасную в мире, предположительно имеет огромную дыру в безопасности. — gizmodo.com

В весьма осторожно написанной статье Bloomberg компания Anthropic во вторник подтвердила, что получила сообщение о том, что несанкционированная таинственная группа получает доступ к Claude Mythos — модели, которую она считает слишком опасной для выпуска. «Мы расследуем сообщение о несанкционированном доступе к Claude Mythos Preview через одну из наших сред сторонних поставщиков», — говорится в заявлении представителя Anthropic для Bloomberg.

Bloomberg, по-видимому, подтвердил предполагаемый взлом, изучив демонстрацию в реальном времени и скриншоты, присланные членом группы, ответственной за несанкционированный доступ.

Используя, что вполне объяснимо, уклончивые формулировки, Bloomberg сообщает, что анонимный источник утверждает, что он является членом неназванной группы, которая злоупотребила своим доступом «в качестве сотрудника стороннего подрядчика Anthropic» и использовала «общепринятые инструменты интернет-расследований, часто применяемые исследователями кибербезопасности», для получения некоторого доступа к модели.

Но не волнуйтесь, эта секретная группа, которая, по-видимому, имеет доступ к самому пугающему технологическому продукту в мире, «заинтересована в игре с новыми моделями, а не в создании с их помощью хаоса», — по-видимому, объяснил источник Bloomberg.

Последовательность событий предполагаемого взлома выглядит примерно так:

  • Существует группа в Discord, которая использует ботов для поиска информации о невыпущенных моделях ИИ на GitHub
  • Произошла утечка данных в стартапе по обучению ИИ Mercor
  • Группа объединила информацию из утечки Mercor с доступом, имевшимся у источника Bloomberg благодаря его работе на подрядчика Anthropic
  • Это позволило группе угадать онлайн-расположение Claude Mythos
  • С тех пор группа свободно экспериментирует с Claude Mythos с 7 апреля, в тот же день, когда было объявлено о Project Glasswing

Итак, подведем итог: Anthropic заявляет, что у нее самая страшная модель ИИ в мире, и, что немаловажно, множество влиятельных структур, похоже, верит в это. Если верить Anthropic на слово, мы все полагаемся на то, что она не будет злоупотреблять этой властью, которую контролирует только она. Однако некая неизвестная сущность получила доступ к этой пугающей модели ИИ, но, если верить им на слово, они просто использовали ее для каких-то тестов на кодирование и клянутся, что не делают с ней ничего злого.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Похожие новости: