Anthropic представила Claude Opus 4.8 и анонсировала скорый выход «Mythos-Class Models»

Anthropic Claude Opus ии модели ии Mythos gizmodo.com

Новейшая версия Claude Opus 4.8 от Anthropic специализируется на выявлении собственных ошибок и уведомлении о них пользователей. Также анонсированы динамические рабочие процессы и контроль усилий. — gizmodo.com

В четверг компания Anthropic представила Claude Opus 4.8 — новейшую и самую передовую версию своей флагманской модели ИИ. Она доступна повсеместно по той же цене, что и ее предшественник, Opus 4.7 (5 долларов за миллион входных токенов и 25 долларов за миллион выходных токенов).

Opus 4.8 демонстрирует лидирующие в отрасли результаты в таких задачах, как агентное кодирование и агентное использование компьютера, что вполне ожидаемо для новой модели Anthropic. Ключевым отличием, на котором акцентирует внимание компания, является «честность» модели — а следовательно, ее общая надежность.

Согласно записи в блоге компании, Opus 4.8 специализируется на выявлении собственных ошибок и уведомлении о них пользователей: «Общая проблема моделей ИИ заключается в том, что они иногда делают поспешные выводы, уверенно заявляя о прогрессе в своей работе, несмотря на скудные доказательства», — пишет компания. «Ранние тестировщики сообщают, что Opus 4.8 с большей вероятностью помечает неопределенности в своей работе и реже делает необоснованные заявления». 

Например, в блоге Anthropic приводится цитата Майкла Ранна, старшего инвестиционного специалиста фирмы по управлению активами Bridgewater, который заявил, что Opus 4.8 смог «проактивно выявлять проблемы во входных данных и результатах анализа, что другие модели регулярно упускали, оставляя это на усмотрение пользователей». 

Кроме того, согласно системной карте модели, Opus 4.8 представляет «существенно более низкий» риск несогласованного и опасного поведения, включая генерацию вредоносного сексуального контента и «подрыв либеральной демократии».

Динамические рабочие процессы и контроль усилий

Помимо новой модели, Anthropic также объявила о запуске «динамических рабочих процессов» (dynamic workflows) — новой функции, доступной в режиме предварительного исследования, которая позволяет Claude решать более сложные задачи кодирования путем развертывания сотен под-агентов, работающих параллельно друг с другом.

Пользователи могут ожидать заметного улучшения от Opus 4.8, особенно в более крупных задачах кодирования, но это не меняет правил игры. Anthropic даже попыталась сдержать ожидания, написав в новом посте в блоге, что Opus 4.8 — это «незначительное, но ощутимое улучшение по сравнению с предшественником», Opus 4.7. Эта модель дебютировала чуть более месяца назад и получила сдержанный первоначальный отклик от пользователей, некоторые из которых жаловались, что ее функция «адаптивного мышления» иногда заставляла ее тратить слишком много времени на простые задачи и недостаточно времени на те, которые требуют больших усилий.

Возможно, в ответ на эту жалобу, Anthropic в четверг также объявила о запуске новой панели «контроля усилий» (effort control) для Claude (находится в выпадающем меню выбора модели), которая позволяет вручную выбирать объем усилий — и токенов — который модель должна потратить на выполнение конкретной задачи. По умолчанию установлено значение «Низкий» (Low), и можно переключиться на «Средний» (Medium), «Высокий» (High) и «Максимальный» (Max) или включить режим адаптивного мышления.

«Модели класса Mythos»

Anthropic также анонсировала скорый дебют «нового класса моделей» с возможностями, которые, как утверждается, сопоставимы с возможностями Mythos — таинственной модели, которая заставила Кремниевую долину содрогнуться от холода. Компания пока не выпустила модель публично, ссылаясь на ее беспрецедентную мощь и риски кибербезопасности.

Согласно новой записи в блоге, Anthropic в настоящее время работает над тестированием мер безопасности для Mythos и ожидает, что «модели класса Mythos будут доступны всем нашим клиентам в ближайшие недели».

Это, очевидно, намеренно очень расплывчато. Время покажет, оправдают ли эти новые модели слухи о революционных возможностях, циркулировавшие вокруг Mythos, или (что более вероятно) новая категория моделей окажется существенно «разбавленной» версией первоначального гиганта. В конце концов, разработчики ИИ склонны преувеличивать способности своих моделей и опасности перед их выпуском, и в большинстве случаев реальность не совсем соответствует ожиданиям. (Вспомните весь ажиотаж вокруг GPT-5 как AGI?) С другой стороны, возможно, Anthropic действительно готова выпустить модели, меняющие мир, которые всего пару месяцев назад считались экзистенциальной угрозой глобальной безопасности. Время покажет, и мы сообщим, как только узнаем больше.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Похожие новости: