Claude Sonnet 3.5 теперь по умолчанию в Anthropic: «агентные» возможности сокращают разрыв с Opus

Sonnet 5 Anthropic Api ии Opus ценообразование techtimes.com

Запущен Claude Sonnet 5 30 июня 2026 года как новая модель ИИ по умолчанию для всех планов Free и Pro от Anthropic, обеспечивающая агентную производительность, близкую к Opus, при значительно более низкой стоимости API. Вводные цены в $2 за миллион входных токенов действуют только до 31 августа, после чего тарифы вырастут до $3, а пересмотренный.

30 июня 2026 года Anthropic выпустила Claude Sonnet 5 как новую модель ИИ по умолчанию для своих тарифных планов Free и Pro, заменив Sonnet 4.6 моделью, которая, по утверждению компании, сокращает разрыв в производительности с флагманской линейкой Opus, оставаясь при этом значительно более дешевой в эксплуатации. Для разработчиков, использующих автоматизированные многоэтапные рабочие процессы, это обновление имеет наибольшее значение не из-за показателей бенчмарков, а из-за того, что эти показатели позволяют реализовать архитектурно: одна модель, охватывающая непрерывную кривую соотношения цены и производительности от легких задач до автономной работы, близкой к уровню Opus, в зависимости от того, какой бюджет на вычисления разработчик выделяет на каждый вызов.

В анонсе запуска Anthropic модель описывается как самая «агентная» версия Sonnet на сегодняшний день — способная строить многоэтапные планы, использовать такие инструменты, как браузеры и терминалы, и выполнять сложные задачи, на которых предыдущие модели Sonnet останавливались, не завершив работу.

Запуск состоялся на фоне подготовки Anthropic к одному из крупнейших в истории первичных публичных размещений акций (IPO) технологической компании — компания конфиденциально подала проект заявления о регистрации по форме S-1 в Комиссию по ценным бумагам и биржам 1 июня 2026 года, после раунда финансирования Серии H на сумму 65 миллиардов долларов, оценившего ее в 965 миллиардов долларов. Sonnet 5 — это первый крупный релиз модели после этой подачи и после приказа Министерства торговли от 12 июня, приостановившего действие Claude Fable 5 и Mythos 5 для всех пользователей по всему миру. Эти модели остаются недоступными для обычных клиентов; Sonnet 5 и Opus 4.8 теперь являются фактическим пределом того, что может получить большинство разработчиков.

Claude Sonnet 5 Сегодня Становится Моделью по Умолчанию для Free и Pro

Sonnet 5 доступна немедленно во всех тарифных планах Claude и является моделью по умолчанию для учетных записей Free и Pro. Пользователи Max, Team и Enterprise также имеют к ней доступ. Разработчики могут получить к ней доступ через Claude Code, веб- и мобильные интерфейсы claude.ai, а также через API Claude Platform, используя строку модели claude-sonnet-5. Полный список доступных моделей и их идентификаторов API приведен в документации Anthropic по моделям.

Модель также доступна на Amazon Bedrock и добавлена в качестве опции в GitHub Copilot для пользователей Pro, Pro+, Max, Business и Enterprise — точка распространения, важная для любой команды, которая уже выставляет счета через систему кредитов токенов GitHub.

Как Уровни Усилий Создают Непрерывную Кривую Соотношения Цены и Производительности

Самая важная архитектурная особенность Sonnet 5 — это не показатель бенчмарка. Это положение модели на настраиваемой кривой соотношения цены и производительности, которая существенно пересекается с Opus 4.8.

Модели ИИ обычно взимают фиксированную плату за токен независимо от того, насколько усердно модель работает над конкретным запросом. Система уровней усилий (effort level system) Anthropic меняет это. Разработчики могут поручить модели применять больше или меньше вычислительных ресурсов для выполнения конкретной задачи — выбирая из low (низкий), medium (средний), high (высокий), xhigh (очень высокий) или max (максимальный) — обменивая стоимость на качество вывода. Графики запуска Sonnet 5, основанные на бенчмарке агентного поиска BrowseComp и оценке использования компьютера OSWorld-Verified, показывают, что Sonnet 5 на высоких или очень высоких уровнях усилий достигает производительности, сравнимой с Opus 4.8 в некоторых категориях задач. На среднем уровне усилий она значительно дешевле, чем Opus, при этом превосходя Sonnet 4.6 при любых настройках.

Практическое следствие: команды, которые ранее использовали Sonnet для рутинных задач, а Opus — для сложных, теперь могут направлять большую долю сложных работ через Sonnet 5 на повышенных уровнях усилий, оставляя Opus 4.8 только для задач, которые специально требуют его более мощного агентного поиска или производительности использования компьютера. Opus 4.8 остается лучшим выбором для требований самой высокой точности в этих конкретных задачах и для работы в сфере кибербезопасности, требующей ослабленных ограничений (guardrails).

В бенчмарке, специально нацеленном на агентное кодирование — показатель, наиболее актуальный для автоматизированных развертываний конвейеров, — Sonnet 5 набирает 63,2 процента по сравнению с 69,2 процента у Opus 4.8 и 58,1 процента у уходящей Sonnet 4.6. В задачах, связанных с работой со знаниями, Sonnet 5 немного опережает Opus 4.8. Полные данные оценки находятся в карте системы Sonnet 5.

Что Сообщают Разработчики: Завершенные Задачи, на Которых Предыдущие Sonnet Застревали

Ранние разработчики, получившие доступ, отметили последовательное улучшение того, что Anthropic называет «доведением до конца» (follow-through): способность выполнять многоэтапные задачи без остановки на полпути. Дэниел Шепард, старший инженер в Zapier, сообщил, что его команда поручила модели задачу по комбинированному обновлению учетной записи Salesforce и запуску электронной почты — рабочий процесс, который ранее требовал вмешательства человека на полпути, — и модель выполнила его без остановки.

Фабиан Хедин, соучредитель Lovable, отметил качество, которое редко измеряется бенчмарками, но имеет большое значение в развертываниях, ориентированных на потребителя: последовательный, чистый отказ от небезопасных запросов. Модель, развернутая в масштабе, которая адекватно и надежно отказывает, по мнению Хедина, так же операционно важна, как и сырая возможность при передаче мощных инструментов в руки миллионов пользователей.

Модель также проверяет свои собственные результаты без явного запроса на это — изменение поведения по сравнению с Sonnet 4.6, которое снижает скорость накопления ошибок в автоматизированных конвейерах, где ошибка на одном этапе распространяется на все последующие этапы.

Что Изменение Токенизатора Означает для Вашего Счета

Anthropic предлагает вводную ставку API в размере 2 долларов за миллион входных токенов и 10 долларов за миллион выходных токенов до 31 августа 2026 года. После этой даты ценообразование переходит к стандартной ставке в 3 доллара за миллион входных токенов и 15 долларов за миллион выходных токенов. Полные сведения о ценах, включая скидки на пакетные API, приведены в документации Anthropic по ценообразованию.

Для сравнения, Opus 4.8 стоит 5 долларов за миллион входных токенов и 25 долларов за миллион выходных токенов — это означает, что Sonnet 5 по стандартным ценам на 40 процентов дешевле на входах и на 40 процентов дешевле на выходах, чем Opus.

Есть существенная оговорка. Sonnet 5 использует обновленный токенизатор — ту же ревизию, что была представлена с Opus 4.7, — которая изменяет способ обработки текста моделью. Один и тот же ввод может отображаться как в 1,0–1,35 раза больше токенов, чем при использовании предыдущего токенизатора, в зависимости от типа контента. Вводное ценообразование Anthropic разработано таким образом, чтобы переход был примерно нейтральным по стоимости для пользователей Sonnet 4.6. Однако разработчикам следует проверить фактическое потребление токенов с помощью нового токенизатора, прежде чем предполагать, что обновление будет бесплатным после 1 сентября, когда начнет действовать стандартное ценообразование.

Агентные рабочие процессы особенно подвержены этой динамике. Модель, которая планирует, проверяет и итерирует через несколько вызовов инструментов, генерирует гораздо больше токенов за завершенную задачу, чем ответ чат-бота в один ход. Архитектура уровней усилий усугубляет это: более высокие настройки усилий означают больше токенов, затрачиваемых на один вывод.

Как Sonnet 5 Справляется с Атаками Безопасности и Внедрения Промптов

Оценки безопасности Anthropic перед развертыванием показали, что Sonnet 5 превосходит Sonnet 4.6 по поведению, наиболее актуальному для агентного развертывания: она демонстрирует более низкие показатели галлюцинаций, более низкие показатели угодничества (склонность соглашаться с неверными предпосылками, а не исправлять их) и улучшенную устойчивость к атакам внедрения промптов (prompt injection).

Внедрение промптов — это категория кибератак, специфичная для моделей, развернутых в автоматизированных контекстах. Когда модель обрабатывает внешний контент — веб-страницу, электронное письмо, документ, полученный с помощью инструмента, — этот контент может содержать враждебные инструкции, предназначенные для отмены исходных инструкций модели и перенаправления ее к другой цели. Поскольку такие модели, как Sonnet 5, развертываются в агентных конвейерах, которые регулярно получают и обрабатывают недоверенный внешний контент, эта поверхность атаки значительно расширяется. Улучшенная устойчивость Sonnet 5 в этом отношении является конкретным инженерным достижением, а не общим улучшением возможностей. В ходе живого конкурса на поиск уязвимостей, проведенного с Gray Swan, только 0,19 процента уникальных атак увенчались успехом против Sonnet 5 — что соответствует Opus 4.8 и превосходит GPT-5.5 с показателем 3,08 процента.

В отношении более широкой безопасности Sonnet 5 использует те же классификаторы киберзащиты в реальном времени, что и Opus 4.7 и 4.8 — системы, которые обнаруживают и блокируют опасные запросы в области кибербезопасности в реальном времени. Эти средства защиты менее строгие, чем те, что были развернуты с временно приостановленным Fable 5, который блокировал более широкий спектр задач безопасности. Anthropic не обучала Sonnet 5 намеренно на задачах кибербезопасности, и в оценках, проверяющих способность разрабатывать рабочие эксплойты для Firefox 147, Sonnet 5 набрала ноль процентов — тот же результат, что и Sonnet 4.6. Небольшое увеличение числа частичных успехов, приписываемое общему улучшению интеллекта, а не специальному обучению кибербезопасности, побудило Anthropic включить средства защиты в реальном времени. Sonnet 5 демонстрирует несколько более высокие показатели несогласованного поведения, чем Opus 4.8 и Claude Mythos Preview, которые остаются более безопасным выбором для развертываний с высокими ставками или конфиденциальных развертываний.

Claude Sonnet 5 в Переполненном Поле Агентного ИИ

Запуск состоялся через четыре дня после того, как OpenAI выпустила GPT-5.6 Sol в предварительном доступе, которую OpenAI также представила как свое самое агентное предложение — способное распределять работу между субагентами для длительных автономных сессий. Gemini 3.5 Flash от Google, запущенный в мае, имел аналогичное позиционирование: переход от разговорного чат-бота к автономному инструменту планирования и выполнения.

Sonnet 5 по цене ниже, чем Opus 4.8, GPT-5.5 и Google Gemini 3.1 Pro как по вводным, так и по стандартным тарифам. Она остается дороже, чем Gemini 3.5 Flash. Более существенное различие заключается в архитектуре уровней усилий: вместо выбора между способной, но дорогой передовой моделью и более дешевым, но ограниченным вариантом среднего уровня, разработчики могут настраивать одну модель в более широком диапазоне соотношения цены и производительности в рамках одного вызова API.

Anthropic также запустила Claude Science 30 июня — настольное приложение для научных исследований, которое интегрирует инструменты и пакеты, обычно используемые исследователями, создает проверяемые научные артефакты и обеспечивает гибкий доступ к вычислительным ресурсам. Компания представила его как консолидацию разрозненных исследовательских инструментов в единую среду с предварительно настроенной поддержкой геномики, одноклеточного анализа, протеомики и хемоинформатики.

Лимиты Скорости Увеличиваются Вместе с Sonnet 5

Чтобы учесть большие объемы токенов, связанные с более способными агентными задачами — которые планируют, итерируют и вызывают инструменты в течение более длительных сессий, — Anthropic повысила лимиты скорости для Chat, Cowork, Claude Code и Claude Platform. В апреле 2026 года компания упростила структуру своих уровней API до трех: Start, Build и Scale. Текущие лимиты видны в Консоли Claude.


Часто Задаваемые Вопросы

В чем разница между Claude Sonnet 5 и Opus 4.8, и когда следует использовать каждую из них?

Sonnet 5 — это модель среднего уровня от Anthropic, которая теперь способна соответствовать производительности Opus 4.8 в некоторых категориях задач при установке более высоких уровней усилий. Opus 4.8 остается более сильным выбором для требований самой высокой точности в задачах агентного поиска и использования компьютера, а также для работы в сфере кибербезопасности, требующей ослабленных ограничений. Практическая рекомендация: используйте Sonnet 5 с высоким или очень высоким уровнем усилий для сложных агентных задач и оставляйте Opus 4.8 для задач, где даже небольшая разница в точности является дорогостоящей.

Сколько на самом деле будет стоить Claude Sonnet 5 после окончания периода вводного ценообразования?

Вводное ценообразование API — 2 доллара за миллион входных токенов и 10 долларов за миллион выходных токенов — действует до 31 августа 2026 года. После этой даты применяется стандартное ценообразование: 3 доллара за миллион входных токенов и 15 долларов за миллион выходных токенов. Существует важная дополнительная переменная: Sonnet 5 использует пересмотренный токенизатор, который может обрабатывать тот же ввод как в 1,0–1,35 раза больше токенов, чем предыдущий токенизатор. Разработчикам, использующим агентные рабочие процессы с большим объемом, следует измерить фактическое потребление токенов с помощью нового токенизатора до вступления в силу стандартного ценообразования.

Заменяет ли Sonnet 5 модель Fable 5 для пользователей, которые потеряли доступ после того, как правительство США ее приостановило?

Не напрямую. Fable 5 и Sonnet 5 — это разные продукты с разными профилями возможностей. Fable 5 была версией самой мощной модели Anthropic с общедоступным доступом, оснащенной классификаторами безопасности; Sonnet 5 — это обновленная модель среднего уровня. Для подавляющего большинства задач разработки — кодирования, автоматизации, работы со знаниями — Sonnet 5 охватывает многое из того, что могла делать Fable 5. Для передовых задач кибербезопасности и продвинутого рассуждения, которые были отличительной чертой Fable 5, Sonnet 5 не является заменой; Opus 4.8 остается моделью с самыми высокими возможностями, доступной в настоящее время для общих пользователей.

Означает ли система уровней усилий, что я выбираю, насколько модель «думает» за один вызов?

Да, с практической точки зрения. Архитектура уровней усилий Anthropic позволяет разработчикам выделять больше или меньше вычислительного бюджета на данный вызов вывода, что влияет как на стоимость, так и на качество вывода. На более высоких уровнях усилий производительность Sonnet 5 в бенчмарках BrowseComp и OSWorld-Verified пересекается с производительностью Opus 4.8 на более низких уровнях усилий, создавая непрерывную кривую соотношения цены и производительности, а не резкий скачок между двумя уровнями продукта.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

В тренде:


Похожие новости: