Антропик выпустила новую версию своей среднеразмерной модели Sonnet, опережая четырёхмесячный цикл обновлений компании. В посте, объявляющем новую модель, Антропик подчеркнула улучшения в кодировании, выполнении инструкций и работе с компьютером.
Sonnet 4.6 станет моделью по умолчанию для пользователей бесплатного и профессионального планов.
Бета‑версия Sonnet 4.6 будет включать контекстное окно в 1 млн токенов, в два раза больше самого большого окна, доступного ранее для Sonnet. Антропик охарактеризовала новое контекстное окно как «достаточное для размещения целых кодовых баз, длинных контрактов или десятков исследовательских статей в одном запросе».
Выпуск пришёл всего через две недели после запуска Opus 4.6, а обновлённая модель Haiku, вероятно, появится в ближайшие недели.
Запуск сопровождается новым набором рекордных бенчмарк‑результатов, включая OS World для работы с компьютером и SWE-Bench для программной инженерии. Однако, пожалуй, самым впечатляющим является оценка 60,4 % в ARC‑AGI‑2, измеряющая навыки, специфичные для человеческого интеллекта. Этот показатель ставит Sonnet 4.6 выше большинства сопоставимых моделей, хотя она всё ещё отстаёт от таких моделей, как Opus 4.6, Gemini 3 Deep Think и одной из доработанных версий GPT 5.2.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Russell Brandom




