Шаг 3.7: Flash лидирует в рейтингах AA по скорости, экономической эффективности и сквозной производительности

Stepfun Step 3.7 Flash ии бенчмарк Openrouter Hugging Face pandaily.com

Новейшая модель StepFun, Step 3.7 Flash, заняла лидирующие позиции в бенчмарке AA, показав первенство по скорости и эффективности затрат. Модель набирает популярность на OpenRouter и Hugging Face, предлагая мощную альтернативу для производственного ИИ. — pandaily.com

Новейшая модель от StepFun, Step 3.7 Flash, заняла лидирующие позиции в бенчмарке Artificial Analysis (AA), обеспечив первое место по скорости, экономической эффективности и общей производительности, а также набрав значительную популярность на OpenRouter и Hugging Face.

Согласно данным бенчмарка, Step 3.7 Flash обеспечивает скорость вывода до 416 токенов в секунду — одну из самых высоких среди сопоставимых моделей. Что более важно, стоимость обработки одной задачи составляет примерно одну девятую от стоимости Claude Opus 4.6, при этом сохраняя возможности программирования на уровне 97% от уровня Claude. Такое сочетание скорости и экономической эффективности делает Step 3.7 Flash привлекательным вариантом для производственного развертывания, где важна экономика инференса.

Быстрый взлет модели отражает более широкий сдвиг в конкурентном ландшафте индустрии ИИ. В предыдущие годы основное внимание уделялось «сырой» производительности в бенчмарках — кто сможет набрать на несколько баллов больше в стандартизированных тестах. Однако по мере того как ИИ-агенты становятся доминирующей парадигмой развертывания, правила конкуренции кардинально изменились. В реальных рабочих процессах агентов системы ИИ должны многократно вызывать инструменты, проводить многоходовой поиск информации и декомпозировать сложные задачи на этапы. В таких условиях задержка инференса и стоимость становятся критическими узкими местами.

Мультимодальные возможности понимания Step 3.7 Flash позволяют ему обрабатывать и анализировать изображения наряду с текстом. В демонстрациях модель успешно идентифицировала ловкую роботизированную руку по ее внешнему виду, распознала конкретные сегменты суставов и кончики пальцев, а затем автономно нашла и скомпилировала исчерпывающую таблицу спецификаций продукта, включающую информацию о производителе, аппаратную конфигурацию, грузоподъемность и цены.

Модель также продемонстрировала сильные возможности по оркестровке инструментов в долгосрочных задачах. В демонстрации обработки отчетов о расходах Step 3.7 Flash автономно организовала несколько изображений счетов, извлекла суммы и сгенерировала как электронную таблицу для возмещения расходов в Excel, так и документ с финансовым объяснением менее чем за 60 секунд.

Step 3.7 Flash был выпущен с открытым исходным кодом на Hugging Face, где он поддерживает высокие показатели загрузок и вовлеченность сообщества. Появление модели в списке трендов OpenRouter как одной из лучших китайских моделей отражает растущий глобальный интерес к экономически эффективным альтернативам премиальным западным моделям для рабочих нагрузок производственного ИИ.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Похожие новости: