2 февраля китайская компания StepFun, занимающаяся разработкой ИИ, официально представила Step 3.5 Flash — свою новейшую и самую мощную модель с открытым исходным кодом, позиционируемую как «созданную для агентов». По заявлению компании, модель обладает высокими возможностями логического вывода, стабильностью и производительностью, оптимизированной специально для рабочих процессов на основе агентов.

Ключевые особенности включают:
- Быстрее: Скорость инференса до 350 токенов в секунду для задач кодирования с одним запросом
- Мощнее: Производительность в сценариях с агентами и в математических рассуждениях сравнима с ведущими моделями с закрытым исходным кодом
- Стабильнее: Способна обрабатывать сложные, долгосрочные, многоэтапные задачи

По мнению StepFun, следующее поколение базовых моделей должно быть не только «умнее», но и надежным, отзывчивым и экономически эффективным. Для достижения этого баланса Step 3.5 Flash использует несколько архитектурных инноваций:
- Разреженное смешение экспертов (Sparse Mixture-of-Experts, MoE): Каждый токен активирует около 11 миллиардов параметров из общего числа в 196 миллиардов, что значительно снижает вычислительные затраты
- MTP-3 (Multi-Token Prediction): Модель предсказывает три токена за шаг, эффективно удваивая эффективность инференса
- Гибридная архитектура внимания (Hybrid Attention Architecture, SWA + Full Attention): Сочетание скользящего окна и глобального внимания в соотношении 3:1 позволяет модели фокусироваться на ключевых сегментах в длинных текстах, обеспечивая эффективную обработку контекста длиной до 256 тыс. токенов при меньших вычислительных затратах
Step 3.5 Flash теперь полностью доступна, и StepFun также сообщила, что обучение модели Step 4 уже началось. Компания пригласила разработчиков и исследователей принять участие в открытой разработке модели и совместном создании экосистемы.
С акцентом на интеллект агентов, обработку длинного контекста и эффективность инференса, Step 3.5 Flash демонстрирует амбиции StepFun по созданию конкурентоспособной открытой основы для систем ИИ-агентов следующего поколения.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Pandaily




