Китайская компания Stepfun (Цзеюэ Синчэнь) официально выпустила и открыла исходный код Step 3.7 Flash — языковой модели нового поколения, специально оптимизированной для эпохи производства агентов. Модель разработана с учетом рабочих процессов агентов, кодирования, поиска и мультимодальных возможностей.
Построенная на разреженной архитектуре MoE, Step 3.7 Flash имеет 196 миллиардов общих параметров плюс 1,8 миллиарда ViT, при этом 11 миллиардов параметров активируются на один инференс. Она достигает скорости генерации до 400 токенов в секунду, что делает ее подходящей для высокочастотных многоходовых агентских приложений с низкими требованиями к задержке.
Ключевые возможности включают нативное мультимодальное понимание и выполнение, позволяющее модели обрабатывать элементы пользовательского интерфейса, диаграммы, документы, изображения и интерфейсы приложений, преобразуя сложную визуальную информацию в структурированные выходные данные, генерацию кода и исполняемые задачи.
Модель также обладает расширенными возможностями веб-поиска и визуального поиска, что позволяет ей активно извлекать и перекрестно проверять несколько источников доказательств в тексте и изображениях в открытых информационных средах.
Отличительной особенностью является надежный вызов и оркестровка инструментов в Step 3.7 Flash. В длительных многоходовых рабочих процессах агентов она может стабильно вызывать API, браузеры, терминалы, инструменты Office и внешние системы, сохраняя при этом согласованность траектории задачи.
Модель оптимизирована для совместимости с основными агентскими фреймворками, включая Claude Code, KiloCode, RooCode, OpenCode, Hermes Agent и OpenClaw, а также с протоколами вызова инструментов MCP и Skills. Это снижает трение при интеграции для разработчиков, создающих приложения на основе агентов.
Step 3.7 Flash доступна на GitHub, Hugging Face и ModelScope под лицензиями с открытым исходным кодом. Доступ к API предоставляется через платформы Stepfun как отечественным, так и международным разработчикам. Этот релиз представляет собой значительное дополнение к экосистеме LLM с открытым исходным кодом, особенно для ориентированных на агентов приложений, требующих надежного использования инструментов и мультимодального понимания.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Pandaily




