Новости: moe
Stepfun открыла исходный код Step 3.7 Flash: оптимизированной LLM для эры агентов
Stepfun открывает исходный код Step 3.7 Flash — разреженной LLM на 196B параметров с архитектурой MoE, оптимизированной для рабочих процессов агентов, со скоростью 400 токенов/с и нативным вызовом инструментов. — pandaily.com

Фреймворк с открытым исходным кодом Orbit позволяет обучать триллионнопараметрические модели на одном узле
Sphere AI Lab открыла исходный код Orbit — фреймворка постобучения RL, который позволяет моделям с триллионом параметров, таким как DeepSeek-V4, проходить тонкую настройку на одном узле 8xB200. — pandaily.com

Не только гонка моделей: как Tencent строит свой глобальный «AI moat»
Tencent только что открыла исходный код Hy3 preview — модели Mixture-of-Experts с 295 млрд параметров и окном контекста 256K, завершив неделю, которая также принесла 3D-мировую модель и глобальную бету потребительского агента QClaw. Этот всплеск раскрывает продуманную ставку на слой «обвязки» — инженерный каркас инструментов, памяти и рабочих процессов — как на реальную арену, где будет выиграна эра агентов. — pandaily.com

Meituan представила мультимодальную модель LongCat-Next с поддержкой текста, изображений и аудио
Meituan представила LongCat-Next — мультимодальную модель с 68,5 млрд параметров, способную обрабатывать текст, изображения и аудио в единой среде. Система демонстрирует конкурентоспособную производительность в задачах OCR, генерации изображений и речи, оставаясь на стадии исследований. — pandaily.com

На iPhone 17 Pro успешно запустили LLM на 400 млрд параметров: для этого нужно минимум 200 ГБ памяти
LLM на 400 млрд параметров обычно требуют 200 ГБ ОЗУ, но энтузиаст смог запустить такую модель на iPhone 17 Pro, используя проект Flash-MoE и SSD для потоковой передачи данных на GPU. Скорость генерации — всего 0,6 токена/с. — wccftech.com

Самое просматриваемое:
- Bitcoin Depot оштрафован на $18,5 млн – сталкивается…
- WatchGuard бьёт тревогу: критическая уязвимость…
- Как настроить ComfyUI для генерации изображений ИИ…
- ECARX берет управление бизнесом Flyme OS в свои руки…
- США прикрыли платформу для хранения паролей, которой…
- Результаты еженедельного опроса: Samsung Galaxy Z…
- Тим Суини из Epic: «нечестность» и «грубое…
- Исследователи из MIT возродили 40-летнюю концепцию…
- Новейший датчик присутствия от Aqara определяет,…
- Представитель сервисного центра Google сообщил…




