Новости: moe
Zhipu AI выпускает в открытый доступ облегченную модель GLM-4.7-Flash и представляет архитектуру MLA
Zhipu AI представила легковесную модель GLM-4.7-Flash на базе MoE (30B/3B параметров) с бесплатным API. Новинка использует архитектуру MLA для повышения эффективности, демонстрирует 59.2 на SWE-bench и достигает 43 токенов/сек на Apple M5.

DeepSeek представляет модуль памяти “Энграмма” с открытым исходным кодом, открывая новое измерение для больших языковых моделей.
DeepSeek и Пекинский университет представили “Энграмм” — новый модуль условной памяти для LLM, который эффективно хранит и извлекает знания, дополняя архитектуры MoE и предвещая будущий дизайн моделей ИИ.

NVIDIA анонсировала модели Nemotron 3: открытые модели ИИ в вариантах Nano, Super и Ultra — в 4 раза быстрее Nemotron 2
NVIDIA представила семейство открытых ИИ-моделей Nemotron 3 в трех версиях: Nano (30B), Super (100B) и Ultra (500B). Новые модели используют гибридную архитектуру MoE, обеспечивая повышенную эффективность, точность и масштабируемость для разработки мультиагентных систем.

Самое просматриваемое:
- Bitcoin Depot оштрафован на $18,5 млн – сталкивается…
- WatchGuard бьёт тревогу: критическая уязвимость…
- Как настроить ComfyUI для генерации изображений ИИ…
- ECARX берет управление бизнесом Flyme OS в свои руки…
- США прикрыли платформу для хранения паролей, которой…
- Результаты еженедельного опроса: Samsung Galaxy Z…
- Тим Суини из Epic: «нечестность» и «грубое…
- Исследователи из MIT возродили 40-летнюю концепцию…
- Новейший датчик присутствия от Aqara определяет,…
- Представитель сервисного центра Google сообщил…
