Новости: инференс
Zhipu AI запускает высокоскоростной API GLM-5.1: 400 токенов/с — новый мировой рекорд
Zhipu AI выпустила GLM-5.1-highspeed — API-вариант модели GLM-5.1 со скоростью 400 токенов в секунду, что, по сообщениям, является самой высокой скоростью инференса среди ведущих мировых поставщиков LLM. — pandaily.com

NVIDIA теряет позиции среди AI-инженеров: Evercore предупреждает о переходе гиперскейлеров на кастомные ASIC из-за проблем с охлаждением и энергопотреблением
Хотя чипы NVIDIA считаются лидерами по совокупной стоимости владения (TCO) среди ИИ-ускорителей, аналитики Evercore ISI отмечают, что инженеры ИИ не впечатлены. Помимо эффективности, они учитывают стоимость охлаждения. Переход к инференсу смещает фокус на стоимость за токен и экономику, подталкивая к альтернативам. — wccftech.com

Anthropic присматривается к британскому стартапу: технология Fusion обещает ускорить AI-инференс в 100 раз при стоимости в 10 раз ниже «Groq» от NVIDIA
Сообщается, что Anthropic, создатели Claude AI, ведут переговоры с британским стартапом Fractile, чья технология SRAM может ускорить инференс ИИ в 100 раз и снизить затраты в 10 раз. Fractile разрабатывает архитектуру Fusion для бустинга инференса ИИ. — wccftech.com

Инференс дает стартапам в области AI-чипов второй шанс заявить о себе
В мире дезагрегированного ИИ Nvidia может быть и другом, и врагом. Стартапы ищут ниши в инференсе, где гибридные решения Nvidia и конкурентов, включая оптические чипы, борются за доминирование над этапами prefill и decode. — theregister.com

Huawei может захватить корону китайского рынка ИИ-чипов в 2026 году на фоне проблем с поставками Nvidia H200 из-за регуляторных ограничений
Huawei, по сообщениям, готова стать ведущим поставщиком ИИ-чипов в Китае на фоне экспортных ограничений и задержек на таможне для Nvidia. Аналитики прогнозируют, что к 2030 году объем внутреннего рынка ИИ-чипов в Китае может составить 67 млрд долларов. — tomshardware.com

Google представила TPU восьмого поколения: два специализированных чипа для обучения и инференса
Google представила TPU 8-го поколения (TPU 8t и 8i) со «специализированными архитектурами», созданными для поддержки обучения моделей и рабочих нагрузок инференса ИИ, обещая значительный прирост производительности и эффективности. — datacenterdynamics.com

Самое просматриваемое:
- Bitcoin Depot оштрафован на $18,5 млн – сталкивается…
- WatchGuard бьёт тревогу: критическая уязвимость…
- Как настроить ComfyUI для генерации изображений ИИ…
- ECARX берет управление бизнесом Flyme OS в свои руки…
- Результаты еженедельного опроса: Samsung Galaxy Z…
- США прикрыли платформу для хранения паролей, которой…
- Тим Суини из Epic: «нечестность» и «грубое…
- Исследователи из MIT возродили 40-летнюю концепцию…
- Новейший датчик присутствия от Aqara определяет,…
- Представитель сервисного центра Google сообщил…



