Новости: инференс
Moffett AI: не стоит стрелять из пушки по воробьям — переосмысление стоимости «inference»
В гонке за доминирование в сфере аппаратного обеспечения для ИИ долгое время господствовала простая мудрость: больше вычислительной мощности — лучше. Модели с триллионом параметров требуют инфраструктуры триллионного масштаба, и индустрия добросовестно создавала всё более крупные кластеры NVIDIA. — pandaily.com

После «не-поглощения» за 20 миллиардов долларов от Nvidia ИИ-стартап Groq привлек 650 миллионов долларов
Производитель чипов Groq стремится привлечь 650 миллионов долларов внутреннего финансирования, переключаясь с аппаратного обеспечения на более активное развитие инференса ИИ — процесса уточнения ответа моделей ИИ на запросы, по данным Axios. — techcrunch.com

Moxin привлекла почти 1 миллиард юаней в раунде серии C на разработку “Sparse Computing AI” чипов
Китайская компания Moxin, пионер в области технологий разреженных вычислений для ИИ-чипов, привлекла около 1 млрд юаней в рамках Серии C для коммерциализации своей вычислительной карты SparsePrime. — pandaily.com

Meituan представила LongCat-Video-Avatar 1.5: фреймворк для создания фотореалистичных цифровых аватаров с открытым исходным кодом
Meituan выпускает версию 1.5 своего фреймворка для генерации видео с цифровыми аватарами с открытым исходным кодом, достигая передовой точности синхронизации губ всего за 8 шагов инференса. — pandaily.com

768 ГБ дешевой памяти Intel Optane DIMM для запуска LLM с 1 триллионом параметров на системе с одной видеокартой
Пользователь Reddit добился успеха, запустив LLM с 1 триллионом параметров на рабочей станции, используя модули Optane PMem DIMM в качестве оперативной памяти, что вызвало ажиотаж в сообществе. — tomshardware.com

Самое просматриваемое:
- Bitcoin Depot оштрафован на $18,5 млн – сталкивается…
- WatchGuard бьёт тревогу: критическая уязвимость…
- Как настроить ComfyUI для генерации изображений ИИ…
- ECARX берет управление бизнесом Flyme OS в свои руки…
- Результаты еженедельного опроса: Samsung Galaxy Z…
- США прикрыли платформу для хранения паролей, которой…
- Тим Суини из Epic: «нечестность» и «грубое…
- Исследователи из MIT возродили 40-летнюю концепцию…
- Новейший датчик присутствия от Aqara определяет,…
- Представитель сервисного центра Google сообщил…




