autoround
Intel AutoRound ускоряет и повышает эффективность квантованных LLM-моделей на GPU Intel и устройствах на базе CUDA, подтверждена поддержка FP8, MXFP8 и MXFP4 в Cresent Island.
Intel представляет AutoRound — новый алгоритм квантизации, ускоряющий работу больших языковых моделей (LLM) на CPU, GPU Intel и CUDA. Crescent Island получит поддержку MXFP8 и MXFP4, что позволит существенно повысить эффективность AI-вычислений.

Самое просматриваемое:
- Результаты еженедельного опроса: Samsung Galaxy Z…
- Инстакарт взимает с покупателей разные цены за одни…
- Cegeka планирует подземный центр обработки данных в…
- Нет: SoundCloud не начал блокировать VPN — компания…
- В Microsoft Store появились 35 великолепных новых…
- 2 800 RGB-дронов превратили небо в крупнейшую в…
- JPMorgan запустит токенизированный фонд денежного…
- Itochu и Castrol подписали меморандум о…
- JLR: данные о зарплатах похищены в…
- CloudHQ начнёт в следующем году строительство…