квантизация
Intel AutoRound ускоряет и повышает эффективность квантованных LLM-моделей на GPU Intel и устройствах на базе CUDA, подтверждена поддержка FP8, MXFP8 и MXFP4 в Cresent Island.
Intel представляет AutoRound — новый алгоритм квантизации, ускоряющий работу больших языковых моделей (LLM) на CPU, GPU Intel и CUDA. Crescent Island получит поддержку MXFP8 и MXFP4, что позволит существенно повысить эффективность AI-вычислений.

Самое просматриваемое:
- Результаты еженедельного опроса: Samsung Galaxy Z…
- В рендерах обнаружены дизайн и цветовые решения…
- Инстакарт взимает с покупателей разные цены за одни…
- Глобальная версия Xiaomi Redmi Note 15 Pro+ представлена
- Cegeka планирует подземный центр обработки данных в…
- JPMorgan запустит токенизированный фонд денежного…
- Bungie наконец подтвердила дату релиза Marathon и…
- Lords of the Fallen II не будет «политкорректной» —…
- Криптовалютная компания Bitzero Кевина О’Лири…
- Itochu и Castrol подписали меморандум о…