Tencent Hunyuan открывает исходный код «HPC-Ops», заявляя о повышении пропускной способности «inference» до 30%

Pandaily

05.02.2026

Tencent Hpc-Ops ии большие языковые модели инференс открытый исходный код

Tencent открыла исходный код HPC-Ops, основной библиотеки операторов для инференса ИИ, заявив, что она ускоряет обработку моделей Hunyuan на 30%. Этот шаг направлен на повышение эффективности работы больших языковых моделей.

4 февраля команда Tencent по инфраструктуре ИИ Hunyuan объявила об открытом выпуске HPC-Ops — высокопроизводительной библиотеки операторов производственного уровня, предназначенной для инференса больших языковых моделей.

Разработанная с нуля для устранения узких мест в реальных производственных условиях, HPC-Ops использует архитектурную абстракцию, глубокую адаптацию к микроархитектуре и оптимизацию на уровне инструкций, чтобы приблизить основные операторы к аппаратным пределам производительности. В реальных тестах Tencent сообщает, что HPC-Ops увеличила пропускную способность инференса (QPM) моделей Hunyuan на 30% и улучшила QPM модели DeepSeek на 17%.

Тесты производительности, опубликованные Tencent, показывают существенный прирост производительности отдельных операторов: оператор внимания обеспечивает до 2,22 раза большую производительность по сравнению с FlashInfer/FlashAttention; GroupGEMM достигает до 1,88 раза по сравнению с DeepGEMM; а FusedMoE достигает до 1,49 раза большей производительности по сравнению с TensorRT-LLM.

Заглядывая в будущее, Tencent заявила, что разработка будет сосредоточена на разреженных операторах внимания для устранения узких мест, связанных с длинным контекстом, расширенных стратегиях квантования и ядрах совместной оптимизации вычислений и коммуникаций для снижения накладных расходов на связь при распределенном инференсе.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Автор – Pandaily

Оригинал статьи

В тренде:

hpc-ops, Tencent, большие языковые модели, ИИ, инференс, открытый исходный код

Искать на сайте

Tencent Hunyuan открывает исходный код «HPC-Ops», заявляя о повышении пропускной способности «inference» до 30%

В тренде:

Похожие новости:

Tencent Hunyuan открывает исходный код «HPC-Ops», заявляя о повышении пропускной способности «inference» до 30%

В тренде:

Похожие новости:

Oracle сокращает 21 000 сотрудников за год из-за внедрения ИИ

ИИ действительно уничтожает рабочие места, и Oracle только что это

iOS 18.2 beta 2: функция Write with Siri заменяет «Writing

OpenAI запускает ИИ-инициативу для устранения уязвимостей в open-source ПО