NVIDIA представляет Vera Rubin с «LPX» от Groq для прорыва в сегмент «inference», где компания никогда не была лидером

Muhammad Zuhair

16.03.2026

Nvidia Groq Lpu инференс Rubin wccftech.com

Официальное оформление партнерства NVIDIA и Groq: Дженсен Хуанг представил гибридный лоток Vera Rubin с блоками LPU Groq3. NVIDIA нацеливается на высокоскоростные нагрузки инференса, стремясь обойти конкурентов. — wccftech.com

Партнерство NVIDIA и Groq обретает официальный статус: Дженсен представил гибридный вычислительный лоток с блоками LPU третьего поколения от Groq в стойке Rubin.

Идея NVIDIA с Groq — нацелиться на «высокоскоростные» рабочие нагрузки в надежде взломать конкуренцию в области инференса

Дискуссии о том, что NVIDIA предпримет в отношении Groq, ведутся уже довольно давно, и мы сохраняли ключевое лидерство в освещении событий. На GTC 2026 NVIDIA представила новый гибридный вычислительный лоток Vera Rubin — Groq 3 LPX, который включает восемь «неанонсированных» блоков Groq3, которые мы обсудим далее. По данным NVIDIA, LPX и Rubin вместе обеспечивают беспрецедентную производительность инференса, позволяя увеличить пропускную способность инференса на 35x на мегаватт, что и сделало решение Groq ключом для NVIDIA к открытию рынка инференса.

NVIDIA представляет Vera Rubin с «LPX» от Groq для прорыва в сегмент «inference», где компания никогда не была лидером — Источник изображения: NVIDIA

Что касается отдельного вычислительного лотка, то мы видим стойку с 256 блоками LPU, обеспечивающими 128 ГБ бортовой SRAM и пропускную способность масштабирования 640 ТБ/с. Это ответ NVIDIA на действия Cerebras и конкурентов в области инференса, и, по сути, объединяя GPU Rubin с LPU, NVIDIA нацеливается как на стадии предварительного заполнения (prefill), так и на стадии декодирования (decode) инференса, что позволяет компании стать конкурентоспособной на рынке, где «они не первые».

Для отдельного чипа Groq3 вы получаете 500 МБ SRAM, пропускную способность SRAM 150 ТБ/с и 1,2 PFLOPs (FP8). Когда вы объединяете лоток Rubin и LPX от Groq, генеральный директор NVIDIA заявляет, что общая вычислительная мощность для AI-инференса достигает 315 PFLOPs, и вот как выглядит лоток изнутри:

Архитектура LPX, разработанная совместно с Vera Rubin и оптимизированная для моделей с триллионом параметров и контекстом в миллион токенов, обеспечивает максимальную эффективность по мощности, памяти и вычислениям. Дополнительная пропускная способность на ватт и производительность на токен открывают новый уровень ультрапремиального инференса для моделей с триллионом параметров и контекстом в миллион токенов, расширяя возможности получения дохода для всех AI-провайдеров.

Идея состоит в том, что блоки LPU от Groq будут играть роль, аналогичную роли Mellanox в сетевых технологиях, и эта гибридная архитектура даст NVIDIA преимущество в работе с чувствительными к задержкам рабочими нагрузками. Поскольку агентный ИИ становится следующей «переломной» точкой для индустрии, NVIDIA крайне важно не отставать от требований к вычислениям, поэтому партнерство с Groq оказалось жизненно важным для «Зеленой команды».

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Автор – Muhammad Zuhair

Оригинал статьи

В тренде:

groq, lpu, Nvidia, rubin, wccftech.com, инференс

Искать на сайте

NVIDIA представляет Vera Rubin с «LPX» от Groq для прорыва в сегмент «inference», где компания никогда не была лидером

Идея NVIDIA с Groq — нацелиться на «высокоскоростные» рабочие нагрузки в надежде взломать конкуренцию в области инференса

В тренде:

Похожие новости:

NVIDIA представляет Vera Rubin с «LPX» от Groq для прорыва в сегмент «inference», где компания никогда не была лидером

Идея NVIDIA с Groq — нацелиться на «высокоскоростные» рабочие нагрузки в надежде взломать конкуренцию в области инференса

В тренде:

Похожие новости:

Появилось видео дроп-теста iPhone 18 Pro: флагман сохранил прежний дизайн,

Дело не только в смартфонах: из-за дефицита чипов дорожают даже

Южная Корея вложит 1 триллион долларов в производство чипов памяти

Официальная версия DeepSeek V4 выйдет в середине июля: цены на