Партнерство NVIDIA и Groq обретает официальный статус: Дженсен представил гибридный вычислительный лоток с блоками LPU третьего поколения от Groq в стойке Rubin.
Идея NVIDIA с Groq — нацелиться на «высокоскоростные» рабочие нагрузки в надежде взломать конкуренцию в области инференса
Дискуссии о том, что NVIDIA предпримет в отношении Groq, ведутся уже довольно давно, и мы сохраняли ключевое лидерство в освещении событий. На GTC 2026 NVIDIA представила новый гибридный вычислительный лоток Vera Rubin — Groq 3 LPX, который включает восемь «неанонсированных» блоков Groq3, которые мы обсудим далее. По данным NVIDIA, LPX и Rubin вместе обеспечивают беспрецедентную производительность инференса, позволяя увеличить пропускную способность инференса на 35x на мегаватт, что и сделало решение Groq ключом для NVIDIA к открытию рынка инференса.

Что касается отдельного вычислительного лотка, то мы видим стойку с 256 блоками LPU, обеспечивающими 128 ГБ бортовой SRAM и пропускную способность масштабирования 640 ТБ/с. Это ответ NVIDIA на действия Cerebras и конкурентов в области инференса, и, по сути, объединяя GPU Rubin с LPU, NVIDIA нацеливается как на стадии предварительного заполнения (prefill), так и на стадии декодирования (decode) инференса, что позволяет компании стать конкурентоспособной на рынке, где «они не первые».
Для отдельного чипа Groq3 вы получаете 500 МБ SRAM, пропускную способность SRAM 150 ТБ/с и 1,2 PFLOPs (FP8). Когда вы объединяете лоток Rubin и LPX от Groq, генеральный директор NVIDIA заявляет, что общая вычислительная мощность для AI-инференса достигает 315 PFLOPs, и вот как выглядит лоток изнутри:

Архитектура LPX, разработанная совместно с Vera Rubin и оптимизированная для моделей с триллионом параметров и контекстом в миллион токенов, обеспечивает максимальную эффективность по мощности, памяти и вычислениям. Дополнительная пропускная способность на ватт и производительность на токен открывают новый уровень ультрапремиального инференса для моделей с триллионом параметров и контекстом в миллион токенов, расширяя возможности получения дохода для всех AI-провайдеров.
Идея состоит в том, что блоки LPU от Groq будут играть роль, аналогичную роли Mellanox в сетевых технологиях, и эта гибридная архитектура даст NVIDIA преимущество в работе с чувствительными к задержкам рабочими нагрузками. Поскольку агентный ИИ становится следующей «переломной» точкой для индустрии, NVIDIA крайне важно не отставать от требований к вычислениям, поэтому партнерство с Groq оказалось жизненно важным для «Зеленой команды».
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Muhammad Zuhair




