На следующей неделе пройдет «ИИ-фестиваль» Burning Man: чего The Register ждет от GTC 2026

Nvidia Gtc Gpu Groq Rubin Openclaw theregister.com

: От размышлений о токеномике Groq до OpenClaw и кремния, который его питает, наши прогнозы относительно самого горячего события в городе. — theregister.com

У Nvidia наметилась небольшая проблема. Популярные рабочие нагрузки генеративного ИИ, такие как помощники по коду и агентные системы, генерируют огромные объемы токенов, и их необходимо перемещать с высокой скоростью. Но чипы гиганта GPU пока с трудом справляются с этой задачей.

Ситуация начнет меняться на следующей неделе, когда генеральный директор Nvidia Дженсен Хуанг на Конференции разработчиков графических технологий (более известной как GTC) компании расскажет, как он будет использовать технологию ускорителей, извергающих токены, которую он приобрел вместе с восходящей звездой Groq в конце прошлого года.

Последние тесты InferenceX от аналитической фирмы SemiAnalysis показывают, как технология Groq помогает восполнить пробел в текущем портфолио Nvidia.

На следующей неделе пройдет «ИИ-фестиваль» Burning Man: чего The Register ждет от GTC 2026

Кривая Парето эффективности InferenceX может быть разделена на три основные категории. Большие объемы токенов слева, дорогие токены с низкой задержкой справа и так называемая «зона Златовласки» посередине. — Нажмите, чтобы увеличить

В то время как стоечные системы NVL72 от Nvidia хорошо масштабируются при низких скоростях генерации токенов на одного пользователя, они становятся все менее эффективными по мере роста интерактивности пользователей.

Напротив, архитектуры с большим объемом SRAM, которые продвигают Groq и Cerebras, превосходны в сценариях, чувствительных к задержкам, и могут достигать скорости генерации токенов, часто превышающей 500 или даже 1000 токенов в секунду. Это намного больше токенов, чем могут обеспечить архитектуры на базе GPU.

Фактически, именно эта возможность позволила Cerebras заполучить контракт от OpenAI в начале этого года для обеспечения работы их модели Codex. Nvidia не имела ничего сопоставимого с Cerebras, пока в декабре не приобрела интеллектуальную собственность и таланты Groq за ошеломляющие 20 миллиардов долларов.

Объединив свои технологии GPU и библиотеки программного обеспечения CUDA с архитектурой потоков данных Groq, Nvidia получает возможность значительно поднять кривую Парето, снизив стоимость токена и одновременно повысив скорость вывода.

Расширение аппаратного стека CUDA от Nvidia для включения архитектуры потоков данных Groq не будет простым. На GTC Nvidia может объявить о добавлении ограниченной поддержки существующей архитектуры Groq относительно быстро.

Больше кремния

Эта GTC уже ощущается несколько иначе, поскольку Nvidia раскрыла информацию о своих графических процессорах Rubin еще на CES в январе.

Напомним, Rubin оснащен до 288 ГБ памяти HBM4 с пропускной способностью 22 ТБ/с и производительностью 35–50 петафлопс в формате NVFP4 в зависимости от сценария использования.

Запуск представляет собой значительный скачок производительности по сравнению с текущими чипами Nvidia поколения Blackwell, обеспечивая 5-кратный прирост пропускной способности в операциях с плавающей запятой. На данный момент Nvidia объявила, что чипы будут доступны как в восьмипроцессорной платформе HGX, так и в стоечной системе NVL72, которая, как следует из названия, вмещает 72 модуля Rubin SXM в одной системе.

Существует также Rubin GPX, анонсированный на Computex в июне 2025 года, который будет устанавливаться в определенные стойки NVL для обеспечения дополнительной вычислительной мощности для рабочих процессов с большим контекстом и обработки видео.

Мы ожидаем, что Хуанг будет активно продвигать оптимизацию производительности и повышение эффективности, обеспечиваемые растущим портфолио его GPU. Но поскольку эти GPU становятся все горячее — по оценкам, тепловая мощность (TDP) Rubin составляет 1,8 кВт или, возможно, даже выше — жидкостное охлаждение не является опцией. Некоторые покупатели могут отказаться от этого требования, что сыграет на руку AMD с ее оборудованием с воздушным охлаждением.

Однако, учитывая прирост поколения, обеспечиваемый архитектурой Rubin, ничто не мешает Nvidia выпустить однокристальную версию чипа с воздушным охлаждением, имеющую пять или шесть стеков HBM вместо восьми. Такой чип по-прежнему обеспечит 2,5-кратный прирост производительности по сравнению с Blackwell — без необходимости жидкостного охлаждения.

Это всего лишь предположения, но у нас есть смутное подозрение, что мы увидим нечто подобное во время торжеств на следующей неделе.

Несколько ядер Vera, действительно мощных

Наряду с новейшими дата-центрными GPU мы ожидаем получить больше подробностей о автономном ЦП Vera от Nvidia.

Впервые представленный на GTC в прошлом году, Vera оснащен 88 настраиваемыми ядрами Arm, которые добавляют поддержку многопоточности и целый ряд функций конфиденциальных вычислений, ранее доступных только на платформах x86.

До сих пор мы видели ЦП только в составе суперчипа Vera-Rubin от Nvidia. Однако позже мы узнали, что Nvidia будет предлагать этот чип в качестве автономного процессора, который будет конкурировать с Intel и AMD в некоторых основных приложениях.

Ранее Nvidia предлагала суперчипы Grace CPU, но они предназначались в первую очередь для использования в суперкомпьютерах и других HPC-приложениях. Однако в прошлом месяце гигант GPU сообщил, что Meta* станет ее первым партнером по масштабному развертыванию Grace, и что Социальная сеть уже оценивает ЦП Vera для использования в своих дата-центрах.

Установка ожиданий

Наряду с новым кремнием для дата-центров мы также ожидаем, что Хуанг поделится более подробной информацией о стойках Kyber следующего поколения и графических процессорах Feynman, которые должны дебютировать в 2027 и 2028 годах.

Мы впервые увидели Kyber на прошлогодней GTC. Этот 600-киловаттный монстр должен вместить 144 сокета GPU, каждый с четырьмя кристаллами GPU Rubin Ultra, в стандартном форм-факторе стойки.

Nvidia раскрыла существование Kyber отчасти потому, что операторы дата-центров уже испытывали трудности с системами NVL72 мощностью 120 кВт, анонсированными годом ранее. Раскрыв информацию о Kyber, Nvidia подстегнула поставщиков физической инфраструктуры дата-центров, чтобы они могли обеспечить необходимое электропитание и системы охлаждения для поддержки такой системы к 2027 году. При ежегодном цикле выпуска Nvidia не может ждать, пока остальная отрасль догонит — она должна заранее сигнализировать о своем следующем шаге на годы вперед.

Поскольку до Feynman осталось всего два года, мы полагаем, что Хуанг может повторить этот эксперимент, установив новые целевые показатели по мощности и охлаждению, которые, вероятно, превысят мегаватт на стойку.

Подарит ли Nvidia что-нибудь геймерам?

Давно ходят слухи, что Nvidia работает над системой на кристалле на базе Arm для ПК.

Компонент, способный выполнять эту задачу, появился в прошлом году в виде систем DGX Spark и GB10, где он был задействован. Однако до сих пор OEM-производители использовали этот чип только в мини-ПК класса рабочих станций под управлением Linux. Недавние сообщения указывают на то, что Nvidia работает с такими компаниями, как Lenovo и Dell, над выводом аналогичного продукта на рынок ПК под управлением Windows.

Как мы сообщали ранее, Nvidia также сотрудничает с Intel для интеграции своих кристаллов GPU в процессоры следующего поколения Chipzilla.

GTC кажется подходящим моментом, чтобы порадовать геймеров и дать Nvidia новый рынок для освоения помимо ее побочных проектов на рынках профессиональной визуализации.

Интегрированная графика Nvidia может быть не тем, что многие надеялись увидеть на CES — видеокарты серии RTX 50 Super, — но, учитывая состояние рынка памяти, маловероятно, что они появятся на GTC.

The Claw, робототехника и все остальное

Помимо мощного оборудования и отдаленной возможности появления потребительского оборудования, можно не сомневаться, что OpenClaw станет главной темой обсуждения на GTC.

Дженсен Хуанг, по-видимому, очень благосклонно относится к агентному фреймворку, несмотря на его многочисленные уязвимости в области безопасности , и, по сообщениям, называет его «самым важным программным релизом, вероятно, за всю историю».

По имеющимся данным, компания работает над собственной, предположительно более безопасной версией платформы под названием NemoClaw.

Кстати о «когтях», мы также ожидаем увидеть на сцене немало роботов. С момента анонса своей платформы для робототехники Isaac GR00T почти два года назад Nvidia выпустила постоянный поток новых наборов инструментов, фреймворков и аппаратных платформ для разработки, направленных на придание физической формы генеративному ИИ.

И чтобы научить их функционировать в непредсказуемом мире, можно рассчитывать на еще одно появление платформы цифровых двойников Omniverse от Nvidia. Представленная в 2019 году во времена растущего ажиотажа вокруг Метавселенной, платформа была нацелена на создание виртуальной среды, в которой физические процессы могли бы моделироваться в цифровом мире до их реализации в реальной жизни.

С тех пор разработчики интегрировали Omniverse в различные симуляционные платформы, в том числе те, которые используются для проектирования и построения ИИ-ферм.

El Reg будет на месте в Сан-Хосе на следующей неделе на GTC, чтобы предоставить вам последние новости с этой конференции, ставшей одной из самых ожидаемых технологических в мире. ®

Facebook*, Instagram* и WhatsApp* принадлежат компании Meta* Platforms Inc., деятельность которой признана экстремистской и запрещена на территории Российской Федерации.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Похожие новости: