Nvidia обновляет дорожную карту для дата-центров: процессоры Rosa и многослойные графические процессоры Feynman

Nvidia Gpu цод Feynman Rosa Nvlink tomshardware.com

Nvidia публикует дорожную карту для ЦОД на 2026–2028 годы с Rosa CPU, Feynman GPU, оптическими NVLink и Groq LPU с NVFP4 и NVLink. — tomshardware.com

На этой неделе на конференции GPU Technology Conference компания Nvidia представила обновленную дорожную карту продуктов для центров обработки данных, раскрыв несколько сюрпризов, но в основном подтвердив, что компания движется по графику выпуска совершенно новой архитектуры GPU каждые пару лет и ежегодного обновления семейства AI GPU. Как выяснилось, Nvidia намерена использовать технологию укладки кристаллов (die stacking) и пользовательскую память HBM со своими будущими GPU Feynman, которые будут сопровождаться процессорами Rosa CPU, ранее не упоминавшимися в дорожной карте.
Как и ожидалось, в этом году Nvidia планирует выпустить платформу Vera Rubin на базе процессора Vera CPU и графического процессора Rubin GPU. Ее дополнят пять дополнительных процессоров, включая ускоритель инференса с низкой задержкой Groq LP30, блок обработки данных (DPU) BlueField-4, коммутатор NVLink-6, Ethernet Spectrum-X с соупакованной оптикой (co-packaged optics) и SuperNIC ConnectX 9 1600G.
Платформа Vera Rubin интересна не только новыми архитектурами CPU и GPU, но и тем, что Nvidia интегрирует LPU от Groq в свой аппаратный портфель. Более того, похоже, что компания отдает предпочтение LPU перед собственными процессорами Rubin CPX до такой степени, что последние больше не упоминаются в дорожной карте.
В следующем году компания планирует обновить свои предложения ускорителями искусственного интеллекта Rubin Ultra, которые будут оснащены четырьмя вычислительными чиплетами и 1 ТБ памяти HBM4E, что значительно повысит производительность по сравнению с Rubin этого года. Кроме того, эти GPU-ускорители будут сопряжены с LPU Groq LP35, который будет поддерживать формат данных NVFP4 и, следовательно, улучшит производительность.
Еще одно ощутимое повышение производительности для AI-платформ Nvidia — это внедрение стоечного решения Kyber NVL144, которое будет содержать 144 пакета GPU Rubin Ultra (обеспечиваемых коммутатором NVLink 7) и, таким образом, предложит как минимум 4-кратное увеличение производительности по сравнению со стойками Oberon NVL72 с 72 пакетами Blackwell GPU.
Портфель Nvidia для центров обработки данных улучшится в 2027 году за счет увеличения количества GPU на стойку (т. е. количественные улучшения) и внедрения нового LPU с поддержкой NVFP4. Продукты компании для центров обработки данных в 2028 году будут основаны на совершенно новых архитектурах, которые принесут качественные улучшения ее продуктам.
«Следующее поколение после этого — Feynman», — заявил генеральный директор Nvidia Дженсен Хуанг на GTC. «Feynman, конечно, имеет новый GPU; он также имеет новый LPU LP40 […] теперь объединяя масштабы Nvidia и Groq, мы строим LP40, это будет невероятно. Совершенно новый процессор под названием Rosa, сокращение от Rosalyn, Bluefield-5, который соединяет следующий CPU со следующим SuperNIC CX10. У нас будет Kyber, который масштабируется с помощью меди, и у нас будет Kyber CPO для масштабирования. Таким образом, впервые мы будем масштабироваться как с помощью меди, так и с помощью соупакованной оптики».
Во-первых, дата-центровый GPU Feynman от Nvidia примет технологию укладки кристаллов (die stacking), что откроет для компании новый способ масштабирования производительности. Во-вторых, GPU Feynman также будут использовать пользовательскую высокоскоростную память (скорее всего, вариант C-HBM4E), что, вероятно, позволит Nvidia увеличить емкость HBM свыше 1 ТБ на пакет GPU и повысить пропускную способность памяти.
В-третьих, платформы Feynman будут работать на процессорах Rosa CPU — процессорах Nvidia следующего поколения, разработанных собственными силами с акцентом на максимальную однопоточную производительность. Появление Rosa показывает, что компания сократила цикл разработки своего CPU с четырех до двух лет (вероятно, за счет привлечения новой команды разработчиков), поставив себя в один ряд с ведущими разработчиками CPU AMD и Intel, которые склонны выпускать новые микроархитектуры каждые пару лет.
В-четвертых, эта платформа также будет интегрировать LPU LP40, который будет не только поддерживать формат Nvidia NVFP4, но и подключаться к другим системным компонентам с использованием протокола NVLink, тем самым интегрируя оборудование Groq с GPU Nvidia.
В-пятых, платформа Feynman станет первой, которая примет коммутаторы NVLink с соупакованной оптикой (co-packaged optics), что позволит реализовать оптические межсоединения с использованием протокола NVLink (они не невозможны сегодня, но CPO делает их реализацию значительно проще и дешевле). Оптические межсоединения позволят Nvidia увеличить максимальный размер масштабируемых стоечных решений до 576 пакетов GPU (используя шасси Oberon) или даже до 1152 пакетов GPU (используя шасси Kyber), что сделает стоечные системы компании еще более конкурентоспособными по сравнению с альтернативными решениями, такими как AMD Instinct или пользовательские ускорители, развернутые гиперскейлерами, чем они являются сегодня.
Наконец, Nvidia планирует представить в 2028 году DPU BlueField 5, Ethernet SpectrumX 7-го поколения с соупакованной оптикой, а также SuperNIC ConnectX 10.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Похожие новости: