HPE активно поддерживает rack‑scale‑архитектуру Helios от AMD и предложит её в составе своего портфеля ИИ уже в следующем году, включая специально разработанный масштабный коммутатор Juniper Networks.
Объявлено перед событием HPE Discover в Барселоне на этой неделе, компания заявила, что станет одной из первых, кто предложит готовую rack‑систему для крупномасштабных задач обучения и вывода ИИ, основанную на референс‑дизайне AMD.
Helios предназначен для работы полной стойки с узлами, оснащёнными ускорителями, как если бы они были одним большим GPU, подобно системе Nvidia DGX GB200 NVL72, к которой Helios позиционируется как конкурент.
С точки зрения AMD, Helios станет площадкой для её новых графических процессоров Instinct MI455X и 6‑го поколения процессоров EPYC под кодовым названием Venice, оба из которых появятся в следующем году, поэтому HPE может лишь сказать, что предложит Helios AI Rack по всему миру где‑то в 2026 году.
Сетевое решение для этой системы будет масштабной Ethernet‑реализацией, использующей UALink поверх Ethernet, с применением специально разработанного коммутатора Juniper Networks на базе сетевого кремния Broadcom Tomahawk 6, обеспечивающего суммарную пропускную способность 102,4 Тбит/с.
UALink, или Ultra Accelerator Link, представляет собой открытый стандарт, альтернативный технологии NVLink от Nvidia, для соединения кластеров GPU; спецификации были опубликованы в начале этого года.
Однако, судя по всему, HPE и Broadcom, которые также работают над разработкой масштабного коммутатора, считают, что нет необходимости строить сеть на реальном оборудовании UALink, если протокол можно запустить поверх Ethernet — именно так и происходит в данном случае.
«Это первое в отрасли масштабное решение, использующее обычный Ethernet. Это 100 % открытый стандарт, который исключает проприетарную привязку к поставщикам, опирается на проверенные сетевые технологии HPE Juniper, обеспечивая масштабируемость и оптимальную производительность для ИИ‑нагрузок», — сказал Рами Рахим, президент и генеральный директор подразделения сетей HPE и бывший CEO Juniper Networks до её приобретения.
HPE утверждает, что это позволит их rack‑scale‑системе поддерживать трафик, необходимый для обучения моделей с триллионными параметрами, а также обеспечить высокий пропускной потенциал вывода.
Helios базируется на двойной ширине спецификаций Open Rack Wide (ORW), разработанных Meta в рамках Open Compute Project (OCP). Он поддерживает модульные лотки, имеет возможность жидкостного охлаждения и подходит для энерго‑ограниченных сред, согласно Рахиму.
С 72 графическими процессорами Instinct MI455X на одну стойку, HPE сообщает, что их rack‑scale‑система будет способна обеспечить суммарную пропускную способность 260 ТБ/с и до 2,9 ексaFLOPS вычислительной мощности в 4‑битном формате для обработки крупных ИИ‑моделей.
Естественно, такая система не будет дешёвой: аналогичные сборки Nvidia‑конкурента GB200 NVL72, по сообщениям, стоят почти 3,5 млн долларов каждая. Возможно, не удивительно, что HPE ориентирует этот комплект в первую очередь на облачных провайдеров и нео‑облака, а не на корпоративных клиентов. ®
Автор – Dan Robinson





