Nvidia только что анонсировала RTX Spark — это технология для ИИ-серверов, которая проникает в потребительский сегмент: процессор Grace (20 ядер), графический процессор Blackwell (6144 ядра CUDA) и 128 ГБ памяти LPDDR5X. А теперь о том, что ждет серверы — и, возможно, однажды, потребительские устройства.
Новый процессор Vera — это процессорная часть платформы Vera Rubin, второй частью которой является графический процессор Rubin. Vera обещает среднее ускорение в 1,8 раза по сравнению с «ведущими x86-процессорами» (Nvidia не назвала их прямо).

Vera — это нечто грандиозное: он имеет 88 ядер Olympus (на базе набора инструкций ARM) с пространственной многопоточностью (Spatial Multithreading), обеспечивающей 176 потоков на сокет. Процессор может быть сопряжен с объемом оперативной памяти LPDDR5X до 1,5 ТБ, которая способна обеспечить колоссальную пропускную способность в 1,2 ТБ/с, что критически важно для инференса ИИ.
Vera может использоваться как автономный ЦП для агентивных ИИ-нагрузок, обучения с подкреплением, обработки данных и аналитики. Nvidia даже разработала стойку Vera CPU Rack, вмещающую 256 процессоров, что составляет 22 528 ядер и 45 056 потоков (ого!).

В качестве альтернативы Vera может выступать в роли хост-процессора, используемого совместно с графическими процессорами Rubin. Например, в NVIDIA Vera Rubin NVL72 установлено 36 процессоров Vera и 72 графических процессора Rubin. Процессоры и графические процессоры могут обмениваться данными со скоростью 1,8 ТБ/с с использованием интерконнекта Nvidia NVLink-C2C.
Nvidia уже заручилась поддержкой ключевых клиентов: Anthropic (Claude), OpenAI (ChatGPT) и SpaceXAI (Grok) будут использовать процессоры Vera, как и гиперскейлеры, такие как ByteDance, CoreWeave и Oracle Cloud Infrastructure.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Peter




