Инвестиционный банк Morgan Stanley полагает, что, хотя строительство дата-центра на графических процессорах NVIDIA Blackwell обходится вдвое дороже, чем на специализированных интегральных схемах для ИИ-приложений (ASIC), энергоэффективность вычислений чипов NVIDIA также значительно выше, чем у кастомных чипов. Высокая стоимость новейших ИИ-GPU от NVIDIA является острой рыночной темой, при этом генеральный директор Дженсен Хуанг неоднократно заявлял, что, хотя его чипы дороги, они обеспечивают большую долгосрочную отдачу.
Производительность вычислений NVIDIA на ватт до 8 раз выше, чем у кастомных ИИ-чипов, заявляет Morgan Stanley
В своем недавнем обзоре Morgan Stanley сравнивает производительность в TFLOPS (триллионы операций с плавающей запятой в секунду) на ватт различных ИИ-GPU от NVIDIA с кастомными ИИ-ASIC, предлагаемыми Amazon и Google. Банк отмечает, что капитальные затраты гиперскейлеров на строительство дата-центра мощностью один гигаватт на ИИ-GPU Blackwell от NVIDIA вдвое выше по сравнению со строительством того же дата-центра на тензорных процессорах (TPU) от Google или чипах Trainium от Amazon.
Однако в отчете добавляется, что инвестиции в чипы NVIDIA оправданы, поскольку они обеспечивают более высокую эффективность вычислений. По оценкам Morgan Stanley, производительность на ватт чипов NVIDIA «на 2–8 раз опережает кастомные ASIC».

Чипы Rubin от NVIDIA значительно превосходят кастомные ИИ-чипы Amazon и Google, заявляет Morgan Stanley
На слайде инвестиционного банка, сопровождающем отчет, рассчитывается производительность в TFLOPs на ватт ИИ-GPU NVIDIA Vera Rubin (FP4), Vera Rubin (FP8), GB300 (FP8) и H100 (FP8). Естественно, Vera Rubin (FP4) является самым производительным GPU в списке, поскольку его показатель составляет 19,5. Для остальных чипов показатели составляют 6,8, 6,0 и 3,1 соответственно. С другой стороны, TFLOPs на ватт для чипов Google TPUv7 (FP8) и Trn3 (FP8) составляют 4,3 и 2,5 соответственно, что ставит их производительность либо между GPU поколений Blackwell и Hopper, либо ниже чипов Hopper.
Хотя чипы NVIDIA обеспечивают наилучшую производительность на ватт, пользователи также переключаются на другие метрики. Например, по мнению эксперта из провайдера ИИ-инфраструктуры Nebius, ИИ-чипы также оцениваются по стоимости за миллион сгенерированных токенов относительно почасовой стоимости работы GPU. По оценкам Nebius, ИИ-чипы Groq стоят от пяти до десяти центов за токен, в то время как чипы Blackwell от NVIDIA — 25 центов за токен. Чипы Groq также предположительно способны выдавать до 800 токенов в секунду, что значительно выше 450 токенов в секунду у чипов NVIDIA.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Ramish Zafar




