Прорывной анализ на уровне трассировки, проведенный исследовательской фирмой с Уолл-стрит SemiAnalysis, показал, что ускоритель искусственного интеллекта DeepSeek V4 и Huawei Ascend 950DT были совместно спроектированы с нуля, что опровергает преобладающее предположение о том, что модель была лишь адаптирована для работы на отечественных китайских чипах после разработки.
Это открытие объясняет, как DeepSeek удалось снизить цены на свой API V4-Pro на 75 процентов, доведя стоимость инференса миллиона токенов всего до 0,20 юаня — примерно в 50 раз дешевле, чем у конкурирующих предложений Anthropic, — при сохранении операционной прибыльности. SemiAnalysis обнаружила, что программный стек Huawei CANN 8.5 и уникальная двухкристальная архитектура UMA Ascend 950DT с четырьмя специализированными исполнительными блоками были изначально созданы с учетом паттернов инференса DeepSeek.
950DT, имеющий кодовое название David в исходном коде Huawei CANN, оснащен памятью HiZQ 2.0 с емкостью 144 ГБ и пропускной способностью 4 ТБ в секунду, а также доступом к унифицированной памяти с двумя кристаллами. Его технология MC-squared объединяет коммуникационные примитивы и вычисления в единые ядра, устраняя узкое место передачи данных, которое традиционно ограничивает производительность инференса ИИ на платформах конкурентов.
Результаты разительны: только CUDA и CANN обеспечили полную поддержку инференса DeepSeek V4 с первого дня. AMD ROCm выдавал всего от одной до двух токенов в секунду, в то время как NVIDIA TRT-LLM страдал от скрытой ошибки повреждения памяти, которую потребовались недели для диагностики. Доля токен-трафика DeepSeek подскочила с менее чем одного процента до 17 процентов в мае 2026 года, обогнав OpenAI и заняв третье место по метрикам Vercel AI Gateway. Этот рост отражает совокупное влияние резко сниженных цен и надежной инфраструктуры инференса.
ByteDance зарезервировала половину производственных мощностей Ascend 950, при этом Alibaba и Tencent также заказали десятки тысяч единиц. China Mobile приобрела 776 узловых комплектов Ascend, что составляет 6 208 ускорителей. Развертывание Ascend 950DT в облаке на Huawei Cloud запланировано на август 2026 года, что сигнализирует о необратимом сдвиге от доминирования NVIDIA в сторону отечественной китайской инфраструктуры ИИ для крупномасштабного инференса моделей.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Pandaily




