Гибридные аппаратные ускорители искусственного интеллекта в Китае могут составить конкуренцию графическим процессорам Nvidia Blackwell.

Китай,полупроводники,AI ускорители,Nvidia,CUDA

Китайские разработчики AI-ускорителей стремятся догнать передовые технологии, используя DRAM и чиплеты. Возможно ли это? Обзор амбициозных планов китайской полупроводниковой промышленности.

Вей Шаоцзюнь, вице-председатель Китайской ассоциации полупроводниковой промышленности и профессор Университета Цинхуа, заявил на отраслевом мероприятии, что ускорители искусственного интеллекта, состоящие из 14-нм логических чиплетов и DRAM на основе 18-нм техпроцесса, разработанные в Китае, могут соперничать с процессорами Blackwell от Nvidia, созданными с использованием специальной 4-нм техпроцесса в TSMC, сообщает .

Выступая на глобальном саммите ICC CEO, Вей Шаоцзюнь отметил, что ключом к прорыву в эффективности производительности станет передовая 3D-стекинг, используемая для создания китайских ускорителей.

Вей Шаоцзюнь, ранее заявивший, что , а затем призвал страну к , описал гипотетическое “полностью контролируемое внутреннее решение”, которое объединило бы 14-нм логику с 18-нм DRAM с использованием 3D-гибридной склейки. Нет никаких доказательств того, что такое решение существует или может быть построено с использованием технологий, доступных в Китае, поэтому речь носит строго гипотетический характер.

По словам Вея, эта гипотетическая конфигурация предназначена для приближения к производительности “4-нм графических процессоров” Nvidia, несмотря на использование устаревших технологий. Он считает, что такое решение может обеспечить производительность в 120 TFLOPS, не раскрывая конкретную точность. Кроме того, он утверждает, что оно будет потреблять всего около 60 Вт мощности, что обеспечит более высокую эффективность (2 TFLOPS на ватт) по сравнению с центральными процессорами Intel Xeon, по словам Вея. Для сравнения: процессор Nvidia B200 обеспечивает 10 000 TFLOPS NVFP4 при 1200 Вт, что составляет 8,33 TFLOPS NVFP4 на ватт. B300 обеспечивает 10,7 TFLOPS NVFP4 на ватт, что в пять раз выше, чем мог бы предложить несуществующий ускоритель искусственного интеллекта.

Ключевыми технологиями, которые должны значительно повысить эффективность гипотетического ускорителя искусственного интеллекта, разработанного в Китае, являются 3D-гибридная склейка (соединение медь-медь и оксидная склейка), которая заменяет паяные шарики прямыми медными соединениями с шагом менее 10 мкм, а также вычисления, приближенные к памяти. Гибридная склейка с шагом менее 10 мкм может обеспечить десятки и сотни тысяч вертикальных соединений на мм^2, а также сигнальные пути микрометрового масштаба для высокоскоростных соединений с низкой задержкой.

Одним из лучших примеров конструкции 3D-гибридной склейки является AMD 3D V-Cache, который обеспечивает пропускную способность 2,5 ТБ/с при энергии ввода-вывода 0,05 пДж/бит, поэтому Вей, вероятно, рассчитывает на аналогичный показатель для своего гипотетического проекта. 2,5 ТБ/с на устройство значительно выше, чем то, что может обеспечить HBM3E, поэтому это может стать прорывом для ускорителей искусственного интеллекта, которые полагаются на концепцию вычислений, приближенных к памяти. Вей также сказал, что эта концепция теоретически может быть масштабирована до уровня ZetaFLOPS, хотя он не указал, когда и как можно достичь таких уровней.

Вей определил платформу CUDA от Nvidia как ключевой риск не только для гипотетической альтернативы, которую он описал, но и для аппаратных платформ, отличных от Nvidia, поскольку после того, как программное обеспечение, модели и оборудование сойдутся на единой проприетарной платформе, альтернативные процессоры становится трудно развернуть. Имея в виду, что он представлял вычисления, приближенные к памяти, как способ значительно повысить конкурентоспособность оборудования искусственного интеллекта, разрабатываемого в Китае, любая альтернативная платформа, которая не полагается на эту концепцию (включая китайские ускорители искусственного интеллекта, такие как серии Huawei Ascend или графические процессоры Biren), может считаться проблемой.

Visited 1 times, 1 visit(s) today

Самое просматриваемое: