В условиях, когда ограничения на передовые инструменты EUV-литографии создают препятствие для традиционного масштабирования чипов, китайские компании, занимающиеся разработкой ИИ-ускорителей, ускоряют внедрение технологий 3D-стекинга и гибридного соединения (hybrid bonding) как альтернативного пути к повышению производительности. Эта стратегия, которую участники отрасли называют «обгоном по кривой», направлена на достижение сопоставимой плотности вычислений для ИИ посредством вертикальной интеграции, а не миниатюризации транзисторов.
Компания Suanmiao Technology, отечественный стартап в области ИИ-чипов с 3D-архитектурой, недавно представила свою концепцию TokenPU — процессор, изначально спроектированный для обработки токенов при инференсе больших языковых моделей. Продукт первого поколения компании, A4E, уже запущен в производство, используя 8-слойную стопку DRAM-кристаллов, вертикально интегрированную поверх логического вычислительного кристалла с применением сквозных кремниевых переходных отверстий (TSV) и технологии микровыступов (micro-bump).
По словам Ван Фуцюаня, основателя и генерального директора Suanmiao Tech, этот подход сокращает расстояние передачи данных на два порядка по сравнению с традиционными межчиповыми соединениями на уровне миллиметров, обеспечивая пропускную способность памяти в 16–32 ТБ/с — примерно в четыре раза больше, чем у B200 от NVIDIA. «Основная проблема в эпоху больших моделей — это не сам вычислительный блок, а узкое место пропускной способности памяти», — заявил Ван в интервью EEWorld, отметив, что графические процессоры NVIDIA H100 тратят до 70% времени инференса в простое, ожидая перемещения данных из памяти.
Lingchuan Technology, подразделение Kuaishou, занимающееся разработкой чипов, также завершило в апреле выпуск (tape-out) своего чипа следующего поколения, используя полностью отечественный подход 3D-стекинга с новой архитектурой 3D near-memory. Их первый чип, SL200, разошелся тиражом около 100 000 единиц и используется в Kuaishou, Alibaba Cloud, Baidu Cloud и Bilibili, обрабатывая 99,7% рабочих нагрузок по прямому перекодированию Kuaishou.
Rockchip, известная китайская fabless-компания по производству полупроводников, представила свою серию сопроцессоров для ИИ RK182X — первый в отрасли ИИ-чип в 3D-стекированном корпусе от отечественного производителя. RK1820 обеспечивает 20 TOPS при пропускной способности памяти 2,5 ГБ, а RK1828 достигает 5 ГБ. Rockchip заявляет, что пропускная способность примерно в 30 раз выше, чем у их флагманского RK3588, что снижает энергопотребление при передаче данных, обеспечивая при этом высокую производительность и низкую задержку.
Tsingway, лидер в области реконфигурируемых вычислений, созданный на базе Университета Цинхуа, также с 2019 года разрабатывает 3D-реконфигурируемую ИИ-архитектуру, обладая обширным портфелем патентов как в Китае, так и в США. Компания сотрудничает с Университетом Цинхуа, Пекинской академией искусственного интеллекта (BAAI) и Zhipu AI для построения отечественной экосистемы ИИ вокруг технологии 3D-чипов.
Отраслевой консенсус гласит, что 3D hybrid bonding представляет собой единственный готовый к производству путь для значительного повышения эффективности ИИ-вычислений в текущей геополитической обстановке. Генеральный директор Suanmiao Ван назвал это «единственным реалистичным решением до того, как созреют технологии следующего поколения, такие как оптические вычисления или вычисления в памяти (compute-in-memory)».
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Pandaily




