Китай настойчиво ищет пути, чтобы прорваться в экосистему CUDA от NVIDIA, и одно из предложенных обходных решений, безусловно, заслуживает особого внимания.
Официальное лицо полупроводниковой отрасли Китая советует отечественной индустрии ИИ перейти к программно-определяемым чипам
Когда Дженсена спрашивают о главной причине доминирования NVIDIA в индустрии ИИ, он всегда называет CUDA «самым сильным рвом», заявляя, что именно постоянная работа по развитию программной экосистемы отличает «Зеленую команду» от других. Похоже, Китай обеспокоен зависимостью своей отрасли от CUDA, поэтому Вэй Шаоцзюнь, руководитель Китайской ассоциации полупроводниковой промышленности, заявляет, что Пекину следует разработать альтернативы CUDA и другим компонентам, поставляемым с Запада.
Даже если наша собственная технология на начальном этапе будет недостаточно хороша, ее все равно необходимо использовать. Метод проб и ошибок может не увенчаться успехом, но без попыток мы, безусловно, отстанем.
– Вэй Шаоцзюнь
Говоря конкретно о CUDA, Шаоцзюнь считает, что Китаю, вероятно, следует прекратить фокусироваться на создании прямой альтернативы этому программному обеспечению и вместо этого принять стратегию, которая мало обсуждалась. Он предлагает идею «программно-определяемого чипа» (SDC), где акцент делается на переносе вычислительного интеллекта на программное обеспечение, а не на предварительно заданной аппаратной конфигурации. В настоящее время разработчики склонны использовать CUDA из-за зрелости экосистемы, что косвенно привязывает их к аппаратному обеспечению NVIDIA. Однако SDC меняет правила игры, и о том, как это будет реализовано, мы поговорим далее.

С SDC разработчикам не понадобится уровень «CUDA» для выполнения вычислений; вместо этого чипы конфигурируются с помощью реконфигурируемой сетки, которая использует битовый поток конфигурации, генерируемый компилятором. Проще говоря, это означает, что ни компилятор, ни представление кода на уровне исходного кода не зависят от ISA; вместо этого оно гораздо более гибкое. По сравнению с графическими процессорами, которые работают через выделенный планировщик, SDC полагаются на детерминированную компиляцию, что означает отслеживание каждого перемещения данных вплоть до тактового цикла.
По мнению профессора Вэй Шаоцзюня, накладные расходы на создание переводных слоев и независимых экосистем, стремящихся повторить успех CUDA, слишком высоки, и он предполагает, что путь SDC является жизнеспособной ставкой для Китая. Если вы уже поняли, зависимость SDC от компилятора делает это начинание «кошмаром», поскольку это включает в себя проблемы маршрутизации и ветвления, а также структурные изменения, идущие вразрез с нормами аппаратной инженерии. Популярными примерами SDC являются блоки RDU от SambaNova и LPU от Groq, но они разработаны для дополнения конкретных рабочих нагрузок, а не для полной замены графических процессоров.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Muhammad Zuhair




