Китайские технологические гиганты, такие как Alibaba и ByteDance, все чаще проводят обучение своих самых передовых моделей искусственного интеллекта в Юго-Восточной Азии, используя зарубежные центры обработки данных, оснащенные высокопроизводительными графическими процессорами Nvidia. Об этом сообщает Financial Times. Этот сдвиг отражает то, как ведущие лаборатории искусственного интеллекта в Китае обходят экспортный контроль США, арендуя вычислительные мощности у некитайских операторов, базирующихся в Сингапуре и Малайзии.
За последний год большие языковые модели Alibaba Qwen и ByteDance Doubao вошли в высший эшелон мировых LLM. Утверждается, что обе модели были обучены, по крайней мере частично, с использованием ускорителей Nvidia, расположенных в оффшорных кластерах.
Операторы из Сингапура сообщили FT, что спрос со стороны китайских фирм вырос с апреля, когда администрация Трампа ввела более жесткое эмбарго на H20 и другие экспортно-совместимые чипы Nvidia, но вскоре после этого так называемое “правило диффузии”, предназначенное для блокировки зарубежной аренды, было отменено в рамках пересмотренной политики.
Экспортный контроль США в настоящее время запрещает Nvidia продавать свои самые передовые графические процессоры напрямую в Китай, и Китай соблюдает это правило. Однако аренда вычислительных мощностей у принадлежащих иностранцам центров обработки данных за рубежом — даже если конечным пользователем является китайская компания — остается законной в соответствии с действующими правилами.
Уведомление от мая 2025 года, известное как “правило распространения ИИ”, которое рассматривало бы такие договоренности как косвенные нарушения экспортного запрета, было отменено. Фактически, это позволяет компаниям использовать ускорители класса H100 и A100 за пределами Китая, при условии, что оборудование принадлежит и управляется лояльной третьей стороной.
ByteDance и Alibaba — не единственные фирмы, идущие по этому пути, но они представляют собой наиболее заметные примеры. Их договоренности позволяют им обучать новые модели с целевыми показателями производительности наравне с западными лабораториями ИИ. Полученные веса затем можно запускать внутри Китая для логического вывода на кремнии, произведенном внутри страны. Китайские компании все чаще используют чипы Huawei и других местных поставщиков для обработки развертывания и взаимодействия с пользователем, на которые сейчас приходится все большая доля рабочих нагрузок ИИ.
Одним из исключений является DeepSeek, шанхайская фирма, которая накопила запчасти Nvidia до введения запрета США и продолжает обучение внутри Китая. Компания, которая, как считается, тесно связана с SenseTime, сотрудничает с Huawei для оптимизации будущих тренировок с использованием местного кремния.
В то время как учебные кластеры мигрируют за границу, частные данные по-прежнему не могут покидать Китай. Это ограничение означает, что тонкая настройка или переподготовка на основе данных китайских пользователей должна происходить внутри страны, даже если базовая модель была разработана за границей.
Автор – Luke James




