Компания Z.ai из Китая утверждает, что обучила свою модель, используя исключительно аппаратное обеспечение Huawei.

zhipu ai,huawei,glm-image,ии-модели,ascend,китай

Китайская компания Zhipu AI представила модель GLM-Image, обученную исключительно на оборудовании Huawei, включая процессоры Ascend. Это первый подобный случай использования полностью отечественной платформы. Однако детали о количестве используемого оборудования и скорости обучения не раскрыты, что не дает оснований полагать, что Nvidia стоит опасаться.

Китайский разработчик Zhipu AI заявляет, что обучил новую модель полностью на оборудовании компании Huawei, и что это первая компания, создавшая передовую модель исключительно на китайской аппаратной базе.

Zhipu, работающая под брендом Z.ai и предлагающая чат-бот по этому адресу, представляет несколько моделей под общим названием General Language Model (GLM). В среду компания анонсировала GLM-Image, которая, по их утверждению, использует «самостоятельно разработанную гибридную архитектуру «авторегрессия + диффузионный декодер», позволяющую совместно генерировать изображения и языковые модели». Это представляет собой важный шаг вперед по сравнению с их предыдущей моделью для генерации изображений Nano Banana Pro.

В сообщении также говорится, что Z.ai разработала эту модель с использованием сервера Huawei Ascend Atlas 800T A2, который способен работать на четырех процессорах Kunpeng 920, оснащенных либо 64, либо 48 ядрами. Процессоры Huawei используют ядра Arm собственной разработки.

Серверы также задействуют ИИ-процессоры Huawei Ascend 910.

Самая новая модель Ascend — 910C 2025 года, о которой Huawei заявляет, что она «может достигать около 800 TFLOPS вычислительной мощности на карту при точности FP16, что составляет примерно 80% вычислительной мощности чипа H100 от NVIDIA (выпущенного в 2022 году)».

На маркетплейсе моделей Hugging Face Zhipu описывает архитектуру GLM-Image как состоящую из двух элементов:

  • Авторегрессионный генератор: модель с 9 миллиардами параметров, инициализированная из GLM-4-9B-0414, с расширенным словарем для включения визуальных токенов. Модель сначала генерирует компактное кодирование из примерно 256 токенов, а затем расширяет его до 1K–4K токенов, что соответствует выводу изображений высокого разрешения в размере 1K–2K пикселей.
  • Диффузионный декодер: 7-миллиардный декодер на основе однопоточной архитектуры DiT для декодирования изображений в латентном пространстве. Он оснащен текстовым модулем Glyph Encoder, который значительно улучшает точный рендеринг текста внутри изображений.

Компания заявляет, что «весь процесс от предварительной обработки данных до крупномасштабного обучения» проходил с использованием этого сервера Atlas, и дебют модели доказывает «жизнеспособность обучения передовых моделей на отечественной полностековой вычислительной платформе».

И в некотором смысле это так. Однако Zhipu не раскрыла, сколько серверов или ускорителей было использовано для создания GLM-Image, и насколько быстро была выполнена работа.

Таким образом, компания может заявить о разработке модели с использованием местных технологий — уловка, которая игнорирует вклад Arm в процессоры Kunpeng — но не дала никаких намеков на то, обеспечило ли оборудование Huawei необходимую скорость или экономичность, чтобы остальной мир должен был обратить на это внимание, поскольку Китай совершил прорыв.

Даже если установка Zhipu работала на скромных скоростях, новость о полностью китайской модели остается значимой, учитывая прогнозы экспертов о том, что многие будущие модели будут относительно небольшими разработками, предназначенными для нишевых областей. Если Китай теперь обладает возможностью создавать такие модели без оборудования от Nvidia или AMD, это представляет угрозу для будущих доходов этих компаний-разработчиков чипов.

Еще одна угроза для двух гигантов в области графических процессоров — это строгие экспортные ограничения, объявленные вчера, согласно которым Вашингтон будет рассматривать каждую заявку на продажу определенных графических процессоров китайским покупателям.

GLM-Image является открытым исходным кодом и свободно доступна. The Register упоминает, что в свете мнения аналитического центра ASPI о том, что Китай использует ИИ для экспорта своей культуры и ценностей, и рекомендаций странам «предотвратить формирование мировых технологических экосистем и закрепление цифрового авторитаризма с помощью китайских ИИ-моделей, норм управления и промышленной политики». ®

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.