Bingbi AI открывает исходный код BitCPM-CANN: 1,58-битное обучение стало возможным на отечественных вычислительных мощностях

Bingbi Ai Bitcpm-Cann 1.58-бит ии-ускорители квантование память pandaily.com

Bingbi AI открыла исходный код BitCPM-CANN — фреймворка для обучения с точностью 1,58 бита на отечественных ускорителях ИИ, что снижает требования к памяти при инференсе до шести раз по сравнению с полной точностью. — pandaily.com

Компания Bingbi AI открыла исходный код BitCPM-CANN — полноценного фреймворка для обучения, который позволяет проводить обучение моделей с точностью 1,58 бита на отечественных ускорителях искусственного интеллекта, что, по сообщениям, снижает требования к памяти при инференсе до шести раз по сравнению с обучением в полной точности.

Сроки имеют значение: в 2026 году наблюдается резкий скачок цен на память HBM — ключевой компонент для обучения ИИ, — стоимость которой выросла более чем на 165% в годовом исчислении, что сделало пропускную способность памяти одним из самых дорогих и дефицитных ресурсов для масштабного обучения моделей. На этом фоне методы обучения с экстремально низкой разрядностью, такие как 1,58 бита, привлекли пристальное внимание как академических исследователей, так и отраслевых специалистов, поскольку они обещают резкое снижение потребления памяти без пропорциональной потери точности модели.

BitCPM-CANN примечателен тем, что является одним из первых полных конвейеров обучения — а не просто архитектурой модели — который демонстрирует практическую осуществимость обучения с точностью 1,58 бита на отечественных китайских ускорителях ИИ, включая Huawei Ascend и другие внутренние вычислительные платформы. Это важно, поскольку экспортные ограничения ограничили доступ китайских компаний к высокопроизводительным чипам NVIDIA, подталкивая отрасль к использованию отечественных альтернатив, которые сталкиваются с собственными ограничениями по пропускной способности памяти и вычислениям.

«CANN» в названии BitCPM-CANN означает Compute Architecture for Neural Networks (Вычислительная архитектура для нейронных сетей), что указывает на тесную интеграцию с конкретными архитектурами отечественных ИИ-чипов. Релиз с открытым исходным кодом от Bingbi AI включает полный код обучения, предварительно обученные контрольные точки (checkpoints) и оценочные бенчмарки, что позволяет другим исследователям и компаниям воспроизводить результаты на собственном оборудовании.

Для экосистемы ИИ Китая практические последствия весьма значительны. Если обучение с точностью 1,58 бита будет подтверждено в масштабе, это может существенно снизить «узкое место» в памяти, которое сдерживало разработку моделей для компаний, не имеющих доступа к новейшему аппаратному обеспечению с высокой пропускной способностью. Фреймворк также продвигает более широкую отраслевую дискуссию о квантовании с учетом обучения (quantization-aware training) и инференсе с экстремально низкой точностью как о реальных альтернативах традиционной парадигме полной точности.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Похожие новости: