Что ждет китайский «open-source» ИИ: прогнозы и перспективы

ии китай открытый исходный код технологии модели ии technologyreview.com

MIT Technology Review изучает будущее ИИ. Китайские компании, такие как DeepSeek и Moonshot AI, выпускают мощные модели с открытым исходным кодом, которые конкурируют с западными аналогами по производительности, но значительно дешевле. Это меняет ландшафт инноваций в ИИ. — technologyreview.com

Серия статей MIT Technology Review «Что дальше» охватывает различные отрасли, тенденции и технологии, чтобы дать вам первое представление о будущем. Остальные статьи можно прочитать здесь.

Прошедший год стал поворотным моментом для китайского ИИ. С момента выпуска компанией DeepSeek в январе 2025 года своей модели рассуждений R1 китайские компании неоднократно представляли ИИ-модели, которые по производительности соответствуют ведущим западным разработкам, но при этом стоят значительно дешевле.

Буквально на прошлой неделе китайская фирма Moonshot AI выпустила свою последнюю модель с открытыми весами Kimi K2.5, которая по некоторым ранним бенчмаркам приблизилась к топовым проприетарным системам, таким как Claude Opus от Anthropic. Разница: K2.5 стоит примерно в семь раз дешевле Opus.

На платформе Hugging Face семейство моделей Qwen от Alibaba, после того как оно заняло первое место по количеству загрузок в 2025 и 2026 годах, обошло модели Llama от Meta* по совокупному числу загрузок. А недавнее исследование MIT показало, что китайские модели с открытым исходным кодом превзошли американские по общему количеству загрузок. Для разработчиков и инженеров по всему миру доступ к передовым возможностям ИИ еще никогда не был столь широким и доступным.

Однако эти модели по одному важному аспекту отличаются от большинства американских моделей, таких как ChatGPT или Claude, доступ к которым платный и которые нельзя изучить. Китайские компании публикуют веса своих моделей — числовые значения, которые устанавливаются при обучении модели, — поэтому любой желающий может их скачать, запустить, изучить и модифицировать.

Если эти модели ИИ с открытым исходным кодом будут продолжать совершенствоваться, они не только предложат самые дешевые варианты для тех, кто хочет получить доступ к передовым возможностям ИИ, но и изменят то, где происходит инновация, и кто устанавливает стандарты.

Вот что может произойти дальше.

Приверженность Китая открытому исходному коду сохранится

Когда DeepSeek выпустила R1, значительная часть первоначального шока была связана с ее происхождением. Внезапно китайская команда выпустила модель рассуждений, которая могла соперничать с лучшими системами из американских лабораторий. Однако долгосрочное влияние DeepSeek было связано не столько с национальностью, сколько со способом распространения. R1 была выпущена как модель с открытыми весами под разрешительной лицензией MIT, позволяющей любому скачивать, изучать и развертывать ее. Кроме того, DeepSeek опубликовала статью с подробным описанием процесса и методов обучения. Для разработчиков, получающих доступ к моделям через API, DeepSeek также снизила цены по сравнению с конкурентами, предлагая доступ по цене, составляющей лишь часть стоимости OpenAI o1, ведущей проприетарной модели рассуждений того времени.

В течение нескольких дней после выпуска DeepSeek заменила ChatGPT как самое скачиваемое бесплатное приложение в американском App Store. Этот момент вышел за пределы кругов разработчиков и затронул финансовые рынки, вызвав резкую распродажу американских технологических акций, которая временно стерла около 1 триллиона долларов рыночной стоимости. Почти в одночасье DeepSeek превратилась из малоизвестной команды, поддерживаемой количественным хедж-фондом, в самый заметный символ стремления Китая к открытому исходному коду в области ИИ.

Решение Китая сделать ставку на открытый исходный код неудивительно. Страна обладает вторым по величине в мире центром ИИ-талантов после США, а также огромной и хорошо оснащенной технологической индустрией. После того как ChatGPT вышел на массовый рынок, китайский сектор ИИ пережил переосмысление и вышел из него с решимостью наверстать упущенное. Стратегия открытого исходного кода рассматривалась как самый быстрый способ сократить отставание путем привлечения разработчиков, распространения внедрения и установления стандартов.

Успех DeepSeek придал уверенности отрасли, которая долгое время привыкла следовать мировым стандартам, а не устанавливать их. «Тридцать лет назад ни один китаец не поверил бы, что они могут оказаться в центре глобальных инноваций», — говорит Алекс Ченглин Ву, генеральный директор и основатель Atoms, компании, занимающейся ИИ-агентами, и видный участник экосистемы открытого исходного кода в Китае. «DeepSeek демонстрирует, что при наличии солидного технического таланта, благоприятной среды и правильной организационной культуры возможно создавать работы мирового класса».

Прорыв DeepSeek не был первым успехом Китая в области открытого исходного кода. Qwen Lab от Alibaba уже много лет выпускает модели с открытыми весами. К сентябрю 2024 года, задолго до запуска DeepSeek V3, Alibaba заявляла, что глобальные загрузки превысили 600 миллионов. На Hugging Face Qwen составил более 30% всех загрузок моделей в 2024 году. Другие учреждения, включая Пекинскую академию искусственного интеллекта и ИИ-фирму Baichuan, также выпускали открытые модели еще в 2023 году.

Но с момента успеха DeepSeek эта область стремительно расширяется. Такие компании, как Z.ai (ранее Zhipu), MiniMax, Tencent, и растущее число небольших лабораторий выпустили модели, конкурентоспособные в задачах рассуждения, программирования и создания агентов. Увеличение числа способных моделей ускорило прогресс. Возможности, на внедрение которых в мир открытого исходного кода раньше уходили месяцы, теперь появляются за недели, а то и дни.

«Китайские ИИ-фирмы получили реальные выгоды от использования стратегии открытого исходного кода», — говорит Лю Чжиюань, профессор компьютерных наук в Университете Цинхуа и главный научный сотрудник стартапа в области ИИ ModelBest. «Выпуская сильные исследования, они создают репутацию и получают бесплатную рекламу».

Помимо коммерческих стимулов, говорит Лю, открытый исходный код приобрел культурный и стратегический вес. «В китайском сообществе программистов открытый исходный код стал политически корректным», — говорит он, характеризуя это как ответ на доминирование США в области проприетарных систем ИИ.

Этот сдвиг отражается и на институциональном уровне. Университеты, включая Цинхуа, начали поощрять разработку ИИ и вклад в открытый исходный код, а политики предприняли шаги по формализации этих стимулов. В августе Государственный совет Китая опубликовал проект политики, поощряющей университеты вознаграждать работу в области открытого исходного кода, предлагая, чтобы вклад студентов на таких платформах, как GitHub или Gitee, в конечном итоге мог засчитываться как академический кредит.

Благодаря растущему импульсу и усиливающемуся циклу обратной связи, стремление Китая к моделям с открытым исходным кодом, вероятно, продолжится в ближайшей перспективе, хотя его долгосрочная устойчивость по-прежнему зависит от финансовых результатов, говорит Течжэнь Ван, который руководит работой по глобальному ИИ в Hugging Face. В январе модельные лаборатории Z.ai и MiniMax стали публичными компаниями в Гонконге. «Сейчас основное внимание уделяется увеличению общего объема, — говорит Ван. — Следующая задача — выяснить, как каждая компания получит свою долю».

Следующая волна моделей будет более узконаправленной — и лучшей

Китайские модели с открытым исходным кодом лидируют не только по объему загрузок, но и по разнообразию. Qwen от Alibaba стал одним из самых диверсифицированных семейств открытых моделей в обращении, предлагая широкий спектр вариантов, оптимизированных для различных задач. Ассортимент варьируется от легких моделей, которые могут работать на одном ноутбуке, до крупных систем с сотнями миллиардов параметров, предназначенных для развертывания в центрах обработки данных. Qwen включает множество вариантов, оптимизированных для конкретных задач, созданных сообществом: модели «instruct» хорошо справляются с выполнением команд, а варианты «code» специализируются на программировании.

Хотя эта стратегия не уникальна для китайских лабораторий, Qwen стал первым семейством открытых моделей, которое предложило так много высококачественных вариантов, что это начало ощущаться как полноценная продуктовая линейка — и при этом бесплатная в использовании.

Открытый характер этих релизов также облегчает адаптацию моделей другими разработчиками с помощью таких методов, как дообучение (fine-tuning) и дистилляция (distillation), то есть обучение меньшей модели имитировать большую. По данным ATOM (American Truly Open Models), проекта исследователя ИИ Нейтана Ламберта, к 4 августа 2025 года новые вариации моделей, производные от Qwen, составляли «более 40%» новых производных языковых моделей на Hugging Face, в то время как Llama упала примерно до 15%. Это означает, что Qwen стал базовой моделью по умолчанию для всех «ремиксов».

Эта тенденция подтверждает состоятельность идеи меньших, более специализированных моделей. «Вычислительные ресурсы и энергия — это реальные ограничения для любого развертывания», — говорит Лю. Он сообщил MIT Technology Review, что рост числа небольших моделей связан с удешевлением работы ИИ и упрощением доступа к нему для большего числа людей. Его компания ModelBest специализируется на небольших языковых моделях, предназначенных для локальной работы на таких устройствах, как телефоны, автомобили и другое потребительское оборудование.

Хотя средний пользователь может взаимодействовать с ИИ только через веб или приложение для простых бесед, продвинутые пользователи ИИ-моделей с некоторым техническим опытом экспериментируют с предоставлением ИИ большей автономии для решения масштабных задач. OpenClaw, ИИ-агент с открытым исходным кодом, который недавно стал вирусным в мире ИИ-хакеров, позволяет ИИ брать на себя управление вашим компьютером — он может работать круглосуточно, обрабатывая вашу электронную почту и рабочие задачи без присмотра.

OpenClaw, как и многие другие инструменты с открытым исходным кодом, позволяет пользователям подключаться к различным ИИ-моделям через интерфейс прикладного программирования, или API. В течение нескольких дней после выпуска OpenClaw команда сообщила, что Kimi K2.5 обошел Claude Opus и стал наиболее используемой ИИ-моделью — по количеству токенов, то есть он обрабатывал больше общего объема текста, полученного из запросов пользователей и ответов модели.

Стоимость стала основной причиной популярности китайских моделей, но было бы ошибкой считать их просто «подделками» западных передовых систем, предполагает Ван. Как и любой продукт, модель должна быть просто достаточно хорошей для выполнения поставленной задачи.

Ландшафт моделей с открытым исходным кодом в Китае также становится более специализированным. Исследовательские группы, такие как Shanghai AI Laboratory, выпустили модели, ориентированные на научные и технические задачи; несколько проектов от Tencent сосредоточены специально на генерации музыки. Ubiquant, фирма количественных финансов, подобная материнской компании DeepSeek High-Flyer, выпустила открытую модель, предназначенную для медицинских рассуждений.

Тем временем инновационные архитектурные идеи из китайских лабораторий получают более широкое распространение. DeepSeek опубликовала работы, посвященные эффективности и памяти моделей; методы сжатия «кэша» внимания модели, снижающие затраты на память и инференс при сохранении в основном производительности, привлекли значительное внимание в исследовательском сообществе.

«Влияние этих исследовательских прорывов усиливается, поскольку они являются открытыми и могут быть быстро подхвачены во всей отрасли», — говорит Ван.

Китайские открытые модели станут инфраструктурой для глобальных ИИ-разработчиков

Внедрение китайских моделей набирает обороты и в Кремниевой долине. Мартин Касадо, генеральный партнер Andreessen Horowitz, привел цифру: среди стартапов, использующих стеки с открытым исходным кодом, примерно в 80% случаев они работают на китайских открытых моделях, согласно его сообщению в X. Данные об использовании говорят о том же. OpenRouter, посредник, отслеживающий, как люди используют различные ИИ-модели через свой API, показывает рост китайских открытых моделей с почти нуля в конце 2024 года до почти 30% использования в последние недели.

Спрос также растет во всем мире. Z.ai ограничила новые подписки на свой план GLM Coding (инструмент для программирования на базе их флагманских моделей GLM) после всплеска спроса, ссылаясь на ограничения вычислительных мощностей. Примечательно, откуда исходит спрос: CNBC сообщает, что пользовательская база системы в основном сконцентрирована в США и Китае, за которыми следуют Индия, Япония, Бразилия и Великобритания.

«Экосистемы открытого исходного кода в Китае и США тесно связаны», — говорит Ван из Hugging Face. Многие китайские открытые модели по-прежнему полагаются на Nvidia и американские облачные платформы для обучения и обслуживания, что поддерживает запутанные деловые связи. Таланты также текучи: исследователи перемещаются между странами и компаниями, и многие по-прежнему действуют как глобальное сообщество, делясь кодом и идеями публично.

Эта взаимозависимость — часть того, что заставляет китайских разработчиков с оптимизмом смотреть на этот момент: работа путешествует, перерабатывается и фактически появляется в продуктах. Но открытость может и ускорить конкуренцию. Дарио Амодеи, генеральный директор Anthropic, высказал похожую мысль после выпусков DeepSeek в 2025 году: он написал, что экспортные ограничения «не являются способом избежать конкуренции» между США и Китаем, и что ИИ-компании в США «должны иметь лучшие модели», если они хотят победить.

В течение последнего десятилетия история китайских технологий на Западе характеризовалась большими ожиданиями, которые натыкались на проверку, ограничения и политическую реакцию. На этот раз экспорт — это не просто приложение или потребительская платформа. Это базовый слой моделей, на котором строят другие. Сыграет ли это по-другому, остается открытым вопросом.

Facebook*, Instagram* и WhatsApp* принадлежат компании Meta* Platforms Inc., деятельность которой признана экстремистской и запрещена на территории Российской Федерации.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Похожие новости: