Китайские разработчики ИИ изучают возможность аренды GPU Nvidia Rubin в облаке

ии,nvidia rubin,китай,дефицит чипов,аренда gpu,экспортные ограничения

Ведущие разработчики ИИ-моделей из Китая стремятся заполучить новейшие GPU Nvidia Rubin и активно ищут способы арендовать их в облачных дата-центрах за рубежом. Это вызвано неспособностью отечественного “железа” конкурировать с американскими лидерами и экспортными ограничениями, что ставит их в невыгодное положение по сравнению с конкурентами из США.

Разработчики аппаратного обеспечения для искусственного интеллекта из Китая добиваются значительного прогресса в создании ускорителей собственной разработки. Однако ведущие китайские разработчики ИИ всё чаще признают, что отечественное “железо” вряд ли в ближайшее время догонит американских лидеров, что существенно ограничивает развитие конкурентоспособных моделей. В связи с этим, стремясь сохранить конкурентоспособность с американскими коллегами, китайские разработчики ИИ ищут способы арендовать в облаке будущие графические процессоры Nvidia Rubin, сообщает The Wall Street Journal.

Когда в январе Nvidia представила свою платформу для дата-центров Rubin, предназначенную для ИИ, компания публично назвала американских клиентов, но обошла вниманием китайских. Такой подход Nvidia применяет уже несколько последних кварталов, что отражает экспортные правила США, её приверженность их соблюдению и нежелание сигнализировать инвесторам об открытии китайского рынка. Китайские компании восприняли этот сигнал и начали искать пути получения передовых процессоров Nvidia удалённо, чтобы не отстать от американских конкурентов.

Китайские ИИ-компании начали вести переговоры о доступе к системам NVL144 GR200 и другим системам на базе Nvidia Rubin, размещённым в дата-центрах за пределами Китая, в частности, в Юго-Восточной Азии и на Ближнем Востоке, как утверждается в сообщении. Вплоть до середины этой недели такие схемы зачастую считались законными. Однако они имеют определённые ограничения по своей сути: вычислительные мощности арендуются, а не принадлежат, ёмкость является общей, а не выделенной, и сроки развёртывания зависят от сторонних операторов, а не от внутренних графиков в наихудшем случае.

Неудивительно, что использование удалённого оборудования для обучения передовых моделей ИИ сопряжено с трудностями, поскольку разница между арендой Rubin в удалённом облачном дата-центре и его локальным развёртыванием огромна. Американские гиперскейлеры могут интегрировать ускорители Rubin в больших масштабах, тонко настраивать свои программные стеки под новое оборудование и резервировать массивные кластеры GPU для длительных циклов обучения. Напротив, китайские разработчики, планирующие арендовать мощности Rubin, будут вынуждены мириться с ограниченными квотами, трансграничной задержкой, малой свободой настройки систем и, в некоторых случаях, с очередями. Если им удастся арендовать достаточно систем — а в США существуют облачные дата-центры, где сейчас работают сотни тысяч GPU Blackwell — они вполне смогут обучать свои модели без особых проблем. Однако если они не смогут вовремя найти подходящие облака, у них будет меньше ускорителей ИИ на каждый проект, а в некоторых случаях они вовсе не смогут выполнять крупные задачи обучения, что напрямую ограничит размер моделей, частоту экспериментов и скорость итераций.

Тем временем, сложности обучения и неэффективность хорошо известны китайским разработчикам, которые использовали парки различных GPU Nvidia, включая A100, H100, H800 и H20, для обучения своих передовых моделей. Поскольку официально они не могут приобрести Blackwell, они также арендовали их в облаке, и инсайдеры сообщают, что этот опыт был дорогостоящим и операционно неудобным, по данным WSJ. В результате они уже знают, как бороться с неэффективностью.

С появлением следующего поколения передовых моделей и GPU Rubin ситуация станет ещё сложнее. По мере масштабирования моделей возрастает ценность бесперебойного доступа к большим, однородным кластерам GPU, а арендованные мощности редко могут это обеспечить. Даже если сделки будут заключены (что не гарантировано, учитывая новые ограничения на облачный доступ), они, как правило, ставят китайских разработчиков в структурно невыгодное положение по сравнению с хорошо финансируемыми американскими конкурентами, которые могут развернуть десятки тысяч ускорителей под одной крышей.

Есть и ещё одно осложнение. По оценкам UBS, в прошлом году гиперскейлеры Китая потратили около 57 миллиардов долларов на капитальные затраты, что составляет примерно десятую часть от расходов их американских коллег. Чтобы понять контекст этой цифры, это меньше, чем 70 миллиардов долларов, которые *Meta потратила на CapEx в прошлом году. Учитывая финансовые ограничения, ещё предстоит увидеть, смогут ли китайские разработчики ИИ оставаться более или менее конкурентоспособными по сравнению со своими американскими аналогами.

*Facebook, *Instagram и *WhatsApp принадлежат компании Meta Platforms Inc., деятельность которой признана экстремистской и запрещена на территории Российской Федерации.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.