Китай возглавил рейтинг самых быстрых суперкомпьютеров: «CPU-only» гигант положил конец доминированию американского «El Capitan»

Lineshine Top500 суперкомпьютер цпу экзафлопс китай tomshardware.com

Суперкомпьютер Китая LineShine возглавил 67-й список TOP500, показав 2,198 экзафлопс в тесте High Performance Linpack.

Суперкомпьютер LineShine из Китая занял первое место в 67-м выпуске списка TOP500, показав результат 2,198 экзафлопс в тесте High Performance Linpack и обойдя El Capitan на базе AMD более чем на 20%. Система, установленная в Национальном суперкомпьютерном центре в Шэньчжэне (NSCS) и созданная Шэньчжэньским Центром облачных вычислений, не использовала графических процессоров или каких-либо ускорителей, и достигла этого показателя с помощью 13 789 440 ядер процессоров отечественной разработки, став первой машиной в рейтинге, преодолевшей отметку в два экзафлопса производительности с двойной точностью исключительно на ЦПУ. Это также первая система из Китая, возглавившая TOP500 со времен Sunway TaihuLight в 2017 году. Тот факт, что под санкциями находящаяся страна смогла построить флагманскую систему экзафлопсного уровня без единого западного ускорителя — это одно, но более показательно то, что Китай решил внести ее в список. Годами самые быстрые машины страны полностью отсутствовали в рейтингах, и решение представить лидера списка сейчас является намеренным изменением позиции. LineShine построен на платформе LingKun, как ее называет NSCS. Каждый из 20 480 вычислительных узлов несет два процессора LX2, основанные на Armv9, с 304 ядрами, работающими на частоте 1,55 ГГц, организованными в восемь кластеров по 38 ядер. Каждое ядро включает блоки Arm Scalable Vector Extension и Scalable Matrix Extension, поддерживающие форматы FP64, FP32, BF16, FP16 и INT8. Каждый из этих LX2 сопряжен с 32 ГБ HBM на кристалле с пропускной способностью до 4 ТБ/с и до 256 ГБ внешней памяти DDR5, что по конфигурации ближе к Fujitsu A64FX в японском Fugaku, чем к обычному серверному ЦПУ. Узлы связаны проприетарным интерконнектом LingQi, а машина работает под управлением отечественной ОС Kylin. Неизвестно, кто разрабатывает LX2 — NSCS не называет поставщика, — но Jon Peddie Research приписала чип компании Huawei, а пилотная фаза проекта, по сообщениям, проходила на серверах Huawei Kunpeng. Техпроцесс и литейный завод также не подтверждены. 7-нм техпроцесс SMIC является очевидным отечественным кандидатом по методу исключения, учитывая, что оборудование EUV и мощности TSMC недоступны, но никто до сих пор не задокументировал эту деталь. LineShine также занял первое место в HPCG, тесте, который поощряет рабочие нагрузки, ограниченные памятью и связью, более близкие к реальному научному коду, с результатом 22,00 петафлопс. Однако в HPL-MxP, бенчмарке со смешанной точностью, аппроксимирующем обучение ИИ, он занял лишь четвертое место с 7,92 экзафлопс, что в 3,6 раза превышает его показатель FP64. Иными словами, системы на ускорителях, которые он обошел в Linpack, значительно вырываются вперед, как только точность снижается. Согласно анонсу TOP500, El Capitan показывает 16,7 экзафлопс в HPL-MxP, что в 9,2 раза больше его стандартного результата, при этом Aurora и Frontier демонстрируют схожие множители. Пропускная способность при пониженной точности — это именно то, где графические процессоры и APU отделяются от ЦПУ, и LineShine здесь не может это скрыть. Мы видим схожие проблемы с точки зрения энергопотребления. LineShine потребляет 42 220 кВт и показывает 52,07 гигафлопс на ватт в тесте Linpack. Это уверенно превосходит Intel Aurora, но уступает El Capitan с его 60,94 гигафлопс на ватт, то есть LineShine производит больше общей выходной мощности FP64, чем система из Ливермора, сжигая при этом примерно на 42% больше энергии. Стоит помнить об этом различии, поскольку рейтинг TOP500 определяется по Linpack с точностью FP64 — единственному режиму, где широкий ЦПУ с питанием от HBM все еще может на равных конкурировать с ускорителями. LineShine — настоящий чемпион по двойной точности, но это не ведущая в мире машина для обучения ИИ, и его четвертое место в HPL-MxP это подтверждает. Китай перестал подавать свои самые быстрые системы в TOP500 примерно в 2021 году после того, как ряд включений в списки подсанкционных компаний затронул центр Sunway в Уси и Sugon. Сообщество давно полагало, что страна эксплуатирует оборудование экзафлопсного уровня задолго до этой записи: преемник Sunway OceanLight и созданный NUDT Tianhe-3 появлялись в научных статьях, удостоенных премии Гордона Белла, но никогда не фигурировали в списке. Соучредитель TOP500 Джек Донгарра годами заявлял, что китайские исследователи сообщали ему, что им не разрешают подавать заявки, и что упущения были связаны с желанием избежать внимания США, а не с отсутствием возможностей. Список за прошлый июнь, который возглавила AMD, в то время как китайские высокопроизводительные вычисления оставались в тайне, был особенно примечателен, но представление LineShine сейчас меняет эту ситуацию. Сообщалось, что система была разработана без государственного финансирования, что снижает политические риски раскрытия информации, а полностью отечественная конструкция означает отсутствие зависимости от западных компонентов, которые Вашингтон мог бы перекрыть впоследствии. Аддисон Снелл, генеральный директор аналитической фирмы Intersect360 Research, сообщил Reuters, что он не удивлен производительностью, но удивлен самим фактом раскрытия информации, отметив, что сюрпризом стало то, что Китай представил результат и захотел получить за него признание. В конечном счете, представление системы номер один, работающей полностью на отечественных компонентах, является заявлением о том, что санкционный режим не смог создать разрыв, который волнует Китай. Верхушка списка могла смениться, но его основная часть осталась прежней. США по-прежнему доминируют, занимая три из пяти первых мест: El Capitan (1,809 экзафлопс), Frontier (1,353 экзафлопс) и Aurora (1,012 экзафлопс), а немецкий JUPITER Booster остается первой и единственной европейской системой экзафлопсного уровня с ровно 1,000 экзафлопс. Кремний AMD лежит в основе большей части ускоренного сектора: по собственному блогу компании, она теперь обеспечивает работу 191 системы в списке, что на 11% больше по сравнению с прошлым годом и составляет 41% новых записей в этом выпуске. Она занимает три места в первой десятке — El Capitan, Frontier и недавно развернутая HPC7 в итальянской энергетической компании Eni — и обеспечивает более 40% совокупной производительности Linpack в топ-10. По эффективности она обеспечивает работу 56% систем из топ-50 Green500, а первые развертывания ее Instinct MI355X — две системы Cambridge Zenith в Великобритании — вошли в рейтинги на 67-й и 68-й позициях. Ничто из этого не умаляет достижений LineShine, тем более что они не конкурируют за одну и ту же рабочую нагрузку. Чипы AMD MI300A и MI355X созданы для арифметики ИИ со смешанной точностью, где LineShine занимает четвертое место, и остальные западные лаборатории оптимизируют свои системы именно под это, а не под позиции в рейтинге FP64. El Capitan, Frontier и Aurora показывают результаты HPL-MxP в несколько раз выше своих результатов Linpack, что стало возможным благодаря аппаратному обеспечению, которого нет у LineShine. Таким образом, хотя корона TOP500 действительно перешла в Шэньчжэнь, она сделала это на бенчмарке, который западные лаборатории больше не преследуют со своими самыми быстрыми машинами.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

В тренде:

Похожие новости: