Intel возвращается в центр обработки данных с Xeon 6+, используя мощность техпроцесса Intel 18A. После анонса чипов Xeon 600 для рабочих станций ранее в этом году, Intel вновь обращает внимание на ЦОД с Xeon 6+ — дизайном, состоящим исключительно из E-ядер, ранее известным как Clearwater Forest. Флагманский Xeon 6990E+ разработан для высокой плотности вычислений, вмещая 288 ядер Darkmont с 576 МБ кэша L3, с поддержкой двухпроцессорных систем, что доводит общее число ядер до 576. Intel заявляет, что 6990E+ обеспечивает в среднем 30% прироста производительности на поток по сравнению с 192-ядерным Epyc 9965 от AMD, а также до 30% лучшую энергоэффективность.
Мы много слышали о Clearwater Forest в преддверии этого запуска, включая подробный архитектурный обзор от Intel в прошлом году. Для справки, Xeon 6+ является кульминацией дезагрегированного подхода Intel к проектированию процессоров за последние несколько поколений, использующего комбинацию узлов и методов компоновки для достижения такой высокой плотности ядер. Поверх кремниевого стека расположены 12 чиплетов ЦП, созданных по техпроцессу Intel 18A, каждый из которых содержит 24 E-ядра Darkmont без Hyper-Threading. Они размещены на трех базовых плитках, которые содержат кэш L3 и память, выполненные по техпроцессу Intel 3. Этот стек обрамлен двумя I/O чиплетами, изготовленными по техпроцессу Intel 7. Чиплеты соединены 12 плитками EMIB 2.5D, которые представляют собой кремниевые мосты, встроенные непосредственно в подложку.
Помимо самих чипов, Xeon 6+ совместимы с существующими платформами Xeon 6 на сокете LGA 4710 (таком же, как у Sierra Forest). Intel поддерживает как одно-, так и двухпроцессорные системы, а также поддержку до 12 каналов DDR5 с частотой до 8000MT/s и 96 линий PCIe 5.0 (64 линии CXL). Эти спецификации платформы относятся к однопроцессорной системе.
Чипы поставляются с набором аппаратных ускорителей, украшенных аббревиатурами, включая Intel QAT (QuickAssist Technology), DLB (Dynamic Load Balancer), DSA (Data Streaming Accelerator) и IAA (In-memory Analytics Accelerator). Флагманский 6990E+ оснащен 16 такими ускорителями, по четыре каждого типа, включенного в архитектуру. Intel также расширила чипы инструкциями для ускорения криптографических алгоритмов SHA-512, SM3 и SM4, а также внедрила более надежные возможности конфиденциальных вычислений через Intel SGX для изоляции приложений и Intel TDX для изоляции виртуальных машин.
Нововведением в процессорах Xeon 6+ является Intel Application Energy Telemetry, или AET. Это основанный на оборудовании телеметрический инструмент, который, по словам Intel, может предоставить информацию об энергопотреблении на уровне «рабочих нагрузок, микросервисов, контейнеров, ВМ, приложений и даже на уровне отдельных программных потоков, если это необходимо». Процессоры Xeon 6+ — первые, поддерживающие AET, и Intel заявляет, что эта функция будет присутствовать в будущих процессорах Xeon, ориентированных, в частности, на поставщиков центров обработки данных.
Хотя были надежды увидеть долгожданный AVX10.2 от Intel с Xeon 6+, этого не произошло. Процессоры не поддерживают никакой формы AVX10 или даже AVX-512. Максимум, что они поддерживают, — это AVX2, как подтвердил представитель Intel изданию Tom’s Hardware.
У Intel есть четыре варианта дизайна Xeon 6+ и шесть SKU в общей сложности, причем две топовые модели в линейке поставляются в конфигурациях с ограниченным энергопотреблением, с более низкими базовыми и турбо-частотами для всех ядер, но с идентичными остальными характеристиками.
Прежде чем перейти к отдельным процессорам, есть некоторые характеристики, общие для всего диапазона:
По сравнению с чипами Sierra Forest предыдущего поколения, сразу бросается в глаза TDP. У Sierra Forest максимальный TDP составлял 330 Вт у Xeon 6780E и опускался до 205 Вт у 6710E. Теперь нижний предел — 300 Вт, а верхний — 450 Вт, что приближает их к максимальным показателям TDP в линейке EPYC от AMD. Однако, как обычно, TDP лишь намекает на реальное энергопотребление, которое может сильно варьироваться в зависимости от множества факторов.
Число ядер значительно возросло, как и ожидалось, но вместе с ним выросло и количество кэша L3. У 6990E+ более чем в пять раз больше кэша L3, чем у 6780E. Даже у 6960E+, имеющего 144 ядра, как и 6780E, кэша L3 в четыре раза больше. Однако кэш L2 остался без изменений. Intel использует 4 МБ кэша L2 на кластер из четырех ядер. Этот кэш технически разделяется между этими ядрами в кластере, но можно считать, что это 1 МБ кэша L2 на ядро.
Intel предоставила различные бенчмарки для Xeon 6+, сравнивая новый флагман Xeon 6990E+ с чипами Intel предыдущего поколения, а также с текущими предложениями EPYC от AMD. В целом, Intel заявляет о приросте производительности по сравнению с Xeon 6780E в 2,26 раза, а также о 30% более высокой производительности на поток по сравнению с AMD EPYC 9965.
Что касается прироста по сравнению с предыдущим поколением, неудивительно увидеть такой огромный скачок производительности. В конце концов, Intel сравнивает Xeon 6990E+ с ЦП, у которого вдвое меньше потоков и на 120 Вт ниже TDP. Однако Xeon 6780E, с которым Intel сравнивает свой новейший чип Xeon 6+, является флагманом линейки Sierra Forest предыдущего поколения. В среднем Intel заявляет о приросте в 2,26 раза, и, как видно из внутренних тестов Intel, Xeon 6990E+ показал более чем вдвое большую производительность, чем Xeon 6780E, во всех рабочих нагрузках, протестированных Intel.
Однако более важным показателем здесь является производительность на ватт. Xeon 6990E+ имеет значительно более высокий TDP и более плотные вычисления, но Intel по-прежнему заявляет о среднем улучшении эффективности на 55%, в диапазоне от 30% прироста в бенчмарке пропускной способности памяти Stream Triad до 79% улучшения в Linpack. Для этих тестов Intel использовала комбинацию двухпроцессорных и однопроцессорных систем, соответствующих конфигурации для конкретного теста (т. е. использовались две двухпроцессорные или две однопроцессорные системы, а не смешивание). Точные детали конфигурации можно найти в полной презентации в конце этой статьи.
Учитывая успехи команды Red в центрах обработки данных за последние несколько поколений, конкурентоспособная производительность, возможно, более важна. Intel заявляет, что Xeon 6990E+ обеспечивает в среднем на 30% более высокую производительность на поток по сравнению с EPYC 9965, а также на 30% более высокую среднюю производительность на поток на ватт. Производительность на поток, безусловно, важна, но у Intel нет данных, сравнивающих среднюю производительность по всему кристаллу с предложениями AMD.
Вероятно, это связано с общим количеством потоков. Хотя в Xeon 6990E+ Intel упаковала 288 ядер по сравнению со 192 у EPYC 9965, AMD использует одновременную многопоточность, а Intel — нет. Преимущество на поток обычно не переводится напрямую в общее преимущество в производительности. Это лишь один из показателей, который *может* быть важен в зависимости от рабочих нагрузок, которые вы запускаете. Согласно тестам Intel, Xeon 6+ имеет около 30% преимущества в целочисленной и плавающей пропускной способности, и около 38% улучшения эффективности.
Хотя Intel ограничила конкретные цифры показателем производительности на поток, она предоставила небольшое представление об общей эффективности по сравнению с конкурентами. При 40% загрузке ЦП Intel заявляет, что 6990E+ до 30% эффективнее, чем EPYC 9965. Если предположить, что эта диаграмма точна, а не является искаженной визуализацией (что возможно), можно увидеть, что эффективность становится гораздо более тесной по мере увеличения загрузки.
У Intel нет тестов, сравнивающих Xeon 6+ с дизайнами на базе набора инструкций ARM, который становится важной точкой сравнения. Совсем недавно мы видели первые результаты тестов ЦП Nvidia Vera. Однако компания заявляет, что считает, что «[Xeon 6+] очень выгодно смотрится» на фоне вариантов на базе ARM.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Jake Roach




