Многоядерный лес: подробности об Intel Xeon 6700E (Sierra Forest)

 

Отставание Intel по количеству процессорных ядер до текущего момента насчитывало уже несколько лет. Компания безнадёжно проигрывала бой за боем — сперва AMD с её EPYC, успешно преодолевшим отметку 64 ядра, а затем и разработчикам серверных процессоров на базе Arm, таким как Ampere Computing.

Прекрасно осознавая эту неблагоприятную ситуацию, компания взялась за разработку Sierra Forest. Впервые анонс этих CPU состоялся более года назад, но лишь на прошлой неделе Intel наконец-то представила это решение в виде готового «кремния». Новые процессоры входят в семейство Xeon 6, что соответствует отказу от бренда Scalable.

 Источник здесь и далее: Intel via ServeTheHome

Источник здесь и далее: Intel via ServeTheHome

Формально у Intel когда-то были действительно массивные многоядерные чипы. Речь, конечно, про давно умершие Xeon Phi, где благодаря SMT4 удалось довести количество одновременно выполняемых потоков до 244. Но это всё-таки были ускорители, а не процессоры общего назначения.

Интересно, что активно используя гетерогенную архитектуру в настольных и мобильных процессорах, Intel решила чётко разделить серверные чипы именно по типам используемых ядер ещё два года назад. Если в фундамент Sapphire, Emerald и Granite Rapids легли исключительно высокопроизводительные, но относительно сложные и горячие P-ядра, то основой Sierra Forest было решено сделать только простые, но максимально энергоэффективные E-ядра.

Вкупе с переходом от техпроцесса Intel 7 к Intel 3 это позволило нарастить количество самих ядер до 144, а в перспективе и до 288, что хорошо отвечает потребностям современных гиперскейлеров и провайдеров крупных облачных сервисов. Они заинтересованы в масштабируемости, поскольку та позволяет нарастить клиентскую базу, а значит, и увеличить доходы сравнительно «малой кровью». Кроме того, сценарии с использованием ИИ часто благоволят именно многоядерным решениям, была бы поддержка соответствующих форматов вычислений.

Всё это у Sierra Forest есть. В основе новых E-ядер лежит микроархитектура Crestmont (Sierra Glenn), в которой реализованы достаточно развитые подсистемы фронт- и бэкэнда с довольно солидными кешами инструкций (64 Кбайт) и данных (32 Кбайт) на ядро и разделяемым кешем L2 на каждые четыре ядра. Сдвоенный внеочередной декодер способен обрабатывать шесть инструкций, а конвейер — столько же микроопераций за такт. Увеличена глубина истории механизма предсказания ветвлений. Всё это позволяет говорить о производительности до 16 FP32-Флопс за такт.

Преследуя достижение максимальной энергоэффективности новых решений, от поддержки AVX-512 и AMX в Sierra Forest компания отказалась, однако расширенный вариант AVX2 есть: ядра имеют два 128-битных порта для выполнения SIMD-инструкций, в том числе с поддержкой AVX-IFMA и AVX-DOT-PROD-INT8, инструкций CMPccXADD, LAM и LASS, а также форматов INT8, FP16 и BF16. Дополняют картину развитые средства обеспечения безопасности — шифрование с длиной ключа до 2048 бит, технология доверенных доменов TDX, расширения SGX, технология безопасной виртуализации VT-rp и аппаратная защита от эксплойтов CET.

Компоновка у Sierra Forest, разумеется, тайловая. Базовый «кирпичик» включает в себя до 4 ядер, 4 Мбайт кеша L2 и кусок кеша последнего уровня (LLC) объёмом 3 Мбайт. Блок ввода-вывода отвечает за поддержку интерфейсов PCIe 5.0 (до 88 линий, есть поддержка CXL 2.0, в том числе Type 3) и UPI 2.0 (4 линии, 24 ГТ/с). В однопроцессорных системах I/O-подсистема может быть переконфигурирована, что даёт до 136 линий PCIe. Как и у моделей с P-ядрами, поддерживаются аппаратные ускорители DSA, IAA, QAT и DLB. Но их количество зависит от конкретной модели процессора.

Отдельно располагаются контроллеры памяти, их у новинки восемь. Поддерживаются модули DDR5-6400, совокупная пропускная способность — 460 Гбайт/с. Сшивка базовых блоков выполнена с помощью модульной меш-сети, а на уровне тайлов с помощью EMIB. Таким образом, с точки зрения любой системы и прикладного ПО процессоры Sierra Forest монолитны.

Оптимизации по части энергоэффективности вкупе с техпроцессом Intel 3 позволяют говорить о 144 ядрах с общим теплопакетом 330 Вт. И это серьёзный шаг вперёд для Intel, позволяющий говорить о практически трёхкратном превосходстве над предыдущими поколениями Xeon и достижении хоть какого-то паритета с AMD по этому показателю. У 128-ядерного EPYC Bergamo TDP достигает 360 Вт. Впрочем, новейшие Turin Dense на базе 3-нм техпроцесса помогут вернуть «красным» лидерство, уж по количеству ядер на сокет точно.

Согласно новой схеме наименований, процессоры Sierra Forest относятся к серии Xeon 6700E. Изначально она включает семь моделей, имеющих от 64 до 144 ядер с базовой частотой в пределах 1,8–2,4 ГГц и турбо-частотой в пределах 2,6–3,2 ГГц. У двух старших вариантов объём кеша LLC составляет 108 Мбайт, у остальных он равен 96 Мбайт. Все модели, за исключением Xeon 6731E, рассчитаны на работу в двухпроцессорных конфигурациях, что дает до 288 ядер на платформу. Сама платформа использует новый разъём LGA 4710.

Что касается ценовой политики, то она не совсем однозначна. Рекомендованные цены стартуют с отметки $2749 за 64-ядерную модель, но 64-ядерные процессоры AMD с актуальной архитектурой стоят от $4950 (EPYC 8534P). В максимальной же конфигурации цены похожи — $11350 за флагманскую модель против $11900 за EPYC 9754. В теории процессоры выглядят многообещающе, особенно в сравнении с предыдущими попытками Intel догнать по количеству ядер AMD. Так, по энергоэффективности Xeon 6700 превосходят Cascade Lake-SP в 2,6 раза, а производительность в пересчёте на стойку выросла в 4,2 раза, говорит компания.

Тем не менее, теория проверяется только практикой, и специалисты Phoronix уже успели провести полноценное тестирование Xeon 6700. В их руки попали две старшие модели процессоров, 144-ядерные Xeon 6766E и Xeon 6780E. По мнению Phoronix, ближайшим аналогом флагманских Sierra Forest являются 128-ядерные AMD EPYC 9754 с ядрами Zen 4c. Но решение AMD поддерживает SMT, что даёт до 256 потоков, имеет развитую 12-канальную подсистему памяти, хотя и только DDR5-4800, и более ёмкий кеш (256 против 108 Мбайт). Но специализированных ускорителей у EPYC нет. Зато схожи частотные и энергетические характеристики: 2,25–3,1 ГГц при TDP 360 Вт против 330 Вт у флагманского Sierra Forest.

 Источник: Phoronix

Источник: Phoronix

Детально ознакомиться с обзором можно на сайте Phoronix, но стоит отметить, что в ряде случаев процессоры Sierra Forest выступили удачнее оппонента и практически догнали Xeon Max 9468, а в области энергопотребления уступили лишь моделям AMD EPYC 8004. В единичных нагрузках новинка несущественно отстаёт даже от EPYC 9684X. В среднем 2P-платформа Xeon 6780E оказалась примерно на 5 % быстрее Xeon Platinum 8592+ при 70 % от энергопотребления, но заметно уступила паре AMD EPYC 9754. Однако имеется весомое «но» — практически во всех случаях Xeon 6700 показали лучшую энергоэффективность, уступив лишь EPYC 8004, априори отстающим по количеству ядер.

Но это ещё не всё: действительно серьёзными соперниками и Sierra Forest, и Bergamo являются многоядерные Arm-процессоры. Так что Phoronix сравнил новинки с пусть не самой новой, но всё ещё актуальной платформой на базе Ampere Altra Max M128-30: 7-нм техпроцесс, 128 ядер Armv8.2+ c 1 Мбайт L2-кеша для каждого и общий L3-кеш объёмом 32 Мбайт. Подсистема памяти хотя и восьмиканальная, но использует лишь DDR4-3200. Зато тактовая частота составляет устойчивые 3 ГГц при максимальном теплопакете 250 Вт. Блоков векторных инструкций здесь два, они имеют разрядность 128 бит, но это всё же NEON, хотя есть поддержка форматов вычислений с пониженной точностью, включая INT8.

 Источник: Phoronix

Источник: Phoronix

Чуда, впрочем, не случилось — система Ampere по средней производительности с треском проиграла современным CPU и от AMD, и от Intel. Однако по средней же энергоэффективности она уступает только Siena. Проблема в том, что прирост потребляемой мощности в случае Ampere не конвертируется линейно в такой же прирост производительности. Однако у данного решения Ampere есть другой плюс — оно практически втрое дешевле флагманского Sierra Forest, если смотреть на рыночные цены. При этом надо помнить, что гиперскейлерам любые компоненты достаются по совсем другим ценам, нежели рекомендованные или розничные. Ampere же тем временем готовит гораздо более интересные AmpereOne: 3 нм, 256 ядер, 12 каналов DDR5.

Тем не менее, 6700E показали великолепный для Intel результат и заинтересовали индустрию — ряд производителей серверного оборудования уже представили свои решения на базе Sierra Forest в одно- и двухпроцессорном варианте. В I квартале 2025 года Intel планирует выпустить 288-ядерную версию Sierra Forest (6900E) с 12-канальной памятью. А в III квартале компания пополнит арсенал процессорами Xeon 6900P (Granite Rapids) на базе P-ядер Redwood Cove, количество которых планируется довести до 128. Тем интереснее будет битва с новыми решениями AMD и многоядерными процессорам Arm.

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER. | Можете написать лучше? Мы всегда рады новым авторам.

Источники:

Постоянный URL: https://servernews.ru/1106029
Система Orphus