Материалы по тегу: genoa

08.12.2023 [16:31], Сергей Карасёв

Gigabyte представила серверы с ускорителями AMD Instinct MI300 для задач ИИ и HPC

Компания Giga Computing (Gigabyte) анонсировала серверы G383-R80, G593-ZX1 и G593-ZX2 на аппаратной платформе AMD, предназначенные для решения ресурсоёмких задач: это могут быть приложения ИИ и HPC. Все новинки оборудованы ускорителями серии Instinct MI300.

Модель G383-R80, выполненная в формате 3U, несёт на борту четыре чипа Instinct MI300A (24 ядра EPYC Genoa, ускоритель CDNA 3 и 128 Гбайт памяти HBM3). Во фронтальной части расположены 8 отсеков для SFF-накопителей NVMe SSD.

 Источник изображений: Gigabyte

Источник изображений: Gigabyte

Могут быть задействованы до 12 слотов расширения для карт FHFL с интерфейсом PCIe 5.0. Есть слот для SSD стандарта М.2 2280/22110 с интерфейсом PCIe 5.0 x4, два сетевых порта 10GbE (Broadcom BCM57416), выделенный порт управления 1GbE, контроллер Aspeed AST2600, два порта USB 3.2 Gen1 и разъём D-Sub. Питание обеспечивают четыре блока мощностью 2200 Вт каждый с сертификатом 80 Plus Titanium.

Серверы G593-ZX1 и G593-ZX2, в свою очередь, имеют типоразмер 5U. Они комплектуются двумя процессорами AMD EPYC Genoa с показателем TDP до 300 Вт и восемью ускорителями Instinct MI300X OAM со 192 Гбайт памяти HBM3. Для модулей ОЗУ стандарта DDR5-4800 доступны 24 разъёма. Спереди находятся восемь отсеков для SFF-накопителей NVMe SSD.

Эти серверы оборудованы двумя слотами для SSD формата М.2 2280/22110 с интерфейсом PCIe 3.0 (по одному х1 и х4), двумя портами 10GbE (Intel X710-AT2), выделенным сетевым портом управления 1GbE, контроллером Aspeed AST2600, двумя портами USB 3.2 Gen1 и разъёмом D-Sub. Предусмотрены четыре слота PCIe 5.0 x16 для карт FHHL и восемь слотов PCIe 5.0 x16 для LP-карт. Версия G593-ZX1 получила восемь root-портов, модель G593-ZX2 — четыре. Установлены шесть блоков питания на 3000 Вт с сертификатом 80 Plus Titanium.

Постоянный URL: http://servernews.ru/1097167
21.11.2023 [09:56], Сергей Карасёв

MSI представила GPU-серверы с жидкостным охлаждением на AMD EPYC Genoa и Intel Xeon Sapphire Rapids

Компания MSI на конференции по высокопроизводительным вычислениям SC23 представила новые серверы на процессорах AMD EPYC Genoa и Intel Xeon Sapphire Rapids. Устройства ориентированы на дата-центры и подходят для НРС-нагрузок, генеративного ИИ и других ресурсоёмких задач.

Одна из новинок — платформа G4201, которая допускает установку двух чипов Xeon Sapphire Rapids и 32 модулей оперативной памяти DDR5. Этот сервер формата 4U располагает восемью слотами PCIe 5.0 x16 для ускорителей высотой в два слота, а также двумя PCIe 5.0 x16 для карт толщиной в один слот.

Дебютировал также сервер G4101 типоразмера 4U. Он рассчитан на один чип EPYC Genoa (до 128 ядер; TDP до 500 Вт) и 12 модулей DDR5-4800. Возможно применение жидкостного охлаждения. Доступны четыре разъёма PCIe 5.0 х16 для трёхслотовых ускорителей и ещё два разъёма PCIe 5.0 x16. Во фронтальной части расположены отсеки для 12 накопителей U.2 NVMe или SAS/SATA (SFF). Кроме того, предусмотрены два коннектора M.2 M-Key (2280/22110, PCIe 3.0 x4/x2). Питание обеспечивают два блока мощностью 3000 Вт каждый.

 Источник изображений: MSI

Источник изображений: MSI

Ещё одна новинка — модель G3101, получившая исполнение 3U. Она допускает установку одного процессора EPYC 7002/7003 с 64 ядрами (до 300 Вт) и восьми модулей DDR4-3200. Поддерживается развёртывание СЖО. Есть шесть отсеков для SFF-накопителей с интерфейсом SATA-3 и четыре слота PCIe 4.0 x16 для карт FHFL. Предусмотрены два сетевых порта 10GbE на базе Intel X710AT2. В оснащение включены два блока питания на 1600 Вт.

Кроме того, MSI анонсировала два сервера с поддержкой Compute Express Link (CXL) — модели S1301 и S2302, оптимизированные для задач с интенсивным использованием данных. Характеристики версии S1301 формата 1U таковы: два процессора EPYC 9004 (Genoa) с 32 ядрами и TDP до 210 Вт, 24 слота для модулей DDR5-4800, два разъёма PCIe 5.0 x16 для ускорителей HHHL, 10 отсеков для накопителей E3.S CXL, два коннектора M.2 M-Key 2280 (PCIe 3.0 x2) и два блока питания мощностью 1600 Вт.

В свою очередь, сервер S2302 стандарта 2U поддерживает два чипа Xeon Sapphire Rapids (до 60 ядер; 350 Вт), 32 модуля DDR5-4800, три ускорителя PCIe 5.0 x16  FHFL и две карты PCIe 5.0 x16 HHHL. Накопители могут устанавливаться по схеме 8 × E3.S CXL и 2 × E3.S PCIe 5.0 SSD или 10 × E3.S PCIe 5.0 SSD. Применены два блока питания на 1600 Вт.

Постоянный URL: http://servernews.ru/1096279
20.10.2023 [16:00], Сергей Карасёв

AMD представила процессоры Ryzen Threadripper Pro 7000 WX для мощных рабочих станций

Компания AMD официально анонсировала процессоры Ryzen Threadripper Pro 7000 WX и Ryzen Threadripper 7000 на архитектуре Zen 4 (Genoa). Первые предназначены для построения мощных рабочих станций, а вторые найдут применение в высокопроизводительных настольных ПК (HEDT).

В семейство Ryzen Threadripper Pro 7000 WX вошли шесть моделей, насчитывающих от 12 до 96 вычислительных ядер с возможностью одновременной обработки от 24 до 192 потоков инструкций. Базовая тактовая частота варьируется от 2,5 до 4,7 ГГц, максимальная частота — от 5,1 до 5,3 ГГц.

Чипы несут на борту от 48 до 384 Мбайт кеш-памяти L3, а суммарный объём кеша варьируется от 76 до 480 Мбайт. Показатель TDP у всех изделий одинаков — 350 Вт. Процессоры рассчитаны на работу с материнскими платами на наборе логики WRX90. Доступны восемь каналов для модулей памяти DDR5-5200, максимальный объём которой может достигать 2 Тбайт. Реализована поддержка 148 линий PCIe, из которых доступны 144, а до 128 из них соответствуют стандарту PCIe 5.0. Говорится о поддержке инструкций AVX-512.

 Источник изображений: AMD

Источник изображений: AMD

Чипы Ryzen Threadripper Pro 7000 WX поддерживают технологии AMD Pro и предлагают функции безопасности и управления корпоративного уровня. Процессоры предназначены для выполнения сложного моделирования, рендеринга и других ресурсоёмких задач. Утверждается, что новые решения обеспечивают двукратное повышение производительности по сравнению с изделиями предыдущего поколения в таких инструментах, как Хаос V-Ray. Рабочие станции на данной платформе предложат Dell Technologies, HP, Lenovo и др.

Флагман нового семейства Ryzen Threadripper Pro 7995WX (96 ядер; 192 потока; 2,5–5,1 ГГц) установил новый мировой рекорд в бенчмарке Cinebench R23, показав результат в 100 291 балл. Более того, при разгоне всех 96 ядер до 4,4 ГГц показатель достиг 148 719 баллов. При этом использовалось охлаждение с жидким азотом, а энергопотребление процессора составило 620 Вт. Предыдущий рекорд в 147 668 баллов принадлежал связке из двух чипов EPYC 9654 Genoa.

Что касается процессоров Ryzen Threadripper 7000, то в эту серию вошли три модели с 24, 32 и 64 ядрами с поддержкой многопоточности. Базовая тактовая частота — от 4,0 до 3,2 ГГц, максимальная частота — от 5,1 до 5,3 ГГц. Чипы комплектуются 128/256 Мбайт кеш-памяти L3, а общий размер кеша — от 152 до 320 Мбайт. Процессоры ориентированы на работу в паре с чипсетом TRX50. Обеспечивается поддержка четырёх каналов DDR5-5200 (до 1 Тбайт), 92 линий PCIe (доступны 88 линий, в том числе до 48 линий PCIe 5.0). Показатель TDP у всех процессоров равен 350 Вт. Цена варьируется от $1499 до $4999.

Постоянный URL: http://servernews.ru/1094741
14.09.2023 [19:06], Владимир Мироненко

Amazon объявила о доступности EC2-инстансов R7iz (Intel) и R7a (AMD) для нагрузок с повышенными требованиями к памяти

Amazon объявила о доступности инстансов EC2 R7iz на базе процессоров Intel Xeon Sapphire Rapids с постоянной турбо-частотой всех ядер 3,9 ГГц и EC2 R7a на базе процессоров AMD EPYC Genoa с максимальной частотой 3,7 ГГц.

 Изображения: Amazon AWS

Изображения: Amazon AWS

Оба семейства предназначены для рабочих нагрузок, требующих больше памяти, вертикального масштабирования, а также более высокую производительность и низкую задержку сети и томов EBS. Экземпляры R7iz ориентированы на EDA, СУБД с высокими лицензионными сборами за ядро, системы анализа данных и финансовые расчёты. К каждому R7iz можно подключить до 88 EBS-томов.

Amazon EC2 R7iz включают фирменные ускорители Intel — инструкции AMX доступны для всех размеров инстансов R7iz, а ускорители Intel QAT, IAA и DSA будут доступны на экземплярах r7iz.metal-16xl и r7iz.metal-32xl. Инстансы R7iz уже доступны в регионах US East (Северная Вирджиния, США) и US West (Орегон, США). Bare metal варианты появятся чуть позже.

Скорость подключения инстансов к сети составляет до 50 Гбит/с, а к EBS-томам — до 40 Гбит/с. Лимиты одинаковы для R7iz и R7a, но к AMD-инстансам можно подключить до 128 EBS-томов. R7a построены на базе системы AWS Nitro, используют адаптеры AWS Elastic Fabric Adapter (EFA), поддерживают инструкции AVX-512 VNNI и формат BF16.

Сообщается, что R7a сертифицированы SAP и идеально подходят для высокопроизводительных рабочих нагрузок с интенсивным использованием памяти, таких как базы данных (No)SQL и in-memory, распределённые кеши, аналитика больших данных в реальном времени и системы EDA. Инстансы Amazon EC2 R7a доступны в следующих регионах AWS: US East (Огайо, США), US East (Северная Вирджиния, США), US West (Орегон, США) и EU (Ireland).

Постоянный URL: http://servernews.ru/1093014
18.08.2023 [11:23], Сергей Карасёв

AWS запустила HPC-инстансы EC2 Hpc7a на базе AMD EPYC Genoa

В январе 2022 года облачная платформа Amazon Web Services (AWS) представила EC2-инстансы Hpc6a на базе процессоров AMD EPYC Milan для обработки HPC-задач. А теперь дебютировало новое поколение этих решений — EC2 Hpc7a с более производительными чипами AMD EPYC Genoa. Hpc7a уже доступны в трёх регионах: US East (Огайо), EU (Ирландия) и US GovCloud.

Утверждается, что по сравнению с EC2 Hpc6a инстансы нового поколения обеспечивают повышение быстродействия до 2,5 раза. Говорится об использовании сетевого подключения на базе Elastic Fabric Adapter (EFA) со скоростью передачи данных 300 Гбит/с. Инстансы EC2 Hpc7a выполнены на основе AWS Nitro.

 Источник изображения: AWS

Источник изображения: AWS

Используется оперативная память DDR5 объёмом 768 Гбайт. Заказчики могут выбирать из четырёх основных конфигураций — с 24, 48, 96 и 192 вычислительными ядрами EPYC Genoa. Для хранения данных доступны только тома Elastic Block Store (EBS).

 Источник: AWS

Источник: AWS

Отмечается, что инстансы EC2 Hpc7a отлично подходят для выполнения таких задач, как вычислительная гидродинамика и численные прогнозы погоды. Дополнительно можно использовать инструмент ParallelCluster с открытым исходным кодом, который упрощает развертывание кластеров HPC и управление ими. Вместе с тем средства AWS Batch помогают эффективно выполнять сотни тысяч пакетных задач в области вычислений и машинного обучения, при этом оптимизируя использование ресурсов.

Постоянный URL: http://servernews.ru/1091672
17.08.2023 [12:13], Сергей Карасёв

В AWS стали доступны инстансы EC2 M7a общего назначения на базе AMD EPYC Genoa

В ноябре 2021 года облачная площадка Amazon Web Services (AWS) запустила инстансы EC2 M6a с процессорами AMD EPYC Milan, работающими на частоте до 3,6 ГГц. А теперь объявлено о доступности инстансов общего назначения EC2 M7a с чипами AMD EPYC Genoa.

Новые инстансы используют процессоры с частотой до 3,7 ГГц. Утверждается, что по сравнению с EC2 M6a общая производительность увеличилась приблизительно на 50 %. Это даёт возможность «быстрее обрабатывать данные, консолидировать рабочие нагрузки и снизить стоимость владения».

 Источник изображения: AWS

Источник изображения: AWS

Заказчикам доступны от 1 до 192 vCPU, а объём оперативной памяти DDR5 составляет 4 Гбайт в расчёте на vCPU. Заявленная пропускная способность сетевого подключения варьируется от 12,5 Гбит/с до 50 Гбит/с, пропускная способность EBS — от 10 до 40 Гбит/с. Инстансы построены на базе AWS Nitro.

Говорится о сертификации SAP. По заявлениям AWS, инстансы EC2 M7a отлично подходят для таких задач, как финансовые приложения, имитационное моделирование, игры, серверы приложений, хранилища данных среднего размера, среды разработки приложений и пр. Инстансы уже доступны в регионах US East (Огайо), US East (Северная Вирджиния), US West (Орегон) и EU (Ирландия).

Постоянный URL: http://servernews.ru/1091607
31.07.2023 [16:12], Алексей Степин

AVX-512 вдвое ускоряет AMD EPYC Bergamo, а Genoa-X выигрывают от большого кеша

Хотя реализация AVX-512 в процессорах AMD на базе микроархитектуры Zen 4 сомнительна — настоящих 512-битных регистров у этих процессоров нет и для этого в два этапа задействуются имеющиеся 256-битные, сама ситуация на рынке делает эти решения уникальными.

Популярный ресурс Phoronix опубликовал новые тесты, в которых рассматривается выгода от включения поддержки AVX-512 в системах на базе AMD Bergamo. Также внимательно рассмотрен вопрос влияния на производительность большого кеша 3D V-Cache у новых EPYC Genoa-X.

 Поддержка AVX-512 может оказаться очень полезной процессору AMD EPYC. Источник здесь и далее: Phoronix

Поддержка AVX-512 может оказаться очень полезной процессору AMD EPYC. Источник здесь и далее: Phoronix

Несмотря на то, что AVX-512 является детищем Intel, ситуация складывается довольно абсурдная: текущая серия Sapphire Rapids сильно отстаёт по количеству ядер от AMD Bergamo, а многоядерные (до 144 ядер) Xeon серии Sierra Forest, скорее всего, поддержки AVX-512/AVX10 не получат.

Таким образом, AMD Bergamo с ядрами Zen 4c являются единственными в мире 128-ядерными процессорами с поддержкой 512-битных расширений. На примере AMD EPYC 9754 видно, что несмотря на отсутствие полноценных регистров такой ширины, выгода от активации AVX-512 может быть весьма существенной, в некоторых случаях практически двукратной, а в TensorFlow — даже шести- или десятикратной.

По сводному результату видно, что активация AVX-512 даёт Bergamo двукратный прирост производительности, хотя, разумеется, в конечном итоге всё зависит от конкретной нагрузки. Что интересно, задействование 512-битных расширений практически не влияет на частотные характеристики процессора — в среднем, этот показатель оставался равен все тем же 2,9 ГГц, что и без AVX-512.

А вот энергопотребление и тепловыделение в таком режиме заметно возрастают, однако не настолько, чтобы вызвать какие-либо проблемы с перегревом или активацию режима троттлинга, как в некоторых ранних моделях Intel Xeon с поддержкой AVX-512.

А теперь перейдём к EPYC 9684X (Genoa-X) — также достаточно уникальному процессору, сочетающему в себе 96 ядер, AVX-512 и 3D V-Cache, доводящий общий объём кеша L3 до гигантского значения 1,1 Гбайт. В данном случае разница также сильно варьируется в зависимости от характера нагрузки, но в некоторых случаях может быть и двукратной.

В среднем эффект выражается в 12 % приросте производительности, что также весьма неплохо. На тактовую частоту и уровень энергопотребления отключение 3D V-Cache влияния не оказывает. Таким образом становится очевидно, что AMD EPYC 9684X — процессор специфический, уступающий по количеству ядер Bergamo и заточенный исключительно под нагрузки, могущие эффективно использовать огромный объём кеша, такие, как OpenFOAM или OpenVINO.

Постоянный URL: http://servernews.ru/1090769
23.07.2023 [14:57], Сергей Карасёв

ВМС США обзаведутся 17,7-Пфлопс суперкомпьютером Blueback с ускорителями AMD Instinct MI300A

Министерство обороны США (DoD) объявило о планах по развёртыванию новой суперкомпьютерной системы в рамках Программы модернизации высокопроизводительных вычислений (HPCMP). Комплекс получил название Blueback — в честь американской подводной лодки USS Blueback (SS-581).

Сообщается, что Blueback расположится в Центре суперкомпьютерных ресурсов в составе DoD (Navy DSRC), который находится в ведении Командования морской метеорологии и океанографии (CNMOC). Суперкомпьютер заменит три старых вычислительных комплекса в экосистеме HPCMP.

Основой Blueback послужит платформа HPE Cray EX4000. Архитектура включает процессоры AMD EPYC Genoa, 128 гибридных ускорителей AMD Instinct MI300A (APU) и 24 ускорителя NVIDIA L40, связанных между собой 200G-интерконнектом Cray Slingshot-11. В состав комплекса войдёт Lustre-хранилище Cray ClusterStor E1000 вместимостью 20 Пбайт, включая 2 Пбайт пространства на базе SSD NVMe. Объём системной памяти — 538 Тбайт. Общее количество вычислительных ядер будет достигать 256 512.

 Источник изображения: Jonathan Holloway / DoD

Источник изображения: Jonathan Holloway / DoD

Ожидается, что суперкомпьютер Blueback будет введён в эксплуатацию в 2024 году. Кстати, совсем недавно центр Navy DSRC получил НРС-систему Nautilus производительностью 8,2 Пфлопс. Она содержит 176 128 ядер и 382 Тбайт памяти.

Постоянный URL: http://servernews.ru/1090412
19.07.2023 [22:03], Илья Коваль

Ядер много не бывает: первые тесты AMD EPYC Genoa-X и Bergamo показали почти безоговорочную победу над Intel Xeon Sapphire Rapids и Xeon Max

В Сети появились первые тесты процессоров AMD EPYC Genoa-X и Bergamo, которые были представлены в конце мая. Первый из них является вариантом Genoa с 3D V-Cache объёмом 768 Мбайт в максимальной конфигурации с 96 ядрами, что в сумме даёт 1152 Мбайт L3-кеша на процессор. Второй же предлагает до 128 ядер Zen4c с пониженной частотой и урезанным кешем и оптимизирован для нужд гиперскейлеров.

Так, согласно тестам Phoronix, в HPC- и ИИ-бенчмарках, на которые Genoa-X и ориентирован, 9684X в стандартном режиме в среднем обгоняет и обычные Genoa 9654 с «открученными» лимитами (cTDP 400 Вт), и Milan-X (7773X), и Xeon Sapphire Rapids (8490H), и Xeon Max (9480). Отдельно отмечается прирост производительности в сравнении с Milan-X, при этом разница между чипами составляет менее двух лет.

 Источник: Phoronix

Источник: Phoronix

Что касается Intel Xeon Max, которые благодаря набортной памяти HBM2e объёмом 64 Гбайт как раз должны составлять конкуренцию Genoa-X в «тяжёлых» задачах, из-за значительного меньшего количества ядер тягаться с EPYC могут далеко не всегда и показывают хорошие результаты в режиме HBM-only (без системной DDR5). Но это касается только задач, которым хватает набортной памяти, и отдельных (пока редких) нагрузок, которые заранее оптимизированы для актуальной платформы Intel и, например, умеют задействовать инструкции AMX для ИИ-вычислений.

 Источник: Phoronix

Источник: Phoronix

В этих же тестах был ещё один участник — EPYC 9754 (Bergamo). В нетипичных для него нагрузках он всё равно показал достойный результат, всё же 128 ядер — это 128 ядер. В ещё одном тестировании Phoronix он обогнал всех прочих участников, показав прирост на уровне 20 % в сравнении со старшим Genoa(-X) в нагрузках, которые хорошо распараллеливаются. При этом он оказался энергоэффективнее и своих собратьев с ядрами Zen4, и Intel Xeon.

Так что этот чип действительно будет интересен облачным провайдерам, но не только им. Это отлично решение для рендера и некоторых расчётных нагрузок. Intel сейчас не в состоянии противопоставить что-либо Bergamo, но гораздо интереснее увидеть сравнение новинок с AmpereOne. Пока что ServeTheHome отмечает значительное превосходство Bergamo над процессорами Ampere Altra Max, которые тоже имеют 128 ядер, но Arm и без SMT.

Постоянный URL: http://servernews.ru/1090249
25.06.2023 [11:54], Алексей Степин

Oracle отказалась в Exadata X10M от Intel Xeon в пользу AMD EPYC Genoa

Компания Oracle обещает, что новое поколение платформы Exadata X10M обеспечит более высокую производительность как при проведении транзакций, так и при выполнении функций аналитики. Достигнуто это путём отказа от процессоров Intel и перехода на 96-ядерные чипы AMD EPYC Genoa.

Предыдущее поколение, Exadata X9M, базировалось на паре 32-ядерных Intel Xeon 8358 (Ice Lake-SP). В новой платформе Oracle не стала использовать Sapphire Rapids, выбрав AMD EPYC Genoa. В сравнении с предыдущим поколением, новая платформа втрое быстрее при обработке транзакций и в 3,6 раза — в задачах аналитики. Серверы вмещают на 22 % больше данных, а флеш-хранилища стали в 2,4 раза более ёмкими. Также на 50 % вырос объём оперативной памяти.

 Источник изображения: Oracle

Источник изображения: Oracle

Компания продолжает придерживаться тесной политики интеграции аппаратного и программного обеспечения, начатой ещё в момент приобретения активов Sun Microsystems в 2009 году. В настоящее время немногие вендоры могут предложить своим клиентам аппаратный комплекс для СУБД такого масштаба. Отметим, что Exadata X10M также доступна в виде облачной услуги Oracle Exadata Cloud@Customer.

Постоянный URL: http://servernews.ru/1088911
Система Orphus