Материалы по тегу: hardware

11.04.2025 [11:43], Алексей Степин

NERPA представила универсальные высокопроизводительные серверы NORD D5720

Российская IT-сфера сегодня как никогда нуждается в отечественных аппаратных решениях, отвечающих современным стандартам производительности, расширяемости и совместимости. Отвечая на этот запрос, компания NERPA, производящая широкий спектр ИТ-оборудования для OCS Distribution, представила новые универсальные серверы NERPA NORD D5720 (НН 3000029184), сочетающие в себе поддержку современных процессоров Intel Xeon, памяти DDR5, гибко конфигурируемую дисковую подсистему и возможность установки современных мощных ускорителей.

В основе новинки лежит серверная платформа Intel на базе чипсета C741 с двумя сокетами LGA 4677, поддерживающая процессоры Xeon Scalable четвёртого (Sapphire Rapids) и пятого (Emerald Rapids) поколений. Это делает NORD D5720 одним из самых производительных решений, доступных российскому заказчику.

Эти процессоры имеют высокоскоростную восьмиканальную подсистему памяти DDR5. В реализации NORD D5720 используется материнская плата с 32 слотами DIMM, позволяющая устанавливать по 16 модулей (L)RDIMM процессор. Вкупе с поддержкой модулей LDRIMM объёмом 128 Гбайт это позволяет комплектовать серверы оперативной памятью DDR5-5200 объёмом до 2 Тбайт.

 Источник здесь и далее: NERPA

Источник здесь и далее: NERPA

Конфигурация дисковой подсистемы NORD D5720 может варьироваться в широки пределах, и, в зависимости от потребностей заказчика, выглядеть следующим образом:

  • До 12 накопителей SAS/SATA/NVMe формата 3,5″;
  • До 24 накопителей SAS/SATA/NVMe формата 2,5″;
  • 8 накопителей SAS/SATA + 4 накопителя SAS/SATA/NVMe.

Помимо этого, в задней части сервера может присутствовать дополнительная корзина для четырёх накопителей формата 2,5″, что позволяет довести количество дисков в системе до 28. За счёт возможностей платформы поддерживаются массивы SATA RAID 0/1/10/5, опционально доступна конфигурация с дополнительным HBA/RAID-контроллером.

Доступ к передним дисковым корзинам может блокироваться при помощи декоративной панели с замком. Здесь же, на передней панели, расположена пара портов USB 3.0 и разъём VGA, что упрощает процедуру непосредственного администрирования. Как и у всех современных серверных платформ, у NORD D5720 имеется выделенный сетевой порт удалённого управления (BMC ASPEED AST 2600).

Система NORD D5720 выполнена в форм-факторе 2U, но при этом имеет широкие возможности расширения — она, в зависимости от конфигурации дисковых корзин, может иметь до восьми слотов PCIe 5.0 (три райзера) и слот для высокоскоростного NIC OCP 3.0 (PCIe x16). Из восьми слотов PCIe три имеют подключение x16, остальные — x8. Все они рассчитаны на установку FHHL-карт.

Подсистема питания может оснащатсья двумя (1+1) блоками питания мощностью по 1300 Вт каждый, либо одним блоком мощностью 1600 Ватт, оба варианта соответствуют стандарту 80 PLUS Platinum. За продувку и отвод тепла отвечают четыре вентилятора типоразмера 80 × 80 × 38 мм со скоростью вращения до 16300 об/мин.

BMC в новых моделях NERPA NORD D5720 снабжена расширенной функциональностью, ранее в решениях NERPA недоступной. Это, например, возможность конфигурирования и управления RAID-массивами из графического интерфейса BMC. Также производитель заявляет о планах в ближайшее время полностью локализовать интерфейс BIOS и добавить поддержку группового управления для новых моделей.

Серверы NERPA NORD D5720 уже доступны для заказа, стоимость, наличие на складе и сроки поставки можно уточнить непосредственно на сайте производителя или у представителей сети OCS Distribution.

Постоянный URL: http://servernews.ru/1120733
11.04.2025 [11:00], Сергей Карасёв

NTT представила ИИ-чип для обработки видео на периферии

Компания NTT объявила о создании ИИ-чипа, предназначенного для задач инференса на периферии. Изделие может применяться для обработки видео высокой чёткости, в том числе в формате 4K, в реальном времени на устройствах со строгими ограничениями по мощности.

В качестве сфер применения новинки NTT выделяет беспилотные летательные аппараты и камеры видеонаблюдения. Например, благодаря представленному чипу дроны могут использоваться для обнаружения прохожих и объектов, таких как автомобили, с высоты до 150 м.

Для повышения эффективности инференса при одновременном снижении энергопотребления задействованы специальные алгоритмы. Входное изображение высокого разрешения сегментируется на фрагменты, после чего производится независимая обработка каждого из них. Это позволяет обнаруживать объекты небольшого размера.

 Источник изображений: NTT

Источник изображений: NTT

Параллельно с этим выполняется анализ целого изображения в сжатом виде для обнаружения крупных объектов. После этого полученные результаты объединяются: таким образом, могут быть идентифицированы как небольшие, так и крупные детали. При этом все операции могут выполняться независимо друг от друга, что обеспечивает высокую эффективность.

По заявлениям NTT, в случае нового изделия обнаружение объектов в реальном времени при разрешении 4K (30 к/с) возможно с тем же или более низким энергопотреблением (менее 20 Вт), что и при выполнении задачи с пониженным разрешением — 608 × 608 пикселей. Повышение эффективности вычислений достигается с помощью межкадровой корреляции и динамического управления точностью вычислений. Это позволяет добиться ИИ-инференса в реальном времени при низкой затрачиваемой мощности.

На коммерческий рынок изделие планируется вывести в течение 2025 года через операционную компанию NTT Innovative Devices Corporation. Отмечается также, что NTT продолжат разработку дополнительных технологий, связанных с новым чипом.

Постоянный URL: http://servernews.ru/1121123
11.04.2025 [08:56], Руслан Авдеев

Конец «зелёной повестки»: Трамп поддержал угольный сектор в США ради удовлетворения спроса ИИ ЦОД на энергию

Президент США Дональд Трамп (Donald Trump) подписал указы для реанимации угольного сектора страны. Ожидается, что это поможет удовлетворить растущий спрос на электричество со стороны ИИ ЦОД, сообщает Datacenter Dynamics. В прошлом году Международное энергетическое агентство (IEA) отметило, что мировое использование угля для электростанций уже достигло рекордных значений.

Указ 14241 (Executive Order 14241) призван устранить федеральные нормативные барьеры, «подрывающие добычу угля». Теперь использование угля для генерации электричества для ЦОД будет поощряться, заодно будет увеличен экспорт американского угля, а также будут приняты меры, гарантирующие, что федеральная политика не будет дискриминационной в отношении угледобычи и генерации электричества с помощью угольных электростанций.

Указ разрешает работать нескольким угольным электростанциям, которые ранее планировалось закрыть. Некоторые коммунальные компании уже продлили работу своих угольных электростанций в последние месяцы — рост спроса со стороны ЦОД считается главным драйвером новых процессов. Недавним примером стала Southern Company, в феврале объявившая, что намерена продлить срок работы трёх электростанций общей мощностью 8,2 ГВт — сроки закрытия перенесены с 2028 года на 2035. Похоже, что новый указ поощрит аналогичные шаги и других коммунальных компаний, особенно в районах концентрации ЦОД.

 Источник изображения: Pawel Czerwinski / Unsplash

Источник изображения: Pawel Czerwinski / Unsplash

Указ также предписывает федеральным ведомствам выявить запасы угля на федеральных землях, устранить нормативные барьеры для их добычи и обеспечить приоритетную выдачу лицензий на извлечение угля из недр. Также президент подписал указ, который обеспечивает угольным электростанциям иммунитет на два года от требований снизить токсичные выбросы.

Поддержка угольного сектора названа «национальным приоритетом» для развития растущей промышленности и рынка дата-центров — при этом новая политика резко контрастирует с мерами принимавшимися властями в последние 25 лет. Доля угольного топлива, используемого в США, упала до приблизительно 15 % в сравнении с 2001 годом, когда он обеспечивал генерацию 51 % энергии Соединённых Штатов.

Кроме того, согласно недавним данным аналитического центра Ember, хотя нынешняя администрация сокращает федеральную поддержку возобновляемой энергии, за cчёт ветра и солнца сегодня генерируется больше электричества в США, чем за счёт угля. Так, генерация солнечной энергии в США увеличилась на 64 ТВт∙ч, ветряной — на 32 ТВт∙ч, а угольной — упала на 22 ТВт∙ч. Более того, в последние годы солнечная энергетика стала более дешёвой альтернативой угольной. В 2023 году исследователи Energy Innovation выяснили, что 99 % существующих в США угольных электростанций дороже в эксплуатации в сравнении с новыми солнечными или ветряными — солнечные в среднем минимум на 30 % дешевле в этом отношении.

 Источник изображения: Alpha Perspective / Unsplash

Источник изображения: Alpha Perspective / Unsplash

Несмотря на это, действующая администрация, похоже, нацелена на продолжительную поддержку использования ископаемого топлива в качестве решения задачи роста рынка ЦОД. В первые несколько дней Трамп провозгласил «чрезвычайное энергетическое положение», подписал приказы, продвигающие добычу нефти и газа на Аляске, отозвал лицензии на ветряную энергетику на внешнем континентальном шельфе США и вышел из Парижского климатического соглашения.

Реанимация угольного сектора приведёт к значительному росту выбросов электростанциями, угольная энергетика — одна из вреднейших для окружающей среды. Так, в сравнении с природным газом, при использовании угля выбрасывается вдвое больше углекислого газа — при этом такое топливо значительно менее энергетически эффективно.

Ранее сообщалось, что Трамп уже дал «зелёный свет» ископаемому топливу и компании от Chevron до Crusoe уже готовят собственные проекты. Кроме того, ещё раньше появилась информация, что уголь может вновь стать одним из драйверов роста энергетики. Ранее сообщалось, что достижение нулевых выбросов в стране гиперскейлерами может оказаться под вопросом, но с нынешней политикой этот вопрос стал, скорее всего, второстепенным.

Постоянный URL: http://servernews.ru/1121071
10.04.2025 [19:31], Руслан Авдеев

ИИ-континент: Евросоюз намерен как минимум утроить ёмкость дата-центров в ближайшие годы

В следующие пять-семь лет Евросоюз намеревается более чем втрое нарастить ёмкость своих дата-центров. Это позволит снизить зависимость от вычислительных мощностей, находящихся в других регионах мира, сообщает Computer Weekly, и сформировать крупный единый рынок общим набором «правил безопасности», которые обеспечат ИИ-технологий. Основные векторы развития подробно изложены в проекте ЕС AI Continent Action Plan.

В проекте документа заявляется, что сейчас ЕС отстаёт по объёму доступных мощностей ЦОД от США и Китая, в значительной степени используя облачную инфраструктуру из других регионов мира. Это вызывает обеспокоенность у бизнеса и политиков. Для того, чтобы удовлетворить потребности предприятий и государственных органов в ИИ и вычислениях в целом, а также обеспечить суверенитет и конкурентоспособность, предлагается наращивать собственные облачные мощности и мощности ЦОД вообще.

Для этого проводятся консультации по разработке «Закона о развитии облачных технологий и ИИ» (Cloud and AI Development Act), который позволит ускоренно строить новые ЦОД в Евросоюзе. В документе указывается, что сегодня среднее время получения разрешения на строительство и эколицензий в Европе часто превышает 48 месяцев, при этом площадки для строек и энергию ещё поискать надо. Новый закон должен устранить препятствия.

Проектам ЦОД, соответствующим требованиям по эффективному использованию энергии и воды, разрешения будут выдавать в упрощённом порядке. Также предполагается «улучшить» конкуренцию на рынке облачных услуг, предоставив возможность выхода на него большему числу облачных провайдеров. Эти и другие действия — часть проекта Евросоюза по созданию собственного, особого подхода к развитию искусственного интеллекта, основанного на сильных сторонах объединения, позволяющих превратить ЕС в «континент ИИ».

 Источник изображения:  Maks Key/unsplash.com

Источник изображения: Maks Key/unsplash.com

В документе упоминается, что в ЕС действуют 6300 стартапов в области ИИ, более 600 из них работают над созданием систем генеративного ИИ. Тем не менее, нужно принимать меры, чтобы обеспечить компании и исследователей ресурсами, необходимые для успешной реализации проектов. Для этого необходимо будет расширить общедоступную ИИ-инфраструктуру с созданием «гигафабрик» с энергоэффективными и высокопроизводительными вычислительными системами, которые можно будет объединить в сети.

ЕС уже обязался выделить €20 млрд на финансирование ИИ-инфраструктуры, чтобы частично компенсировать расходы на создание в Европе пяти ИИ-фабрик, также стороны приглашаются к созданию государственно-частных партнёрств для ускоренного строительства соответствующих объектов. Гигафабрики станут своеобразными центрами притяжения для сотрудничества исследователей, предпринимателей и инвесторов в проектах разной направленности, от здравоохранения до робототехники и науки в целом.

 Источник изображения: Alessio Ferretti/unsplash.com

Источник изображения: Alessio Ferretti/unsplash.com

Превращение Евросоюза в «ИИ-сверхдержаву» также потребует доступа к более качественным данным, и активной разработки ИИ в самом ЕС, а также поощрения внедрения ИИ-систем в стратегически важных секторах. Также в документе упоминается необходимость наращивания базы талантов в сфере искусственного интеллекта — этого можно будет добиться, упростив легальную миграцию профильных квалифицированных специалистов.

Документ ЕС во многом перекликается с недавно представленным проектом превращения Великобритании в «ИИ-сверхдержаву». В частности, там тоже намерены стимулировать инновации в области ИИ, наращивать вычислительные и энергетические мощности и др.

Постоянный URL: http://servernews.ru/1121084
10.04.2025 [16:26], Руслан Авдеев

X5 Group построит собственный ЦОД в Подмосковье

Известная в России продуктовая компания X5 Group, курирующая торговые сети «Пятёрочка», «Перекрёсток» и «Чижик», заявила о начале строительства собственного дата-центра в Московской области. Новый ЦОД станет одним из ключевых элементов IT-инфраструктуры X5, сообщает пресс-служба компании.

Запустить ЦОД в эксплуатацию планируется в III квартале 2026 года. Его будут использовать для размещения собственных информационных систем группы (для логистики, аналитики и управления торговлей), а также для «развития корневой инфраструктуры, облачных платформ, обработки больших данных, внедрения ИИ, резервного копирования», заявили в X5.

В будущем объект призван стать гибким инструментом для быстрого запуска и масштабирования новых цифровых продуктов. По данным компании, ЦОД площадью 6 тыс. м2 и мощностью 10 МВт строится с учётом требований к повышенной отказоустойчивости уровня Tier III по классификации Uptime Institute.

 Источник изображения: X5 Group

Источник изображения: X5 Group

Объект спроектировали с учётом современных требований к энергоэффективности подобных проектов. Он предусматривает использование двух независимых энергетических контуров. Предусмотрено и питание от резервных генераторов, а также система охлаждения наружным воздухом (DFC). Такие характеристики позволят добиться оптимального показателя PUE и уменьшить экологическую нагрузку.

По словам управляющего директора X5 Tech, одним из ключевых приоритетов группы является развитие цифровой инфраструктуры, а строительство собственного дата-центра даст возможность свести к минимуму зависимость от внешних сервисов, повысить надёжность собственной инфраструктуры и предлагать более качественные IT-решения как для внутреннего использования, так и клиентам. Кроме того, собственный ЦОД позволит снизить стоимость владения и сократить расходы X5 более чем втрое.

Вместе с тем строительство и обслуживание собственного дата-центра является новым вызовом и новым уровнем компетенции для компании. При создании дата-центра внедряются самые лучшие технологии в области охлаждения, энергоснабжения и автоматизации. Параллельно создаётся команда, которая будет отвечать за энергетику, микроклимат и вспомогательные инженерные системы ЦОД.

Постоянный URL: http://servernews.ru/1121088
10.04.2025 [16:11], Владимир Мироненко

Выручка Selectel увеличилась в 2024 году на 29 % на фоне роста спроса на IaaS

Провайдер IT-инфраструктуры АО «Селектел» (Selectel) опубликовал аудированную финансовую отчетность по МСФО за 2024 год, подтвердившую неаудированные результаты.

Выручка Selectel увеличилась на 29 % год к году до 13,2 млрд руб. Большую часть денежных поступлений — 87 % — обеспечили облачные инфраструктурные сервисы, продажи которых выросли на 32 % год к году до 11,4 млрд руб., что соответствует прогнозам по росту рынка IaaS. На услуги ЦОД приходится 11 % выручки или 1,1 млрд руб. (рост год к году на 1 %), на прочие услуги — 5 % или 0,7 млрд руб. (рост — 33 %).

Клиентская база Selectel увеличилась на 3,8 тыс. новых компаний до 27,8 тыс. У всех групп клиентов зафиксирован рост выручки, больше всего — у крупных клиентов — на 48 % год к году. При этом на Топ-5 клиентов приходится 15 % выручки компании. Наиболее популярны сервисы Selectel в сфере IT, ретейла и медиа, на которые приходится 63 % всех клиентов. Наиболее активно наращивали темпы использования облаков девелопмент (рост в 1,5 раза год к году), ретейл (в 1,5 раза) и медиа (в 1,4 раза).

 Источник: Selectel

Источник: Selectel

Чистая прибыль Selectel увеличилась на 19 % до 3,3 млрд руб. Рентабельность по чистой прибыли составила 25 %. Показатель скорректированной EBITDA увеличился на 24 % до 7,0 млрд руб. Рентабельность по скорр. EBITDA сохранилась на высоком уровне (53 %), хотя снизилась год к году на 2 п.п. в связи с увеличением расходов, направленных на привлечение клиентов и увеличение потенциала продаж.

Капитальные затраты за отчётный период составили 5,9 млрд руб. Большая часть суммы (3,8 млрд руб.) была израсходована на серверное оборудование, 1,9 млрд руб. было направлено на развитие инфраструктуры дата-центров (рост в 1,7 раза год к году), в том числе на развитие дата-центра «Юрловский». За прошедший год компанией было введено в эксплуатацию 112 стоек. На начало 2025 года в ЦОД Selectel насчитывалось 3612 стоек.

Долговая нагрузка сохранилась на комфортном уровне. Показатель «чистый долг/скорр. EBITDA» составил 1,9х на конец 2024 года по сравнению с 1,4х на конец 2023 года.

Постоянный URL: http://servernews.ru/1121090
10.04.2025 [15:01], Руслан Авдеев

В Эдинбургском университете заработал ИИ-кластер на базе Cerebras CS-3

Эдинбургский университет и Cerebras Systems развернули в суперкомпьютерным центре EPCC кластера из четырёх ИИ-систем CS-3 на базе царь-ускорителей WSE-3. Новые мощности являются частью Edinburgh International Data Facility. По словам EPCC, это крупнейший кластер CS-3 в Европе. EPCC уже имеет опыт работы с системами CS-1 и CS-2. В Cerebras заявили, что гордятся расширением сотрудничества с EPCC, которое поможет стать Великобритании одним из ключевых мировых ИИ-хабов.

Как заявляют в EPCC, ИИ сегодня изменяет все сферы жизни, поэтому новые системы помогут университетам, государственным организациям и компаниям обучать и использовать ИИ-модели на скоростях и с лёгкостью, недоступной другим ИИ-решениям. Платформы Cerebras оптимизированы не только для масштабного обучения моделей, но и для сверхбыстрого инференса — пользователям кластера теперь доступна платформа-рекордсмен Cerebras AI Inference. Системы CS-3 способны выдавать до 2000 токенов/с для популярных ИИ-моделей.

 Источник изображения: Nadia Ramella/unsplash.com

Источник изображения: Nadia Ramella/unsplash.com

С новыми кластерами на основе Cerebras CS-3, EPCC сможет обучать модели от 240 млрд до 1 трлн параметров, а также ежедневно тюнинговать модели с 70 млрд параметров. Лёгкость использования технологий Cerebras позволяет использовать ИИ-модели и в дисциплинах, не относящихся к компьютерным наукам. Технологии Cerebras обеспечивают линейную масштабируемость, что ускоряет инновации и повышает продуктивность команды EPCC, говорится в сообщении.

Эдинбургский университет считается одним из лидеров в разработке ИИ-систем в последние 60 лет. Системы CS-2 в распоряжении EPCC уже позволили исследователям разработать высокоэффективное ПО для инференса для больших языковых моделей (LLM) — как для местного применения, так и для помощи исследователям из Индии в разработке ИИ-моделей для материаловедения и из Швейцарии — для адаптации LLM к местному диалекту немецкого языка. Кроме того, платформы CS-3 с миллионами вычислительных ядер позволят продолжить исследования EPCC в областипараллельных вычислений и энергоэффективности.

Постоянный URL: http://servernews.ru/1121065
10.04.2025 [11:27], Сергей Карасёв

SSD с «хвостиком»: Kioxia представила «оптические» SSD для дата-центров следующего поколения

Компании Kioxia, AIO Core и Kyocera объявили о разработке прототипа SSD с оптическим интерфейсом, совместимого с PCIe 5.0. Изделие ориентировано на дата-центры следующего поколения, рассчитанные на ресурсоёмкие нагрузки, включая приложения ИИ с высокой интенсивностью обмена данными.

О разработке «оптических» твердотельных накопителей Kioxia сообщала в августе прошлого года. Речь идёт об использовании оптического интерфейса подключения вместо традиционного электрического. Новый подход позволяет устранить влияние посторонних электромагнитных помех. При этом длина соединения может достигать 40 м с последующим увеличением до 100 м.

В представленном прототипе SSD задействованы оптический трансивер IOCore разработки AIO Core и технология оптоэлектронной интеграции Optinity компании Kyocera. Реализованная оптическая система, как утверждается, позволяет устройству функционировать на скоростях интерфейса PCIe 5.0.

 Источник изображения: Kioxia

Источник изображения: Kioxia

Разработка «оптического» SSD осуществляется в рамках японского проекта JPNP21029 «Развитие технологий зелёных центров обработки данных следующего поколения». Он субсидируется Организацией по развитию новых энергетических и промышленных технологий (NEDO). Цель инициативы заключается в сокращении энергопотребления ЦОД более чем на 40 % по сравнению с нынешними площадками. В рамках проекта Kioxia отвечает за SSD нового типа, тогда как AIO Core и Kyocera создают оптоэлектронные компоненты.

Предполагается, что появление «оптических» SSD откроет новые возможности в плане проектирования дата-центров. Представленная технология позволит значительно увеличить физическое расстояние между вычислительными и запоминающими устройствами, обеспечивая при этом энергоэффективность и высокое качество сигнала.

Постоянный URL: http://servernews.ru/1121059
10.04.2025 [09:14], Владимир Мироненко

ZeroPoint Technologies и Rebellions займутся разработкой ИИ-ускорителей со «сжимаемой» памятью

Шведская компания ZeroPoint Technologies, специализирующаяся на создании решений для оптимизации памяти, объявила о стратегическом альянсе с южнокорейским разработчиком ИИ-чипов Rebellions с целью разработки ИИ-ускорителей для инференс. Компании планируют представить новые продукты в 2026 году, обещая «беспрецедентную производительность в пересчёте на токены в секунду на Вт (TPS/W)», пишет EE Times.

Компании планируют увеличить эффективную пропускную способность и ёмкость памяти для нагрузок инференса, используя технологии сжатия, уплотнения и управления памятью от ZeroPoint Technologies. По словам генерального директора ZeroPoint Technologies Класа Моро (Klas Moreau), аппаратная оптимизация работы с памятью на уровне ЦОД позволит увеличить адресуемую ёмкость с ускорением работы почти в 1000 раз по сравнению с использованием программного сжатия.

Компании планируют улучшить показатели токенов в секунду на Вт без ущерба для точности, используя сжатие модели без потерь для уменьшения её размера и сокращения использования энергии, необходимой для перемещения компонентов модели. Гендиректор Rebellions Сонхён Пак (Sunghyun Park) указал, что партнёрство позволит компаниям переопределить возможности инференса, предоставляя более умную, экономичную и устойчивую ИИ-инфраструктуру.

 Источник изображения: ZeroPoint Technologies

Источник изображения: ZeroPoint Technologies

Моро ранее заявил, что более 70 % данных, хранящихся в памяти, являются избыточными, что позволяет полностью избавиться от них, добившись сжатия без потерь полезной информации. Такая технология сжатия должна выполнять ряд специфических действий в пределах наносекунды, т.е. всего нескольких тактов: «Во-первых, она должна отрабатывать сжатие и распаковку. Во-вторых, она должна уплотнять полученные данные, собирая небольшие фрагменты в единичную линию кеша, чтобы значительно улучшить видимую пропускную способность памяти, и, наконец, она должна бесперебойно управлять данными, отслеживая все фрагменты. Чтобы минимизировать задержку, такой подход должен работать с гранулярностью линий кеша — сжимая, уплотняя и управляя данными в 64-байт фрагментах — в отличие от гораздо больших блоков 4–128 Кбайт, используемых традиционными методами сжатия вроде ZSTD и LZ4».

По словам Моро, благодаря этой технологии, для базовых рабочих нагрузок в ЦОД гиперскейлера адресуемая ёмкость памяти и пропускная способность могут быть увеличены в два-четыре раза, производительность на Вт может увеличиться на 50 %, а совокупная стоимость владения (TCO) может быть значительно снижена. А для специализированных нагрузок, таких как большие языковые модели (LLM), интеграция программного сжатия в сочетании с встроенной аппаратной декомпрессией (что минимизирует любую дополнительную задержку) уже продемонстрировала прирост примерно на 50 % в адресуемой ёмкости памяти, пропускной способности и токенах в секунду.

Моро утверждает, что грядущая интеграция аппаратной (де-)компрессии обещает ещё более существенные улучшения. Например, для базовых ИИ-нагрузок кластер со 100 Гбайт физической памяти благодаря использованию этой технологии будет функционировать так, как если бы у него было 150 Гбайт памяти. «Это не только представляет собой миллиарды долларов потенциальной экономии, но и может повысить производительность сложных ИИ-моделей», — заявил Моро. «Эти достижения обеспечивают надёжную основу для компаний, производящих чипы ИИ, позволяя бросить вызов доминированию таких гигантов отрасли, как NVIDIA», — добавил он.

Постоянный URL: http://servernews.ru/1121013
09.04.2025 [21:55], Владимир Мироненко

Google представила ИИ-ускоритель TPU v7 Ironwood, созданный специально для инференса «размышляющих» моделей

Компания Google Cloud представила тензорный ускоритель TPU седьмого поколения Ironwood, который охарактеризовала как свой самый производительный и масштабируемый настраиваемый ИИ-ускоритель на сегодняшний день и первый среди её чипов, разработанный специально для инференса.

Новый чип представляет собой важный поворот в десятилетней стратегии Google по разработке ИИ-чипов, отметил ресурс VentureBeat. В то время как предыдущие поколения TPU были созданы в первую очередь для рабочих нагрузок обучения и инференса, Ironwood — первый чип, специально созданный для инференса.

Как пояснила Google, Ironwood знаменует значительный сдвиг в развитии ИИ и инфраструктуры — переход от простых ИИ-моделей, которые просто предоставляют информацию в режиме реального времени, к моделям, которые обеспечивают проактивную генерацию идей и интерпретацию данных. Компания назвала этот период «эпохой инференса», когда ИИ-агенты будут активно извлекать и генерировать данные, чтобы совместно предоставлять информацию и ответы, а не просто «голые» сведения.

 Источник изображений: Google

Источник изображений: Google

Ironwood разработан в соответствии со сложными вычислительными и коммуникационными требованиями «моделей мышления», которые охватывают большие языковые модели (LLM), смешанные экспертные модели (MoE) и сложные задачи для рассуждения. Эти модели требуют массивной параллельной обработки и эффективного доступа к памяти. В частности, Ironwood разработан для минимизации перемещения данных и задержек на чипе при выполнении массивных тензорных манипуляций. Требования размышляющих моделей к вычислительным мощностям выходят далеко за рамки возможностей любого отдельного чипа.

Google Cloud Ironwood будет поставляться в двух конфигурациях: с 256 или с 9216 чипами. Один чип может похвастаться пиковой вычислительной мощностью 4614 Тфлопс (FP8), а кластер из 9216 чипов мощностью порядка 10 МВт выдаёт в общей сложности 42,5 Эфлопс. Ironwood оснащён усовершенствованным блоком SparseCore, предназначенным для ускорения работы с ИИ-моделями, которые используются в системах ранжирования и рекомендаций. Расширенная реализация SparseCore в Ironwood позволяет ускорить более широкий спектр рабочих нагрузок, выйдя за рамки традиционной области ИИ в финансовые и научные сферы.

Каждый чип оснащен 192 Гбайт памяти HBM, что в шесть раз больше, чем у TPU v6 Trillium. Пропускная способность памяти достигает 7,2 Тбайт/с на чип, что в 4,5 раза больше, чем у Trillium. Также используется межчиповый интерконнект Inter-Chip Interconnect (ICI) с пропускной способностью 1,2 Тбайт/с в дуплексе, что в 1,5 раза больше, чем у Trillium. Наконец, самое важное в эпоху ограниченных по мощности ЦОД — Ironwood обеспечивает вдвое большую производительность на Вт по сравнению с Trillium, а в сравнении с самым первым TPU от 2018 года он почти в 30 энергоэффективнее. Для Ironwood используется СЖО.

С Ironwood разработчики также могут задействовать программный стек Pathways от Google DeepMind, чтобы использовать объединённую вычислительную мощность десятков тысяч TPU Ironwood. Как сообщается, Ironwood будет доступен клиентам Google и её собственным разработчикам в конце 2025 года.

Google зафиксировала 10-кратный рост спроса на ИИ-вычисления за последние восемь лет. Как отметил ресурс VentureBeat, перенос Google фокуса на оптимизацию инференса имеет смысл. Обучение производится редко, а операции инференса — миллиарды раз в день. Экономика ИИ всё больше связана с затратами на инференс, особенно по мере того, как модели становятся всё более сложными и требующими больших вычислительных ресурсов.

Постоянный URL: http://servernews.ru/1121034
Система Orphus