Материалы по тегу: ии
14.12.2024 [15:15], Сергей Карасёв
Представлен ПАК Tantor XData 2.0 на основе СУБД Tantor 16.6 и серверов «Аквариус»Компания «Тантор Лабс», входящая в «Группу Астра», анонсировала программно-аппаратный комплекс (ПАК) Tantor XData 2.0 для поддержания работы СУБД Tantor. По сравнению с платформой предыдущего поколения новинка, как утверждается, демонстрирует более высокую производительность, а также обладает улучшенным интерфейсом. Оригинальная версия Tantor XData дебютировала в феврале нынешнего года: в разработке решения приняли участие специалисты группы компаний «Аквариус». Говорилось о применении серверов на процессорах Intel Xeon Cascade Lake-SP, AMD EPYC, Baikal-S или Kunpeng 920, а также ОС Astra Linux Special Edition. А в апреле 2024-го «Группа Астра» создала компанию «Иксдата» по выпуску ПАК для высоконагруженных СУБД. Говорится, что в Tantor XData 2.0 применяется аппаратно-программное RAID-решение собственной разработки, которое обеспечивает трёхкратное сжатие данных и увеличивает производительность подсистемы хранения до 102 тыс. TPS (транзакций в секунду) в тестах pgbench (операции чтения/записи). Это на 25 % больше по сравнению с ПАК предыдущей версии. В состав комплекса включено S3-совместимое хранилище, позволяющее гибко масштабировать ресурсы. При этом обеспечивается высокая доступность данных благодаря возможности дублирования и распределения между разными узлами. Реализована новая встроенная система резервного копирования на основе WAL-G: благодаря использованию объектного хранилища S3 упрощается восстановление информации из резервных копий. Кроме того, возможна миграция резервных копий баз данных между различными площадками или регионами. Применяется СУБД Tantor 16.6. Усовершенствованный графический интерфейс с модулем управления и мониторинга аппаратных ресурсов DCImanager позволяет централизованно взаимодействовать как с программной, так и с аппаратной частью ПАК в режиме «одного окна»: это повышает удобство и прозрачность административных операций. В Tantor XData 2.0 улучшены возможности работы с кластерами баз данных: остановка и запуск для планового обслуживания, ведение реестра задействованных ресурсов, автоматизированное выделение сетевых и дисковых ресурсов при формировании кластера, усиленный механизм работы с секретами для повышения уровня безопасности. Интерфейс для проведения полного цикла инсталляции/обновления и конфигурирования ПАК XData 2.0 обеспечивает автоматизацию ключевых этапов: монтажа, коммутации и первичной настройки аппаратного комплекса, установки и конфигурации операционной системы на управляющие и вычислительные серверы, на серверы хранения данных, установку, настройку, диагностику и обновление компонентов ПАК, предварительную проверку перед вводом в промышленную эксплуатацию.
13.12.2024 [17:33], Руслан Авдеев
Crusoe Energy привлекла $600 млн инвестиций, которые потратит на строительство одного из крупнейших в мире ИИ ЦОДСтартап Crusoe Energy Systems LLC, занимающийся строительством ИИ ЦОД, объявил об успешном привлечении $600 млн. Эти средства направят на ускоренное расширение физической инфраструктуры компании, сообщает The Information. Раунд финансирования серии D обеспечил рост стоимости компании до $2,8 млрд. Его возглавил фонд Founders Fund Питера Тиля (Peter Thiel), участие приняли NVIDIA, Fidelity, Long Journey Ventures, Mubadala, Ribbit Capital и Valor Equity Partners. Основанная в 2018 году Crusoe изначально занималась строительством контейнерных ЦОД для нефтяных полей — такие объекты работают на попутном «факельном» газе. Компания использовала энергию для майнинга биткоинов, но позже переориентировалась на ИИ-проекты и HPC-решения в целом, а сейчас переключилась на строительство крупных дата-центров. Кроме того, был анонсироване сервис Crusoe Cloud. В компании заявляют, что могут обеспечить экономически эффективные масштабные ИИ-вычисления, предоставляя экологически безопасную инфраструктуру. ![]() Источник изображения: Ruthson Zimmerman/unsplash.com В октябре 2024 года Crusoe сформировала совместное предприятие с Blue Owl Capital и Primary Digital стоимостью $3,4 млрд для строительства кампуса ЦОД из двух зданий в Техасе. Кампус обеспечат около 93 тыс. м3 площадей и получит около 1,2 ГВт энергии. Объект будет вмещать до 100 тыс. современных ускорителей и станет одним из крупнейших в мире дата-центров, построенных специально для ИИ-нагрузок. По-видимому, вычислительные мощности именно этого кампуса при посредничестве Oracle и Microsoft достанутся OpenAI. В прошлом году компания объявила о расширении сотрудничества с ведущими технологическими компаниями, включая NVIDIA, Vast Data Inc., Deloitte и Rescale Inc. Теперь Crusoe действует в девяти штатах США и трёх странах, включая Исландию. Новые инвестиции, по данным компании, позволят ей построить больше ЦОД, в изобилии обеспеченных чистой энергией. Уже сейчас ведётся реализация проектов дата-центров общей ёмкостью более 15 ГВт.
13.12.2024 [15:33], Андрей Крупин
«Лаборатория Касперского» внедрила GigaChat в систему KUMA для мониторинга и анализа инцидентов ИБ«Лаборатория Касперского» сообщила о расширении функциональных возможностей программного комплекса Kaspersky Unified Monitoring and Analysis Platform (KUMA) и включении в состав продукта инструментов анализа событий безопасности посредством нейросетевой модели GigaChat от «Сбера». KUMA относится к классу решений SIEM (Security Information and Event Management) и позволяет IT-службам в режиме реального времени осуществлять централизованный мониторинг событий ИБ, выявлять инциденты информационной безопасности, оперативно реагировать на возникающие угрозы, а также выполнять требования, предъявляемые регуляторами к защите персональных данных, в том числе к обеспечению безопасности государственных информационных систем. Построенный на базе GigaChat инструментарий получил название KIRA — Kaspersky Investigation and Response Assistant. Он позволяет сократить объём выполняемых ИБ-персоналом рутинных операций и снизить вероятность ошибок при анализе инцидентов — искусственный интеллект автоматически формирует карточки событий, оценивает степень их риска и помогает в принятии решений о приоритетности реагирования. Также ИИ в KUMA позволяет работать с системой профильным сотрудникам с разным уровнем подготовки. Так, опираясь на анализ от GigaChat, начинающие специалисты могут принимать более быстрые и точные решения по реагированию на инциденты. ![]() Пример работы Kaspersky Investigation and Response Assistant (источник изображения: «Лаборатория Касперского») «Лаборатория Касперского внедряет инструменты искусственного интеллекта в свои решения уже более 20 лет. Интеграция KUMA с GigaChat — логичное продолжение развития наших защитных продуктов с опорой на передовые технологии и прекрасный пример того, как лидеры в своих областях объединяют усилия, чтобы усовершенствовать безопасность организаций и помочь специалистам в их работе», — говорится в заявлении «Лаборатории Касперского». SIEM-платформа KUMA зарегистрирована в реестре отечественного ПО и имеет статус рекомендованной для использования в государственных ведомствах и организациях РФ.
13.12.2024 [12:05], Сергей Карасёв
Объём облачного рынка в России в 2024 году вырос на треть — до 165,6 млрд рублейВ 2024 году объём российского рынка облачных инфраструктурных сервисов достиг примерно 165,6 млрд руб., что соответствует росту на 36,3 % по отношению к 2023-му. Такую оценку дают аналитики iKS-Consulting. Отмечается, что рост отрасли в долларовом выражении составил только 8,6 % — до $1,95 млрд. Объясняется это резким падением курса рубля по отношению к иностранным валютам. В сегменте IaaS+PaaS лидером по выручке по итогам 2024 года стал Cloud.ru (до 2022 года входил в структуру «Сбера») с долей 28,9 %. На втором месте находится РТК-ЦОД с 16,9 %, а замыкает тройку Yandex Cloud с 11,4 %. Кроме того, в первую пятёрку вошли Selectel и MTS Web Services (MWS) с результатом 6,7 % и 6,5 % соответственно. Если рассматривать только направление PaaS, то первое место в рейтинге ведущих провайдеров занимает Cloud.ru с долей 45,6 %. Затем идут Yandex Cloud и РТК-ЦОД, контролирующие соответственно 26,7 % и 5,3 % сегмента. В сфере IaaS также лидирует Cloud.ru — доля зафиксирована на уровне 24,7 %. На втором и третьем местах находятся РТК-ЦОД и MTS Web Services с результатом 19,8 % и 8,1 %. ![]() Источник изображений: iKS-Consulting «Активное развитие российского IT-рынка происходило в том числе на фоне общемирового тренда на повышение проникновения высоких технологий во все сферы бизнеса и дополнительного импульса, полученного в результате пандемии COVID-19. В России также продолжается цифровая трансформация экономики, одним из наиболее заметных трендов которой является внедрение технологий ИИ в различные бизнес-процессы», — отмечается в исследовании iKS-Consulting. ![]() Среди ключевых драйверов облачного рынка в России авторы исследования называют быстрое развитие сервисов ИИ, ограниченные возможности предприятий по инвестициям в собственную инфраструктуру, спрос на услуги со стороны государства, а также миграцию заказчиков на отечественные платформы. Кроме того, наблюдается расширение облачных инфраструктур в целом. ![]() С другой стороны, существуют сдерживающие факторы: это сохраняющееся недоверие к облачным услугам со стороны ряда организаций, дефицит специализированных кадров и экономическая нестабильность. Для расширения облачных инфраструктур требуются значительные инвестиции в серверы и другое оборудование, что приводит к росту цен для конечных клиентов.
12.12.2024 [23:59], Руслан Авдеев
Царь-ускоритель Cerebras WSE-3 в одиночку обучил ИИ-модель с 1 трлн параметровCerebras Systems совместно с Сандийскими национальными лабораториями (SNL) Министерства энергетики США (DOE) провели успешный эксперимент по обучению ИИ-модели с 1 трлн параметров с использованием единственной системы CS-3 с царь-ускорителем WSE-3 и 55 Тбайт внешней памяти MemoryX. Обучение моделей такого масштаба обычно требует тысяч ускорителей на базе GPU, потребляющих мегаватты энергии, участия десятков экспертов и недель на наладку аппаратного и программного обеспечения, говорит Cerebras. Однако учёным SNL удалось добиться обучения модели на единственной системе без внесения изменений как в модель, так и в инфраструктурное ПО. Более того, они смогли добиться и практически линейного масштабирования — 16 систем CS-3 показали 15,3-кратный прирост скорости обучения. Модель такого масштаба требует терабайты памяти, что в тысячи раз больше, чем доступно отдельному GPU. Другими словами, классические кластеры из тысяч ускорителей необходимо корректно подключить друг к другу ещё до начала обучения. Системы Cerebras для хранения весов используют внешнюю память MemoryX на базе 1U-узлов с самой обычной DDR5, благодаря чему модель на триллион параметров обучать так же легко, как и малую модель на единственном ускорителе, говорит компания. Ранее SNL и Cerebras развернули кластер Kingfisher на базе систем CS-3, который будет использоваться в качестве испытательной платформы при разработке ИИ-технологий для обеспечения национальной безопасности.
12.12.2024 [18:37], Руслан Авдеев
Broadcom поможет Apple создать собственные серверные ИИ-ускорителиПо неофициальным данным, Apple работает с Broadcom над разработкой серверного ИИ-ускорителя для обслуживания ИИ-сервисов в своих ОС. По словам трёх анонимных источников The Information, чип создаётся в рамках проекта Baltra и будет запущен в производство в 2026 году. Ранее компании уже работали над 5G-технологиями. Деталей пока немного. На одной из конференций в этом году представитель Apple заявил, что ИИ-экосистема Apple Intelligence должна работать как на самих устройствах компании, так и в частном облаке Apple Private Cloud Compute на базе чипов M2 Ultra. Они используются для инференса, тогда как для обучения ИИ-моделей Apple использует ускорители Google TPU. Первые слухи о том, что компания разрабатывает серверные ускорители, появились в мае 2024 года. У компании богатый опыт разработки Arm-чипов, а Broadcom, помимо прочего, продаёт лицензии на различные IP-блоки и уже не раз помогала гиперскейлерам в создании кастомных чипов. Не так давно Broadcom анонсировала новую технологию упаковки 3.5D eXtreme Dimension System in Package (3.5D XDSiP), которая как раз ориентирована на создание высокопроизводительных кастомных чипов. Она позволяет объединить два 3D-стека, пару I/O чиплетов и до 12 модулей памяти HBM3 в одной упаковке, занимающей более 6000 мм². Производство первых чипов по этой технологии ожидается в 2026 году. Созданием собственных ИИ-ускорителей заняты практически все крупные гиперскейлеры. Google первой занялась созданием собственных ускорителей и теперь в её портфолио есть уже шесть поколений TPU, Meta✴ трудится над MTIA, AWS предлагает Trainium2 и Inferentia2, Microsoft анонсировала Maia 100, Alibaba разработала Hanguang 800, а ByteDance и OpenAI пока ещё только создают будущие ускорители, причём при помощи всё той же Broadcom. Впрочем, для многих из них это попытка снизить зависимость от NVIDIA, выручка которой бьёт все рекорды.
12.12.2024 [08:57], Владимир Мироненко
Google попросила регулятора разорвать эксклюзивное облачное соглашение Microsoft и OpenAI из-за вреда конкуренцииGoogle попросила Федеральную торговую комиссию США (FTC) разорвать эксклюзивное облачное соглашение Microsoft с OpenAI, в рамках которого разработчик ИИ-чат-бота ChatGPT использует её облачную инфраструктуру для функционирования своих сервисов и других задач, сообщил ресурс The Information. Просьба Google поступила после того, как FTC запросила у неё отзыв о деловой практике Microsoft в рамках более широкого расследования, касающегося лицензирования софтверным гигантом ПО, а также облачных вычислений, предложений по обеспечению кибербезопасности и услуг ИИ. По словам Google, соглашение о партнёрстве Microsoft и OpenAI, которое позволяет Microsoft быть единственным поставщиком облачных сервисов, размещающим передовые модели OpenAI, создает значительные рыночные барьеры и потенциально увеличивает затраты для клиентов облачных сервисов, желающих получить доступ к передовым технологиям ИИ То, что Microsoft является крупнейшим инвестором OpenAI, вложившим в неё более $13 млрд, объясняет столь тесное сотрудничество двух компаний, но другим технологическим компаниям, которые конкурируют с Microsoft на облачном рынке, таким как Google и Amazon, тоже хотелось бы размещать у себя в облаке модели OpenAI, чтобы их облачным клиентам не нужно было обращаться к услугам Microsoft для получения доступа к технологии стартапа, говорится в публикации The Information. Ведущие игроки считают, что нынешнее эксклюзивное соглашение ограничивает конкуренцию на облачном рынке и выбор клиентов. Как утверждают источники ресурса, компании, которые приобретают технологию OpenAI через Microsoft, могут столкнуться с дополнительными расходами, если они не используют решения Microsoft для своей работы. Google и другие участники рынка отметили, что такой подход к ценообразованию может навредить клиентам и ограничить доступ к ИИ-технологиям.
12.12.2024 [01:45], Владимир Мироненко
«Страна чувствует себя уверенно»: «Ростелеком» заявил об успехе импортозамещения серверовВ России полностью решена проблема с импортозамещением мощных вычислительных ресурсов, заявил глава «Ростелекома» Михаил Осеевский, выступая на пленарном заседании Совета Федерации, пишет ТАСС. «Хочу доложить, что сегодня страна чувствует себя достаточно уверенно. У нас полностью решена проблема импортозамещения мощных вычислительных ресурсов, серверов, систем хранения [данных]», — цитирует ТАСС заявление руководителя «Ростелекома». Напомним, что ещё в мае замглавы Минпромторга Василий Шпак сообщил, что в ведомстве обсуждают предложение участников отрасли об исключении из списка товаров, разрешённых к параллельному импорту в Россию, серверов и СХД. Рынок серверов в России активно развивается. В конце 2023 года на территории индустриального парка «Рязанский» неподалёку от Рязани был введён в эксплуатацию завод «Центра открытых разработок» (бренд OpenYard) по производству серверного оборудования, мощность которого позволяет изготавливать свыше 60 тыс. единиц техники ежегодно. В июле «Гравитон» и OpenYard договорились о технологическом партнёрстве, в рамках которого на площадке OpenYard было налажено контрактное производство плат для серверов и клиентских устройств. В феврале текущего года «Сбербанк» запустил производство серверов, адаптированных для применения в собственных ЦОД, что позволило ему полностью отказаться от проприетарных ПАК сторонних поставщиков. А в декабре на бывшем заводе Samsung в Калуге, по данным СМИ, организовали сборку серверов под брендом «Гравитон». Кроме того, производства есть и у ряда других российских брендов, например, у «Аквариус» и F-Plus.
11.12.2024 [17:59], Руслан Авдеев
Российский рынок облачных сервисов с ИИ-ускорителями в 2024 году вырастет в 1,5 раза до 17,1 млрд рублейРынок российских облачных сервисов для вычислений с использованием ИИ-ускорителей в 2024 году может вырасти до 17,1 млрд руб., +55 % год к году. Предварительный прогноз подготовлен экспертами J’son & Partners Consulting, сообщают «Ведомости». Исследование посвящено развитию публичных облаков. В целом, по прогнозам экспертов, рынок облачных услуг в 2024 году в России вырастет на 31,2 % — до 142,4 млрд руб. Доступ к ускорителям в облаках тарифицируются по принципу Pay as You Go (PAYG) — пользователи обычно платят за потребление ресурсов. Согласно прогнозам J’son & Partners данным, среднегодовой прирост (GAGR) на рынке соответствующих вычислений в публичных облаках до 2025 года, возможно, составит 32,7 %, а в денежном выражении сегмент к 2029 году достигнет 66,3 млрд руб. Использование ускорителей в облаках весьма удобно, поскольку позволяет быстро получить доступ к вычислительным мощностям и обходится дешевле, чем закупки собственного оборудования, которые к тому же осложняются санкционными ограничениями. На фоне быстрого роста спроса на сервисы, требующие использования ускорителей, наблюдается их дефицит на российском рынке, но эксперты прогнозируют постепенный выход к состоянию баланса. По данным iKS-Consulting, пока ускорители для обучения ИИ арендуют не очень часто — на эту услугу приходится 5,4 % рынка облачных услуг. При этом в 2023 году совокупная выручка провайдеров таких GPU-сервисов составила около 6,6 млрд руб., при общей выручке от облачных инфраструктурных сервисов в том же году на уровне 121,4 млрд руб. Рынок вырос — в 2022 году на аренду сервисов с ИИ-ускорителями приходилось 4 % (всего 3,7 млрд руб.). Ранее аналитики прогнозировали, что к 2028 году российский рынок облачной инфраструктуры достигнет 464 млрд руб., а к концу 2024 года может вырасти до 162 млрд руб. с 121,4 млрд руб. в прошлом году. Статистика J’son & Partners Consulting показывает, что сегодня облачные провайдеры имеют около 77 400 клиентов. Правда, более 50 % из них можно отнести к мелким пользователям, тратящим на облачные услуги до 10 тыс. руб. в месяц. При этом пока даже крупные компании часто размещают задачи в локальных ЦОД, которые тоже требуют как масштабирования, так и модернизации в целом.
11.12.2024 [15:39], Руслан Авдеев
HPE отказалась продать неизвестному клиенту ИИ-серверы на $700 млнВ ходе отчёта за IV квартал 2024 года HPE упомянула, что отказалась от заказа на поставку ИИ-оборудования на $700 млн, усомнившись в неназванном покупателе, сообщает Network World. Общий объём бронирования по итогам квартала составил ожидамеые $1,2 млрд, а портфель необработанных заказов вырос до $3,5 млрд. В компании подчеркнули, что заказы на ИИ-системы могут поступать неравномерно, и это как раз такой случай. На вопрос Network World об отмене заказа компания ответила, что имеет надёжную систему контроля, внимательно следит за работой с надёжными клиентами, управляет рисками и проводит диверсификацию портфеля заказов. Другими словами, по мнению экспертов, HPE потеряла веру в то, что один из её клиентов сможет справиться с контрактными обязательствами, и должным образом отреагировала на эту угрозу. И это важный сигнал для рынка в целом. Одна из основных проблем в том, что системы генеративного ИИ пока слабо окупаются. По данным Sequoia Capital, ИИ-индустрия потратила в прошлом году почти $50 млрд на чипы NVIDIA, но выручка за тот же период составила всего $3 млрд. Подчёркивается, что скидки и прочие привилегии больше не являются необходимой частью распространения ИИ-продуктов. ![]() Источник изображения: HPE По мнению экспертов, сейчас спрос превышает предложение, поэтому HPE может позволить себе отдавать преимущество отдельным сегментам рынка и продуктам, поскольку объёмы доступной ИИ-инфраструктуры ограничены. Похожий дисбаланс спроса и предложения наблюдался несколько лет назад во время пандемии COVID-19. Выяснить, когда спрос превысит предложение, не так просто — на насыщение цепочки поставок продуктами уходит сравнительно много времени. При этом финансовые директора компаний из списка Fortune 2000 могут счесть перспективы инвестиций в генеративный ИИ не слишком впечатляющими. Это окажет влияние на позиции заказчиков и покупателей. Впрочем, те, кто первыми начали внедрять такие системы, в долгосрочной перспективе, возможно, будут иметь лучшие позиции, более низкую стоимость эксплуатации и т.п. Пока эксперты остерегаются делать чересчур смелые прогнозы. С учётом скорости развития ИИ-инфраструктуры не исключено, что на $1 млн, который можно потратить прямо сейчас, позднее можно будет получить гораздо более выгодное предложение. В то же время не исключено, что полупроводники достигнут физического предела своей производительности и IT-руководителям придётся делать сложный выбор, в числе прочего сделав акценты на повышение «нишевости» и качества ИИ-моделей. |
|