Материалы по тегу: облако
12.02.2025 [11:58], Сергей Карасёв
Tencent Cloud открыла в Саудовской Аравии свой первый облачный регион на Ближнем ВостокеКитайская платформа Tencent Cloud, по сообщению ресурса Datacenter Dynamics, развернула свой первый облачный регион на Ближнем Востоке — он расположен в Саудовской Аравии. Предполагается, что запуск платформы будет способствовать улучшению цифровой инфраструктуры Королевства и ускорению внедрения передовых технологий. Об открытии нового облачного региона объявлено на технологическом саммите Министерства связи и технологий Саудовской Аравии LEAP 2025, на котором было объявлено о $14,9 млрд инвестиций в ИИ-сектор страны. Tencent также сообщила о намерении инвестировать в IT-сектор страны более $150 млн в течение нескольких следующих лет. Регион состоит из двух зон доступности с полным резервированием. Клиентам будут предлагаться современные облачные услуги и сервисы на основе ИИ. Дэн Ху (Dan Hu), вице-президент подразделения Tencent Cloud на Ближнем Востоке и в Северной Африке, говорит, что открытие облачной площадки поможет в развитии таких направлений, как цифровые медиа, потоковая передача данных, видеоигры, киберспорт, электронная коммерция, туризм, финансовые услуги, телекоммуникации и пр. Новая площадка является частью глобальной облачной сети Tencent Cloud, которая в настоящее время объединяет 21 регион по всему миру с более чем 50 зонами доступности. Хотя компания в основном ведёт деятельность в Азии, у неё также есть объекты в Северной Америке (Кремниевая долина, Вирджиния, Торонто), Европе (Франкфурт) и Южной Америке (Сан-Паулу). Нужно отметить, что многие другие крупные компании в области ЦОД и ИИ активно развивают бизнес в Саудовской Аравии. Так, в сентябре 2023 года свой первый облачный регион в стране запустила китайская Huawei. О намерении заняться строительством дата-центров на территории Королевства объявили Saudi Call и China Mobile, AWS и DataVolt, а также Armada. А компания Groq развернула в Саудовской Аравии крупнейший в Европе, на Ближнем Востоке и в Африке (EMEA) вычислительный ИИ-центр для задач инференса.
10.02.2025 [19:33], Сергей Карасёв
Groq развернула в Саудовской Аравии почти 20 тыс. ИИ-ускорителей LPUКомпании Groq и Aramco Digital объявили об открытии крупнейшего в Европе, на Ближнем Востоке и в Африке (EMEA) вычислительного ИИ-центра, ориентированного на задачи инференса. Площадка располагается в Даммаме в Саудовской Аравии. Groq занимается разработкой ускорителей LPU (Language Processing Unit) для работы с большими языковыми моделями (LLM). Утверждается, что они могут успешно конкурировать с ИИ-ускорителями NVIDIA, AMD и Intel. Aramco Digital, подразделение нефтегазового и химического гиганта Aramco, и Groq сообщили о намерении создать в Саудовской Аравии крупнейший в мире центр по развитию ИИ в марте 2024 года. Тогда говорилось, что Aramco Digital будет сдавать мощности Groq LPU в аренду клиентам на Ближнем Востоке. Предполагается также, что партнёрство с Groq поможет Aramco Digital вывести на рынок управляемую голосом ИИ-модель Norous. ![]() Источник изображения: Twitter/@sundeep Как теперь сообщается, на базе нового ИИ-центра заработал облачный регион GrogCloud, включающий 19 725 LPU. Инвестиции в проект составили $1,5 млрд — совместно от Groq и Aramco Digital. Джонатан Росс (Jonathan Ross), генеральный директор Groq, сообщил, что к концу I квартала 2025 года компания развернёт сможет генерировать не менее 25 млн токенов в секунду. В перспективе планируется повышение данного показателя вплоть до 1 млрд токенов в секунду. С момента запуска GroqCloud в марте 2024 года более 800 тыс. разработчиков по всему миру начали использовать эту платформу на базе LPU Inference Engine через программный интерфейс Groq API. Облако, как утверждается, обеспечивает инференс в реальном времени с меньшей задержкой и большей пропускной способностью, чем у конкурентов. GroqCloud подходит для генеративных и разговорных приложений ИИ. В целом, Groq создаёт высокопроизводительную инфраструктуру ИИ, предназначенную для обслуживания более 4 млрд человек в Саудовской Аравии, на Ближнем Востоке, в Африке и за пределами этого региона. Сделка с Groq является частью крупномасштабного плана Vision-2030, предполагающего переход Саудовской Аравии к инновационной экономике на базе ИИ, которая призвана снизить зависимость страны от добычи нефти и газа.
10.02.2025 [18:33], Руслан Авдеев
Cloud.ru заморозит цены на облака для новых клиентов на три годаПровайдер облачных сервисов и ИИ-технологий Cloud.ru объявил о заморозке цен на пользование облачными услугами. Предложение действительно для новых клиентов — они смогут пользоваться сервисами по фиксированным ценам в течение трёх лет, сообщает пресс-служба компании. Предполагается, что такой подход поможет вести долгосрочное планирование IT-бюджета и эффективно развивать цифровые сегменты бизнеса. Заморозка цен коснётся виртуальных машин, в том числе с GPU, объектных хранилищ, баз данных, а также иных облачных сервисов. Cloud.ru располагает более 100 IaaS- и PaaS-сервисов, ML-платформой на базе суперкомпьютеров и публичным облаком Cloud․ru Evolution на основе собственных разработок и open source. В компании подчёркивают, что использование облачных решений позволит бизнесу быстро запускать новые услуги и цифровые продукты, а также масштабировать нагрузки. По словам коммерческого директора Cloud.ru, компания помогает бизнесам сохранить контроль над IT-инфраструктурой даже под влиянием внешних макроэкономических факторов. В ответ на рост цен на рынке облачных услуг компания предлагает зафиксировать стоимость ряда сервисов — это позволит бизнесу даже в долгосрочной перспективе сохранить предсказуемость затрат на информационные технологии. Специальное предложение действует для новых клиентов, включая как юридических лиц, так и индивидуальных предпринимателей. Для того, чтобы воспользоваться им, необходимо оставить заявку на подключение сервисов Cloud.ru до 31 марта 2025 года. По предварительным оценкам iKS-Consulting, в 2024 году рынок облачных услуг в России вырос на треть, до 165,6 млрд руб. По доле выручки Cloud.ru занимает на нём первое место (IaaS+PaaS).
10.02.2025 [14:40], Руслан Авдеев
Сервер в каждый дом: British Gas и Heata протестируют в Великобритании индивидуальные «цифровые котлы»Компания British Gas заключила соглашение с Heata, в рамках которого в Великобритании в тестовом режиме будет развёрнута облачная платформа с серверами, размещёнными в жилых домах. Каждый сервер подключен к системе домашнего отопления, аккумулирующей тепло в ходе работы сервера. Каждый сервер может отдать до 4 кВт∙ч в день, что в теории позволит сэкономить на счетах за газ или электричество до £340/год. Электричество, потребляемое сервером, оплачивается самой Heata. Испытания будут проводить три месяца, на этот период в домах сотрудников British Gas установят 10 «цифровых бойлеров», ресурсы которых будут сдаваться в аренду клиентам Heata. Компании намерены делиться идеями и знаниями, чтобы сделать технологию массовой. Ранее Heata сотрудничала с Civo в рамках схожей пилотной программы, предусматривавшей отопление домов в Великобритании в 2023 году. Есть и другие аналогичные проекты. Так, Deep Green использует GPU-серверы для подогрева бассейнов в Эксмуте и Йоркшире. Civo тоже является партнёром Deep Green. В 2022 году Qarnot порадовала заказчиков новым поколением отопительных устройств QB, созданных совместно с ITRenew. Эти системы используют OCP-серверы, ранее работавшие в дата-центрах гиперскейлеров. Позже компания в качестве эксперимента использовала серверы для приготовления пищи. Возможно, подход с размещением вычислительных мощностей в непосредственной близости от потребителей тепла окажется эффективнее, чем попытки подключения ЦОД к системам центрального отопления.
10.02.2025 [00:50], Владимир Мироненко
Саудовская Аравия объявила о $14,9 млрд инвестиций в ИИ-секторВ Саудовской Аравии стартовала технологическая выставка LEAP 2025. Как сообщает OneArabia, министр связи и информационных технологий Абдулла Аль-Сваха (Abdullah Alswaha) объявил, что объём инвестиций в ИИ-сектор страны со стороны компаний из разных стран составит около $14,9 млрд. Министр отметил, что они позволят активизировать развитие технологического сектора и ускорить переход к инновационной экономике, основанной на ИИ, в соответствии с целями программы «Видение – 2030» (Vision 2030), призванной снизить зависимость страны от добычи ископаемого топлива. В частности, Groq и Aramco Digital объявили об инвестициях в размере $1,5 млрд в расширение облачных вычислений на базе ИИ, чтобы вывести Саудовскую Аравию в лидеры в области ИИ. Компании планируют построить в стране крупнейший в мире центр ИИ на базе ускорителей Groq. Lenovo и компания Alat, принадлежащая Саудовскому государственному инвестиционному фонду, подтвердили планы инвестировать $2 млрд в передовой производственный центр на основе ИИ и робототехники и региональную штаб-квартиру Lenovo в Эр-Рияде. Google планирует создать центр инфраструктуры ИИ в Саудовской Аравии для удовлетворения регионального и международного спроса в ИИ-сервисах. Ранее стало известно о планах AWS потратить $5,3 млрд на создание нового облачного региона к 2026 году, а также помочь в обучении местных разработчиков. Aramco Digital, Armada и Microsoft планируют запустить в Саудовской Аравии контейнерные дата-центры для периферийных вычислений. К концу 2024 года Microsoft уже построила здесь три ЦОД — об инвестициях в размере $2,1 млрд было объявлено два года назад. Databricks выделяет $300 млн на решения Platform-as-a-Service, поддерживая разработчиков приложений и способствуя развитию экспертизы в области инжиниринга данных в стране. SambaNova сообщила о выделении $140 млн на разработку передовой инфраструктуры ИИ, что позволит укрепить роль Саудовской Аравии как регионального центра инноваций. KKR и Gulf Data Hub объявили о значительных инвестициях в развитие ЦОД — до 300 МВт новых мощностей. Salesforce инвестирует $500 млн в расширение своей платформы Hyperforce в Саудовской Аравии для обслуживания региональных клиентов. Tencent Cloud направит $150 млн в запуск своего облачного региона с интегрированными возможностями ИИ. Alibaba Cloud запускает в стране программу расширения возможностей ИИ совместно с Tuwaiq Academy и STC для обучения местных талантов передовым технологиям. Наконец, Qualcomm объявила о доступности большой языковой модели ALLaM на платформе Qualcomm Cloud AI, а также представила решение ALLaM AI PC для разработчиков.
08.02.2025 [16:42], Владимир Мироненко
Yandex Cloud повысит цены на облачные сервисы с 1 маяОблачная платформа Yandex Cloud объявила о планах повысить с 1 мая 2025 года тарифы на ряд сервисов, отметив, что это первое повышение цен с 2022 года, рост тарифов не превысит 8 % и коснётся не всех сервисов. Сообщается, что рост цен вызван целым рядом макроэкономических факторов, включая регулярное повышение цен на оборудование, значительное изменение курса рубля и увеличение стоимости разработки и поддержки. В пресс-релизе указано, что индексация для сервисов Compute Cloud, Data Processing и Managed ClickHouse/MongoDB/MySQL/PostgreSQ/Valkey, которые используют устаревшие платформы Intel Broadwell и Intel Cascade Lake/Broadwell + NVIDIA Tesla V100 составит 3 %. Повышение не затронет сервисы Yandex Cloud Marketplace, Postbox, DataLens, Models, SpeechKit, SpeechSense, Tracker, Translate, Vision, другие сервисы, использующие платформу AMD EPYC 9474F, и техническую поддержку на тарифе «Бизнес». Для клиентов в регионе доступности Казахстан цены в тенге сохранятся на прежнем уровне. В будущем компания пообещала корректировать цены в начале календарного года. Как отметили в Forbes, Yandex Cloud повысит тарифы на свои основные услуги. Согласно отчёту платформы за 2023 год, по доле потребления всех сервисов на группу «Инфраструктура и сеть» приходилось 56 %, на сервисы платформы данных — 22 %, на услуги контейнерной разработки — 12 %, на сервисы машинного обучения — 4 %. Выручка Yandex Cloud в 2023 году составила 13,3 млрд руб. В 2024 году, по предварительной оценке, выручка инфраструктурных и платформенных сервисов увеличилась в полтора раза, при этом распределение долей IaaS и PaaS «сохраняется примерно на одинаковом уровне». ![]() Источник изображения: Yandex Cloud По предварительным данным iKS-Consulting, Yandex Cloud в 2024 году заняла третье место среди крупнейших поставщиков облачных инфраструктурных и платформенных услуг, уступив РТК-ЦОД и Cloud.ru. Общий объём рынка облачных сервисов в РФ в 2024 году вырос 165,6 млрд руб., увеличившись год к году на 36,3 %. iKS-Consulting подтвердила Forbes, что последнее крупное повышение цен на облачные услуги произошло на рубеже 2022–2023 гг., когда на фоне санкций подняли цены многие участники рынка. Средняя цена на аренду vCPU тогда выросла на 47 %, а 1 Гбайт vRAM — на 13 %. Forbes опросил участников рынка по поводу их планов по тарифам на облачные услуги в 2025 году и большинство из них сообщило об отсутствии намерений повышать цены. Так, в РТК-ЦОД сообщили, что в 2024 году стоимость базовых сервисов оставалась неизменной, но 2025 году возможен рост тарифов в отдельных категориях, например, в сервисах на базе GPU. В Linx тоже не повышали цены на облачные сервисы в 2024 году и не планируют повышения в 2025 году, но могут повысить цену услуг колокации в диапазоне 15–20 %. В «1C» сообщили, что увеличили цены в 2025 году на облачные сервисы на 14 %, о чём предупреждали ещё в октябре 2024 года. В ГК Softline отметили, что большое количество облачных провайдеров на рынке уже подняли цены на 10–20 % или планируют сделать это в обозримой перспективе. Компания сообщила, что будет вынуждена повысить цены на некоторые ресурсы от 10 % во II половине 2025 года. В ITGobal.com считают, что в целом на рынке облачных услуг России «можно ожидать умеренное увеличение цен на 10–15 % в связи с естественным ростом затрат и инфляцией».
05.02.2025 [23:04], Владимир Мироненко
Рост Google Cloud замедлился, но ради ИИ компания готова потратить $75 млрд на серверы и ЦОД в 2025 годуХолдинг Alphabet, материнская структура Google, сообщил финансовые результаты IV квартала и всего 2024 финансового года, завершившегося 31 декабря. По итогам 2024 года чистая прибыль Alphabet впервые превысила отметку в $100 млрд, составив $100,12 млрд при выручке в $ 350,02 млрд, выросшей год к году на 14 %. Результаты Alphabet оказались ниже прогнозов Уолл-стрит, поэтому акции холдинга упали на 9 % во вторник на внебиржевых торгах. Консолидированная выручка Alphabet в IV квартале 2024 года выросла на 12 % в годовом исчислении до $96,47 млрд США, что, как утверждает холдинг, отражает устойчивую динамику во всём бизнесе. Вместе с тем показатель оказался ниже консенсус-прогноза аналитиков, опрошенных LSEG, полагавших, что выручка должна быть выше — в пределах $96,56 млрд. Также аналитиков разочаровал квартальный доход облачного подразделения Google Cloud, составивший $11,96 млрд, что на 30 % выше прошлогоднего результата, но ниже консенсус-прогноза в размере $12,19 млрд экспертов, опрошенных StreetAccount. Чистая прибыль Alphabet выросла на 28 % до $26,54 млрд, превысив прогноз аналитиков LSEG в размере $26,0 млрд, при этом чистая прибыль на акцию выросла на 31 % до $2,15, что выше ожиданий аналитиков, опрошенных LSEG, в размере $2,13 на акцию. Alphabet объявил, что выделит $75 млрд на капитальные затраты в 2025 году по сравнению с $52,5 млрд в прошлом году. Это тоже вызвало вопросы у инвесторов, поскольку разница более чем в $22 млрд могла быть добавлена к прибыли холдинга. При этом другие гиперскейлеры также увеличат траты на инфраструктуру: Meta✴ готова вложить $60–65 млрд, а Microsoft — $80 млрд. В свою очередь, руководство Alphabet настаивает на том, что инвестиции оправданны, поскольку Google Cloud сейчас не в состоянии удовлетворить спрос на ИИ-технологии. Финансовый директор Alphabet Анат Ашкенази (Anat Ashkenazi) заявила в ходе онлайн-конференции с аналитиками, что холдинг прилагает все усилия, чтобы развернуть больше мощностей и справиться со спросом. По её словам, эти цифры в первую очередь отражат инвестиции в техническую инфраструктуру, причем крупнейшим компонентом являются инвестиции в серверы, за которыми следуют ЦОД «для поддержки роста бизнеса Google Services, Google Cloud и Google DeepMind». «Мы находимся в ситуации с дефицитом предложения при высоком спросе, и усердно работаем над тем, чтобы ввести больше мощностей в эксплуатацию», — отметила Ашкенази. Она сообщила, что темпы роста облачного подразделения Google могут измениться в 2025 году, поскольку компания продолжает закупать всё больше оборудования и строить больше объектов. По её словам, капитальные затраты Alphabet в I квартале составят от $16 до $18 млрд, и квартальный показатель изменится в течение года. Это выше прогноза аналитиков FactSet в размере $14,3 млрд. Капитальные затраты Alphabet за IV квартал составили $14 млрд превысив ожидания Уолл-стрит в $13,26 млрд, согласно StreetAccount. Сомнения инвесторов в правильности инвестиционной политики Alphabet усилились после анонса китайским стартапом DeepSeek ряда ИИ-моделей, расходы на обучение которых оказались гораздо ниже, чем у Google. «Неутешительные результаты Cloud говорят о том, что импульс, основанный на ИИ, может начать ослабевать как раз в то время, как стратегия Google с закрытой моделью ставится под сомнение DeepSeek», — отметила Эвелин Митчелл-Вольф (Evelyn Mitchell-Wolf), аналитик исследовательской компании Emarketer. Что касается остальных подразделений Alphabet, то рост доходов от рекламы Google составил 10,6 % по сравнению с 11 % годом ранее. Доходы от поиска выросли год к году на 12,0 % до $54,03 млрд по сравнению с ростом на 12,7 % в IV квартале 2023 года. Доходы от рекламы на YouTube выросли на 13,8 % до $10,47 млрд по сравнению с 15,5 % роста годом ранее, а рост всех доходов сервисов (Google Services) составил 10,2 % по сравнению с 12, % годом ранее.
05.02.2025 [12:07], Сергей Карасёв
В облаке CoreWeave появились суперускорители NVIDIA GB200 NVL72Компания CoreWeave, предоставляющая облачные услуги для ИИ-задач, объявила о запуске первых в отрасли общедоступных инстансов на базе NVIDIA Blackwell. Они предназначены для наиболее ресурсоёмких нагрузок, включая работу с «рассуждающими» моделями ИИ. Инстансы используют суперускорители NVIDIA GB200 NVL72. Такие устройства объединяют в одной стойке 18 узлов 1U, каждый из которых содержит два ускорителя GB200: в сумме это даёт 72 чипа B200 и 36 процессоров Grace. Применяются шина NVLink 5 и система жидкостного охлаждения. Экземпляры CoreWeave на основе GB200 NVL72 оснащены интерконнектом NVIDIA Quantum-2 InfiniBand, который обеспечивает пропускную способность 400 Гбит/с в расчёте на GPU. Возможно формирование кластеров, насчитывающих до 110 тыс. графических процессоров. Платформа мониторинга CoreWeave Observability Platform в режиме реального времени предоставляет информацию о производительности NVLink, загрузке GPU и температуре узлов. В составе инстансов также задействованы DPU NVIDIA BlueField-3. ![]() Источник изображения: NVIDIA По заявлениям CoreWeave, новые экземпляры обеспечивают прирост производительности до четырёх раз при обучении больших языковых моделей (LLM) по сравнению с решениями предыдущего поколения. Совокупная стоимость владения сокращается в 25 раз и во столько же снижается энергопотребление на задачах инференса в реальном времени. Вместе с тем быстродействие инференса может быть увеличено до 30 раз. Ожидается, что запуск инстансов с суперускорителями NVIDIA GB200 NVL72 поможет в создании моделей следующего поколения и ИИ-агентов. На сегодняшний день экземпляры доступны через CoreWeave Kubernetes Service в регионе US-WEST-01 — пара GB200 обойдётся в $42/час.
04.02.2025 [16:24], Руслан Авдеев
Росреестр заплатит 5,1 млрд руб. за аренду ЦОД у «Ростелекома» — втрое больше, чем в 2022 годуДля обеспечения работы Единого государственного реестра недвижимости (ФГИС ЕГРН) Росреестр воспользуется дата-центрами «Ростелекома» — таков итог конкурса на 5,1 млрд руб., объявленного на «Госзакупках» в декабре 2024 года и завершившегося в конце января 2025-го. Ожидается, что ведомство получит доступ к мощностям провайдера ЦОД уже с 7 февраля 2025 года, действие договора окончится 31 января следующего, сообщают «Ведомости». По словам представителя облачного провайдера, опрошенного «Ведомостями», конкурсная документация свидетельствует о том, что основную IT-инфраструктуру, необходимую Росреестру, разместят в облаке. Росеестру требуется 2839 ядер CPU и 34 Тбайт RAM. Также включена аренде двух стоек в одном дата-центре и двух — в другом. Причём мощность каждой должна составлять 14 кВт, что довольно много. Судя по данным «Госзакупок», если раньше «Ростелеком» предоставлял Росреестру аналогичные услуги за 1,6 млрд руб., то в 2023 году — 3,6 млрд, 2024 году — 4,5 млрд, а теперь цена выросла ещё больше. На рост цен могли повлиять санкции, усложнение поставок оборудования, а также инвестиции в безопасность. Судя по информации из открытых источников, «Ростелеком» предоставляет ресурсы своих дата-центров государственным и окологосударственным структурам, включая Газпромбанк, ВТБ, Минцифры, Генпрокуратуру и др. По оценкам iKS-Consulting, РТК-ЦОД является крупнейшим оператором коммерческих дата-центров в России — к концу 2024 года он располагал более 27 тыс. стойко-мест. На облачном рынке компания занимает второе-третье место. Также отмечается, что половину выручки от строительства дата-центров в России обеспечивает госсектор.
04.02.2025 [12:03], Владимир Мироненко
Google представила превью инстансов A4 на базе ускорителей NVIDIA B200Google объявила о предварительной доступности инстансов A4 на базе новых ускорителей B200 от NVIDIA с архитектурой архитектуры Blackwell. Инстанс A4 обеспечивает значительный прирост производительности по сравнению с предшественником A3. A4 используют системы NVIDIA HGX B200 с восемью ускорителями, объединёнными посредством NVIDIA NVLink. Как отметила компания, NVIDIA HGX B200 предлагает в 2,25 раза большую пиковую вычислительную мощность и в 2,25 раза большую ёмкость HBM по сравнению с инстансами A3, что делает A4 универсальным вариантом для обучения и тонкой настройки широкого спектра архитектур моделей, в то время как увеличенная вычислительная мощность и ёмкость HBM делают их подходящим вариантом для обработки нагрузок с низкой задержкой. Инстансы A4 интегрируют инфраструктурные инновации Google, включая улучшенные сетевые возможности с использованием адаптеров Titanium ML, поддержку управляемой службы кластера Google Kubernetes Engine и доступ через полностью управляемую унифицированную платформу Vertex AI для разработки и использования генеративного ИИ. Также используется открытое ПО: в дополнение к использованию фреймворка МО PyTorch и CUDA компания сотрудничает с NVIDIA для оптимизации JAX и XLA. Как отметила компания, эффективное масштабирование обучения модели ИИ требует точной и масштабируемой оркестрации ресурсов инфраструктуры. При этом рабочие нагрузки часто охватывают тысячи виртуальных машин. Специализированная платформа Hypercompute Cluster позволит развёртывать и управлять большими кластерами виртуальных машин A4 с вычислениями, хранением и сетями как единым целым, обеспечивая при этом высокую производительность и устойчивость для больших распределённых рабочих нагрузок. |
|