Материалы по тегу: прогноз
10.03.2025 [17:43], Руслан Авдеев
Goldman Sachs: китайские телеком-операторы станут крупнейшими бенефициарами ИИ-бума, раньше всех взяв на вооружение продукты DeepSeekТри крупнейших китайских телеком-оператора получат максимальную выгоду от бума ИИ-технологий в Китае. Согласно исследованию Goldman Sachs-China, компании China Mobile, China Telecom и China Unicom становятся ключевыми бенефициарами благодаря наличию собственной облачной инфраструктуры и принятию на вооружение продуктов DeepSeek, сообщает блог IEEE Comsoc. Наличие у тройки лидеров крупнейшей в КНР облачной инфраструктуры позволяет обслуживать и другие облачные компании, а также предлагать собственные облачные сервисы конечным пользователям. В частности, их дата-центрами пользуется Alibaba. А собственная развитая сетевая инфраструктура позволяет снизить себестоимость услуг связи. Более того, другим операторам за передачу данных приходится платить именно «большой тройке» по рыночным ценам. Как считают в Goldman Sachs, в некоторых компаниях, предоставляющих в КНР услуги IaaS, например, QingCloud Technology на ЦОД и услуги связи уходит 50–60 % от общих расходов. «Большая тройка» сделала ставку на решения DeepSeek, поэтому имеют все шансы воспользоваться преимуществами раннего внедрения этих ИИ-технологий. При этом государство активно поддерживает использование ИИ на государственных предприятиях, на которые приходится до 30 % выручки телеком-операторов. В последние три недели операторы начали помогать ключевым клиентам в развёртывании LLM DeepSeek. China Mobile поддерживает PetroChina в развертывании полнофункциональной модели, China Telecom предоставляет ту же услугу Sinopec, а China Unicom сотрудничает с Фошаньским муниципальным бюро промышленности и информационных технологий. Более того, 21 февраля Комитет по контролю и управлению государственным имуществом Китая (SASAC) инициировала реализацию плана AI+, призванного стимулировать разработку и коммерческое применение ИИ китайскими государственными предприятиями. China Mobile также объявила, что использует ИИ для преобразования своих телекоммуникационных сетей в рамках стратегии AI+NETWORK, ориентированной на интеграцию ИИ в сетевую инфраструктуру.
10.03.2025 [08:52], Руслан Авдеев
К2 НейроТех: российский рынок HPC за два года вырос на 35 %К2 НейроТех сделала прогноз относительно основных трендов на российском рынке российских суперкомпьютеров. По оценкам компании, за последние два года рынок высокопроизводительных вычислений (HPC) в стране вырос на 35 % и достиг 15,8 млрд руб. Ключевую роль в этом играет развитие ИИ-систем. В 2025 году рынок HPC должен вырасти как минимум на 12 %. Согласно прогнозам компании, в РФ вырастет местное производство оборудования для ИИ-систем. Рост спроса на искусственный интеллект и вычислительные мощности ведут к распространению HPC в бизнесе. Если раньше такие вычисления применялись в основном в науке и инженерных расчётах, то теперь всё чаще их активно применяют для обработки Big Data, ИИ, машинного обучения и др. В 2024 году вложения в системы хранения данных (СХД) и платформы для высоконагруженных систем выросли на 40 %. Утверждается, что выпуск СХД и ИИ-серверов вырос на 10,5 %, госзакупки таких систем увеличились вдвое, а госкомпании потратили на оборудование для ИИ более 1,7 млрд руб. Ещё одним трендом стали модернизация и масштабирование имеющихся HPC-кластеров. Особенной популярностью стали пользоваться готовые решения «под ключ», поскольку теперь часто возникает проблема совместимости программного обеспечения и оборудования. В К2Тех заявляют, что заказчики всё чаще сталкиваются с тем, что имеющееся оборудование не способно справляться с современными задачами и масштабироваться. Ответом на это также будет развитие HPCaaS и гибридных инфраструктур, объединяющих локальные и облачные вычисления. Наконец, К2 НейроТех предрекает переход к контейнеризированным средам как альтернативе «монолитным» приложениям. Использование Kubernetes, Singularity и Slurm даёт возможность оптимально распределять нагрузки и снижать издержки на эксплуатацию HPC-инфраструктуры.
03.03.2025 [23:03], Татьяна Золотова
К2 Cloud: 2025 год пройдет под флагом трудностей с импортозамещением, слабой безопасностью и нехваткой кадровТреть российских предприятий сохраняют потребность в переходе на отечественные ИТ-продукты, а каждая пятая компания заявляет о нехватке квалифицированных ИТ-специалистов и большинство предприятий нуждаются в эффективных решениях в сфере кибербезопасности. К такому выводу пришли эксперты облачного провайдера «К2 Cloud» (К2Тех) в исследовании «Настоящее и будущее ИТ-рынка». В исследовании приняли участие более чем 300 представителей крупного бизнеса из разных сфер. Как отмечают эксперты, потребность в переходе на отечественные решения испытывают 34 % респондентов. Основными проблемами компаний финансовой отрасли помимо импортозамещения являются сложности интеграции текущих систем с новыми решениями (40 % ответов), обеспечение кибербезопасности (38 %), нехватка квалифицированных ИТ-специалистов и экспертизы на рынке (24 %). Респонденты отмечали, что им не хватает ассортимента российского ПО и оборудования. В отрасли машиностроения главными вызовами стали (43 % опрошенных) ограниченные бюджеты и необходимость оптимизации затрат на ИТ. В 25 % компаний сталкиваются со сложностями при внедрении инноваций и цифровизации бизнес-процессов для повышения эффективности. Еще 21 % респондентов отметили сложную адаптацию к меняющимся требованиям регуляторов и новым санкциям. В ритейле 29 % опрошенных выделили сложности адаптации к требованиям регуляторов, 27 % респондентов не сталкиваются с проблемами при интеграции новых ИТ-систем, а 25 % — испытывают трудности при внедрении инноваций и цифровизации бизнес-процессов для повышения эффективности.
21.02.2025 [21:21], Руслан Авдеев
В России скоро наступит дефицит энергии для обучения ИИ — сильнее всего ударит по ЦОД в Москве и Санкт-ПетербургеВ обозримом будущем в России ожидается нехватка энергии для обучения ИИ-моделей. Электричества для ЦОД и искусственного интеллекта не хватает не только в других странах — оно заканчивается и в России, сообщают «Ведомости» со ссылкой на мнение экспертов. Впрочем, дефицит неоднороден и в первую очередь могут пострадать столичные регионы. По словам директора по развитию ИИ-технологий «Яндекса» Александра Крайнова, в стране не хватает не только вычислительных мощностей, но и энергии для них питания. По его мнению, компании, желающей построить большой дата-центр, удастся обеспечить его электричеством лишь за год. Причём столько энергии, сколько нужно, просто не выделят. Как заявил Крайнов, сегодня крайне нерационально обучать модели с нуля, «не используя и не переиспользуя» чужие готовые решения. Взяв за основу готовую модель, можно дообучить её на основе собственных данных. Эксперты «Альфа-банка» поддерживают идею переиспользования готовых ИИ-моделей, но отмечают, что для инференса по-прежнему будут требоваться значительные мощности, даже в случае с эффективными моделями вроде продуктов DeepSeek. Ключевыми российскими разработчиками ИИ-моделей являются «Яндекс» (YandexGPT и «Шедеврум») и «Сбер» (GigaChat и Kandinsky), а у МТС, Т-банка и других компаний есть дообученные open-source модели. Компании не только имеют собственные дата-центры, но и арендуют ёмкости. По статистике «Вектор капитал» за апрель 2024 года, российские ЦОД использовали 2,6 ГВт, около 1 % установленной мощности Единой энергосистемы (ЕЭС) России. Вместе с тем на майнинг криптовалют в РФ, по оценкам, приходится 11 ГВт, из которых 3 ГВт приходится на долю легальных майнеров. При этом многие зарубежные майнеры, такие как CoreWeave, успешно переключились на ИИ-проекты. «Системный оператор ЕЭС» (СО ЕЭС, диспетчер энергосистемы) свидетельствует, что установленная мощность электростанций страны составляла на начало 2025 года 263,7 ГВт, поэтому в целом по стране отмечается даже профицит электроэнергии — максимум потребления отмечен в 2024 году и он составил 168,3 ГВт. Однако на юге страны, в Сибири и на Дальнем Востоке из-за роста промышленности и майнинга возможны проблемы. Так, в 2025–2030 гг. дефицит в юго-восточной части объединенной энергосистемы (ОЭС) Сибири в указанный период составит до 2,9 ГВт. Аналогичные показатели ожидаются и на юге страны. В то же время, по оценкам СО ЕЭС, дефицит мощности на юге энергосистемы Москвы и области к 2030 году составит 564 МВт, а к 2042 году — до 3,15 ГВт. По оценкам директора направления ЦОД в Selectel Ильи Михайлова, проблем с производством энергии в России нет, зато есть проблемы с её доставкой. Дефицит может наблюдаться в Москве и Санкт-Петербурге и прилежащих территориях, а в регионах складывается благоприятная ситуация для создания инфраструктуры ЦОД. При этом необходимости в масштабном «переезде» из столиц пока нет. По словам представителя ГК SoftLine Кирилла Сольева, спрос уже превышает предложение, особенно для крупных объектов, а искать площадку для ЦОД на 60 МВт (сопоставимо с ёмкостью ЦОД «Яндекса»), приходится до трёх лет. В Москве, вероятно, осталось 50 МВт свободных мощностей — на два-четыре коммерческих дата-центра. При этом за последние три года многие компании занялись строительством собственных объектов из-за дефицита доступных коммерческих мощностей. Но, например, глава «Сбера» Герман Греф говорит, что оптимальным вариантом считаются проекты кампусов на 300–400 МВт. Ранее «Сбер» объявил о стратегическом сотрудничестве с крупнейшим майнером России BitRiver.
21.02.2025 [19:48], Руслан Авдеев
Запуск Grok 3 подстегнёт рост спроса на ИИ-серверыНедавние достижения в сфере ИИ обострили конкуренцию между ключевыми мировыми игроками, особенно после премьеры модели Grok 3, представленной xAI Илона Маска (Илон Маск) и претендующей на роль самой производительной в мире на сегодняшний день. Эксперты предполагают, что её запуск станет катализатором для роста продаж ИИ-серверов, сообщает DigiTimes. Команда разработчиков xAI подчеркнула, что передовые ИИ-модели для эффективного инференса требуют не менее производительных ускорителей, чем для обучения. Работа новых ИИ-моделей предусмотрена на платформах NVIDIA GB200 и GB300, которые будут играть решающую роль в изменении «ландшафта» современного искусственного интеллекта. Вариант GB300 должны представить в конце 2025 года. По мнению представителей Foxconn, успех DeepSeek сделал процесс обучения моделей более демократичным. Это означает не только то, что обучение ИИ будет требовать меньше ресурсов и, следовательно, серверов, но и то, что спрос должен вырасти. Теперь серверы будут востребованы не только у классических облачных провайдеров и операторов HPC-систем, но и у компаний среднего размера — благодаря этому востребованность оборудования только вырастет. ![]() Источник изображения: Mariia Shalabaieva/unsplash.com Уже сообщалось об ограниченных поставках GB200 в IV квартале 2024 года, но полномасштабное производство должно начаться только к концу I квартала 2025 года. В Quanta ожидают «трёхзначного» роста продаж ИИ-серверов в процентном отношении в 2025 году. Wistron тоже прогнозирует, что продажи ИИ-серверов сохранят в 2025 году «трёхзначный» рост, как и ожидалось ранее. Компания поставляет серверные стойки Dell и материнские платы Supermicro, обе продают серверы xAI. Источники в индустрии рассказывают о сохранении устойчивого спроса на ИИ-платформы, включая GB200. Также отмечаются активные поставки ускорителей H100. Как скажется выход на рынок GB300 в конце 2025 года, пока неизвестно. Хотя серверы на базе ASIC-ускорителей привлекли внимание после премьеры Deep Seek, эксперты уточняют, что они скорее дополняют, а не заменяют серверы с классическими ускорителями. ASIC предлагают больше возможностей кастомизации, что позволяет им справляться с некоторыми пользовательскими задачами более эффективно. Так или иначе, есть и другие мнения относительно будущего рынка ИИ-серверов. Буквально на днях появилась информация о том, что эксперты прогнозируют охлаждение соответствующего рынка в 2025 году.
17.02.2025 [20:23], Руслан Авдеев
IEA: мир столкнулся с «беспрецедентным» ростом спроса на электроэнергиюПо информации Международного энергетического агентства (IEA), в ближайшие три года миру потребуется много новых источников энергии, чтобы покрыть беспрецедентно быстро растущий спрос. Достичь этого будет непросто, свидетельствуют данные агентства. В отчёте IEA речь идёт о текущем состоянии рынка электроэнергии и его вероятных изменениях в 2025–2027 гг. Прогнозируется, что миру нужно будет ещё 3,5 тыс. ТВт∙ч в следующие три года. Это значит, что с нынешнего дня по 2027 год в эксплуатацию нужно будет ежегодно вводить больше мощностей, чем потребляет за год, например, Япония. При этом Япония занимает пятое место по объёмам энергопотребления в мире, на неё приходится более 1000 ТВт∙ч ежегодно. Большая доля новых мощностей будет вводиться в эксплуатацию на развивающихся рынках — именно они будут наращивать потребление электричества в ближайшие годы. Но потребление после периода относительной стагнации должно вырасти и в относительно развитых экономиках. Эта стагнация в последние годы была отчасти вызвана ростом эффективности технологий, в особенности повышением энергоэффективности. Конечно, эту тенденцию может изменить рынок ЦОД, но «виноваты» будут не только ИИ-системы и выросшие потребности в вычислениях. Так, в развивающихся экономиках вроде Индии стали использовать больше кондиционеров — во многом из-за изменения климата. А Евросоюз начинает наращивать использование тепловых насосов и электромобилей, да и дата-центры в регионе тоже ожидает взрывной рост. Всё это приведёт к росту производств, которым тоже понадобится энергия. Конечно, для покрытия спроса постоянно ведётся поиск экобезопасных источников энергии для ЦОД и других проектов — от малых модульных реакторов (SMR) до повторного запуска старых АЭС. В IEA предполагают, что уже к 2027 году АЭС, ветряные и солнечные электростанции и ГЭС смогут закрыть до 95 % прогнозируемого спроса. Уже в 2025 году источники возобновляемой энергии должны обеспечить более трети мирового производства электричества, обогнав уголь в глобальном масштабе. В 2024 году это уже случилось в США, но с оговоркой — на местном рынке энергетики доминирует газ и, по-видимому, будет доминировать и далее. Тем не менее, даже в тех регионах мира, где скачок энергопотребления будет самым высоким — например, в КНР, на которую приходится более половины мирового спроса на электричество в 2024 году — в ближайшие годы источники возобновляемой энергии удовлетворят более 90 % спроса на электричество. Если прогнозы агентства относительно возобновляемых источников энергии будут верны, в следующие три года мировые выбросы углекислого газа выйдут на плато, но изменения климата могут негативно сказаться на динамике использования возобновляемой энергии. Из-за разных факторов — от засух, зимних бурь в регионах, где их обычно не случалось, глобального потепления — цены на электричество стали весьма волатильными, что может помешать развитию новых источников. Как сообщают в IEA, эти события в целом свидетельствуют о недостаточной гибкости системы по техническим, нормативным или договорным причинам. Так или иначе, миру предстоят годы интенсивной электрификации без гарантий того, что всё пройдёт гладко для мировой экономики.
14.02.2025 [13:24], Руслан Авдеев
Эксперты прогнозируют охлаждение рынка ИИ-серверов в 2025 годуТехнологические санкции США и подготовка цепочки поставок к поступлению на рынок новейшего оборудования NVIDIA, вероятно, приведут к снижению объёмов продаж ИИ-серверов в 2025 году, сообщает The Register со ссылкой на мнение независимых экспертов. Так, TrendForce сообщает, что поставки ИИ-серверов в прошлом году выросли на 46 %, преимущественно благодаря заказам провайдеров облачных сервисов (CSP). В частности, производитель серверов Foxconn объяснил недавний рекордный рост выручки именно продажами ИИ-серверов. При этом в TrendForce рассматривают несколько вариантов развития событий на рынке серверов в 2025 году из-за неопределённости, царящей в нише ИИ-решений. Наиболее вероятным считается дальнейшее расширение рынка, но с более низким годовым приростом. Впрочем, даже в таких условиях он может превысить 30 % — Microsoft, Meta✴, Amazon и Google намерены увеличить капитальные затраты на ИИ-инфраструктуру. Как ожидается, это будет способствовать поддержке спроса на ИИ-серверы. Наихудшим сценарием, по оценке TrendForce, причём следующим по вероятности, является рост поставок ИИ-серверов до «всего» 20–25 %. Этот прогноз учитывает ужесточение США экспорта ИИ-чипов в Китай, что создаёт большую неопределённость на рынке. Кроме того, не исключены задержки поставок стоечных решений NVIDIA на основе суперчипов Grace Blackwell — их структура довольно сложна, поэтому масштабное развёртывание откладывается на II половину года. ![]() Источник изображения: Foxconn Более оптимистичный сценарий предполагает, что масштабные проекты в Китае и США (например, Stargate) помогут ускоренному развёртыванию ИИ-серверов. Кроме того, хотя триумф DeepSeek может негативно повлиять на необходимость внедрения большого количества ИИ-ускорителей, он же способен расширить применение искусственного интеллекта, стимулируя рост ИИ на периферии. При удачном стечении обстоятельств поставки ИИ-серверов вырастут в 2025 году почти на 35 %. Недавно глава IBM Арвинд Кришна (Arvind Krishna) уже предсказал, что использование аналогичных решениям DeepSeek экономичных и эффективных технологий не только не приведёт к падению рынка, но, наоборот, значительно увеличит использование оборудования после снижения «порога входа» для применения ИИ-моделей. Схожей позиции придерживаются инвесторы в ИИ-инфраструктуру вроде Blackstone и Brookfield, ожидающие, что спрос на ЦОД и оборудование не уменьшится. В TrendForce ожидают, что влияние DeepSeek будет способствовать переходу облачных операторов на недорогие чипы собственной разработки, поскольку акцент в последнее время смещается с обучения ИИ на инференс. В результате серверы, оптимизированные для запуска моделей, займут большую часть рынка. Вероятно, рынок серверов станет более сегментированным, поскольку крупные облачные игроки продолжат инвестиции в высокопроизводительные решения, а корпоративные заказчики будут отдавать предпочтение более экономичным альтернативам.
10.02.2025 [13:12], Руслан Авдеев
Ненасытный ИИ: энергопотребление ЦОД к 2030 году вырастет более чем вдвоеПо последним прогнозам инвестиционных банкиров Goldman Sachs, потребность ИИ в электричестве приведёт к тому, что всего через пять лет потребление энергии дата-центрами увеличится более чем вдвое. По оценкам финансистов, сегодня индустрия ЦОД в мире потребляет около 55 ГВт. Более половины (54 %) приходится на нагрузки при облачных вычислениях, на традиционные сервисы вроде серверов e-mail и хранилищ данных — ещё 32 %, а на ИИ — 14 %. Моделирование будущего спроса позволяет предположить, что уже к 2027 году он вырастет до 84 ГВт, а доля ИИ составит 27 %. На облачные нагрузки придётся около 50 %, а на традиционные нагрузки — 23 %. Если прогнозы верны, всего за пару лет потребление в энергии взлетит на 59 % и тенденция, вероятно, сохранится и в будущем. К концу 2030 года общая мощность ЦОД должна составить уже 122 ГВт — рост в 165 % в сравнении с 2023 годом. Капитальные затраты Amazon, в основном связанные с AWS, в 2025 году должны составить $100 млрд. Microsoft намерена потратить на инфраструктуру $80 млрд, Google — $75 млрд, а Meta✴ — до $65 млрд. Столь значительные средства преимущественно пойдут на развитие именно ИИ-инфраструктуры. В результате инвестиции потребуются и энергосетям, на модернизацию которых до 2030 года может потребоваться до $720 млрд — немало, но в противном случае нехватка энергии может затормозить развитие ЦОД в ряде регионов. В Goldman Sachs предупреждают, что на модернизацию ЛЭП может уйти несколько лет, что может стать «узким местом» для рынка ЦОД, если регионы не проявят достаточной инициативы. В прошлом году аналитики Bain & Co предупреждали о том, что рост энергопотребления в США способен превысить предложение буквально за пару лет, если энергетические компании не примут мер для наращивания мощностей по производству и распределению электричества. Также сообщалось, что к 2030 году американцы могут столкнуться с ростом счетов за электричество на 70 % — если необходимые меры не принять. В Goldman Sachs, рассчитывают, что в ближайшем будущем баланс спроса и предложения в отрасли ЦОД «ужесточится», а загруженность инфраструктуры ЦОД, составлявшая 85 % в 2023 году, уже в конце 2026 года превысит 95 %. В 2027 году должно начаться замедление темпов роста загруженности благодаря вводу в эксплуатацию новой инфраструктуры. Впрочем, это предположение основано на гипотезе исследователей, предполагающей, что более эффективные ИИ-модели несколько снизят потребность в инфраструктуре. В долгосрочной перспективе, если повышение эффективности приведёт к снижению уровня капитальных затрат, рынок дата-центров станет более устойчивым и будет меньше подвержен циклическим колебаниям. Будучи финансовой компанией, Goldman Sachs заинтересована как в открывающихся инвестиционных возможностях, так и в том, чтобы предупредить о возможном кризисе. Отмечается, что в выигрыше от роста спроса на ИИ окажутся крупные операторы ЦОД, обслуживающие гиперскейлеров и крупных корпоративных клиентов. В прошлом году сообщалось, что аналитики Goldman Sachs не уверены в будущем ИИ, поскольку на него тратится слишком много средств, а польза не вполне очевидна.
06.02.2025 [12:31], Руслан Авдеев
Dell'Oro Group: к 2029 году ежегодные капиталовложения в ЦОД превысят $1 трлн, но только с учётом StargateDell'Oro Group прогнозирует, что к 2029 году ежегодные мировые капиталовложения в ЦОД превысят $1 трлн, а их средний темп прироста (CAGR) составит 21 %. К этому моменту расходы на ИИ-серверы с ускорителями и серверы для специфичных нагрузок могут достичь почти половину всех расходов на дата-центры. В 2025 году на долю крупнейших гиперскейлеров — Amazon, Google, Meta✴ и Microsoft — придётся почти половина мировых капиталовложений в ЦОД. Microsoft намерена потратить на расширение инфраструктуры $80 млрд, Google — $75 млрд, а Meta✴ — до $65 млрд. Вместе с тем некоторые облачные провайдеры второго эшелона готовы значительно увеличить капиталовложения в ближайшие годы. Как заявляют в Dell'Oro Group, хотя расходы на инфраструктуру ЦОД ещё не достигли желаемого уровня отдачи и эффективности, рост капиталовложений в долгосрочной перспективе гарантирован. Этому способствуют многолетние инвестиции в поддерживаемые правительствами проекты вроде Stargate, на который в перспективе уйдёт до $500 млрд. Правительство США напрямую Stargate не финансирует, но OpenAI с партнёрами намерена только на первом этапе вложить в него $100 млрд. Пока ожидается, что SoftBank и OpenAI инвестируют по $19 млрд, а Oracle и MGX — по $7 млрд. Остальные средства ещё предстоит привлечь, средства необходимы и самой OpenAI, на которую, вероятно, потратится SoftBank. Прогноз Dell'Oro основан на том, что планы относительно Stargate — не пустой звук. Также учтены долгосрочные планы гиперскейлеров, поскольку крупные игроки, не участвующие в Stargate, тоже намерены расширять свою инфраструктуру. Также эксперты упомянули недорогую и эффективную китайскую модель стартапа DeepSeek, буквально обвалившую на время сегмент фондового рынка США. Утверждается, что новость о DeepSeek была революционной, но другие компании тоже ведут собственные работы над повышением эффективности ИИ-моделей. Ранее сообщалось, что компании вроде Blackstone и Brookfield рассчитывают продолжать инвестиции в инфраструктуру, а эксперты The Register привели подборку мнений ключевых игроков рынка, которые в основном тоже уверены в больших перспективах роста рынка ЦОД.
03.02.2025 [09:20], Руслан Авдеев
The Register: Успех DeepSeek показал важность обдуманных инвестиций в ИИ, но потребность в развитии инфраструктуры никуда не денетсяШок, вызванный недавним триумфом китайского ИИ-стартапа DeepSeek, представившего дешёвые и эффективные ИИ-модели, заставил многих усомниться в результативности масштабных вложений в инфраструктуру на базе дорогих ИИ-ускорителей, сообщает The Register. Тем не менее эксперты уверены, что отказываться от инвестиций было бы нецелесообразно. На прошлой неделе акции ряда крупнейших американских ИИ-брендов после дебюта весьма эффективной модели DeepSeek R1, использующей, со слов создателей, сравнительно мало ускорителей NVIDIA, буквально обрушились в цене. Из-за этого многие эксперты усомнились в том, что траты миллиардов на аппаратную инфраструктуру для ИИ себя оправдывают, если Китай способен добиться хороших результатов, используя не самое мощное оборудование. Например, NVIDIA «в моменте» потеряла $600 млрд рыночной стоимости. Настоящая истерия наложилась на растущее беспокойство в связи с тем, что всё больше денег тратится на инфраструктуру и её поддержку, а особенной отдачи пока не видно. Впрочем, паника может быть неуместной, поскольку обрушение акций прекратилось, а DeepSeek обвиняется в использовании ИИ-моделей Anthropic и OpenAI. Как отмечает The Register, нет и реальных подтверждений того, что производительность моделей DeepSeek находится на уровне лучших из актуальных моделей, а также того, что на обучение китайского ИИ ушло всего $6 млн. По оценкам SemiAnalysis, доступная DeepSeek инфраструктура гораздо больше, чем утверждает компания, и стоит более чем $1,5 млрд. По словам экспертов Omdia, опасения относительно «сокрушительных» инноваций DeepSeek сильно преувеличены. В компании подтверждают, что китайский стартап использовал некоторые «гениальные инновации», но они приведут лишь к массовому использованию аналогичных решений и строительству новой ИИ-инфраструктуры. В Omdia прогнозируют, что в ближайшие годы рынок ИИ-инфраструктуры, скорее всего, значительно вырастет. В компании полагают, что до 2028 года поставки серверов для инференса будут расти на 17 % ежегодно. В TrendForce придерживаются несколько иного мнения и предполагают, что в будущем организации всё же станут более строго оценивать инвестиции в инфраструктуру ИИ и станут применять более эффективные модели для того, чтобы снизить зависимость от доступности ускорителей. Также не исключается, что чаще будут использоваться кастомные ASIC вместо сторонних ИИ-ускорителей и спрос на «классические» модели может претерпеть с 2025 года заметные изменения. Если раньше индустрия полагалась в первую очередь на масштабирование моделей, увеличение объёмов данных и повышение производительности оборудования, то теперь стратегия меняется. DeepSeek прибегла к «дистилляции» моделей, повышению скорости инференса и снижения зависимости от оборудования. Не так давно генеральный директор IBM Арвинд Кришна (Arvind Krishna) объявил, что деятельность DeepSeek подтвердила правильность подхода к ИИ его собственной компании, считающей, что модели могут быть меньше, как и время их обучения. При использовании подобных подходов затраты на инференс могут снизиться в 30 раз, что очень хорошо для корпоративных клиентов. Ещё в 2023 году компания начала развивать серию «экономичных» базовых моделей Granite. Вероятно, по этому пути пойдут и другие. Gartner также сообщает, что именно эффективное масштабирование ИИ будет целесообразнее простого наращивания вычислительных ресурсов. Впрочем, китайский ИИ не устанавливает новый стандарт эффективности моделей, поскольку те соответствуют показателям уже существующих, но не превосходят их. Кроме того, нет доказательств, что добавление дополнительных вычислительных ресурсов и данных не имеет значения. The Register прогнозирует, что продукты и технологии DeepSeek не вызовут резкого падения спроса на ИИ-инфраструктуру, поэтому инвесторам NVIDIA и строителям ЦОД, вероятно, можно не бояться того, что «пузырь» ИИ лопнет, как этого ожидают некоторые эксперты. Во всяком случае одни из крупнейших инвесторов в сектор ЦОД — Blackstone и Brookfield — заявили, что следят за успехами DeepSeek, но отказываться от инвестиций не собираются. Тем не менее, успех китайского стартапа напоминает о том, что «всегда можно сделать ещё лучше» и экстенсивное вливание денег и вычислительных ресурсов не всегда лучший вариант. |
|