Материалы по тегу: foundry
15.08.2024 [14:57], Руслан Авдеев
Выходцы из Google DeepMind запустили ИИ-облако FoundryНа рынке ИИ-облаков появился очередной провайдер. The Register сообщает, что стартап Foundry Cloud Platform (FCP) объявил о доступности своей платформы, но пока только для избранных. Компания основана в 2022 году бывшим экспертом Google DeepMind Джаредом Куинси Дэвисом (Jared Quincy Davis) и ей придётся конкурировать с Lambda Labs и CoreWeave, которые уже получили миллиарды инвестиций. Стартап намерен сделать клиентам более интересное предложение, чем просто аренда ИИ-ускорителей в облаке. Так, клиент, зарезервировавший 1000 ускорителей на X часов, получит именно столько ресурсов, сколько заказал. Задача на самом деле не очень простая, поскольку временные отказы вычислительного оборудования возникают довольно часто, а время простоя всё равно оплачивается. В Foudry намерены решить проблему, поддерживая в готовности пул зарезервированных узлов на случай возникновения сбоев основного оборудования. При этом резервные мощности будут использоваться даже во время «дежурства» для выполнения более мелких задач, соответствующие ресурсы будут предлагаться клиентам по ценам в 12–20 раз ниже рыночных. При этом пользователь таких spot-инстансов должен быть готов к тому, что их в любой момент могут отобрать. При этом состояние текущей нагрузки будет сохранено, чтобы её можно было перезапустить. А если прямо сейчас мощный инстанс не нужен, то его можно «перепродать» другим пользователям. Также можно задать порог стоимости покупаемых ресурсов, чтобы воспользоваться ими, когда цена на них упадёт ниже заданной. Foundry вообще делает упор именно на гибкость и доступность вычислений, ведь далеко не всем задачам нужны самый быстрые ускорители или самый быстрый отклик. Компания умышленно дистанцируется от традиционных контрактов сроком на год и более. Уже сейчас минимальный срок разовой аренды составляет всего три часа, что для индустрии совершенно нетипично. Foundry предлагает ускорители NVIDIA H100, A100, A40 и A5000 с 3,2-Тбит/с InfiniBand-фабрикой, размещённые в ЦОД уровня Tier III/IV. Облако соответствует уровню защиты SOC2 Type II и предлагает HIPAA-совместимые опции. При этом пока не ясны объёмы кластеров, предлагаемых Foundry. Возможно, именно поэтому компания сейчас очень тщательно отбирает клиентов. Другими словами, стартапу ещё рано тягаться с CoreWeave или Lambda, даже при наличии передовых и нестандартных технических решений. Преимуществом для таких «новых облаков» стала относительная простота получения необходимого финансирования для создания больших кластеров ИИ-ускорителей. Помимо привлечения средств в ходе традиционных раундов инвестирования, компании стали занимать новые средства под залог самих ускорителей. В своё время CoreWeave удалось таким способом получить $7,5 млрд. Пока многие компании ещё не выяснили, как оценить финансовую отдачу от внедрения ИИ. Тем не менее, поставщики инфраструктуры этот вопрос, похоже, уже решили. Ранее портал The Next Platform подсчитал, что кластер из 16 тыс. H100 обойдётся примерно в $1,5 млрд и принесёт $5,27 млрд в течение четырёх лет, если ИИ-бум не пойдёт на спад.
24.03.2024 [15:00], Сергей Карасёв
ИИ-облако нового поколения: выходцы из Google DeepMind создали платформу Foundry, получив $80 млн инвестицийКомпания Foundry Technologies, по сообщению ресурса Datacenter Dynamics, запустила публичную облачную платформу, оптимизированную для нагрузок ИИ. Инвестиции в проект составили $80 млн, а сама Foundry при этом получила оценку приблизительно $350 млн. Говорится, что средства привлечены в рамках посевного раунда и раунда Series A. Инвестиционную программу возглавили Lightspeed Venture Partners и Sequoia Capital. К ним присоединились более дюжины других инвесторов, в том числе венчурное подразделение Microsoft, главный научный сотрудник Google Джефф Дин (Jeff Dean) и соучредитель Databricks Матей Захария (Matei Zaharia). Джаред Куинси Дэвис (Jared Quincy Davis), генеральный директор и основатель Foundry, ранее работал научным сотрудником в команде Google DeepMind. Кроме того, в новом проекте участвуют другие специалисты DeepMind, учёные Стэнфордского университета (Stanford University) и Захария. Создание Foundry началось в 2022 году, а сейчас состоялось официальное открытие платформы. В рамках нового ИИ-облака предоставляется доступ к нескольким типам инстансов. Некоторые из них базируются на ускорителях NVIDIA H100, тогда как другие используют менее мощные аппаратные конфигурации, ориентированные на экономическую эффективность. Клиенты могут наращивать или сокращать вычислительные ресурсы по мере необходимости. «Мы создаём новое поколение публичных облаков на базе платформы оркестрации, которые делают доступ к вычислительным ресурсам ИИ таким же простым, как включение света», — говорит Дэвис. Отмечается, что сервисы Foundry проектируются в соответствии с «самыми высокими стандартами безопасности». Платформа подходит для обучения ИИ-моделей, инференса и запуска готовых сервисов. Привлечённые средства компания намерена направить на развитие проекта и расширение партнёрской сети. |
|