Материалы по тегу: databricks
23.01.2025 [12:13], Сергей Карасёв
Databricks закрыла раунд финансирования на $10 млрд, получив оценку в $62 млрдКомпания Databricks, основанная в 2013 году, объявила об окончательном закрытии раунда финансирования Series J, в ходе которого на развитие привлечено $10 млрд. Кроме того, Databricks получила дополнительное долговое финансирование на сумму $5,25 млрд. Databricks разработала платформу машинного обучения, анализа и обработки данных. Компания предоставляет функции, которые позволяют предприятиям настраивать или кастомизировать модели ИИ. Databricks также помогает заказчикам в развёртывании собственных приложений на базе генеративного ИИ. В раунде Series J приняли участие Thrive Capital, Qatar Investment Authority, Temasek, Macquarie Capital и Meta✴ Platforms. Полученные средства будут использованы для разработки новых ИИ-продуктов, приобретения сторонних фирм и расширения международных операций с целью усиления рыночных позиций. Инвестиции со стороны Meta✴ Platforms укрепят сотрудничество двух компаний в области ИИ, которое сфокусировано на больших языковых моделях семейства Llama. После привлечения финансирования Databricks получила рыночную оценку в $62 млрд. Вместе с тем долговое финансирование на $5,25 млрд включает нефинансируемый возобновляемый кредит на $2,5 млрд и срочный кредит на $2,75 млрд. В этой программе участвуют JPMorgan Chase, Barclays, Citi, Goldman Sachs и Morgan Stanley, а также ряд других финансовых учреждений. Отмечается, что на сегодняшний день более 10 тыс. организаций по всему миру, включая Block, Comcast, Condé Nast, Rivian, Shell и свыше 60 % компаний из списка Fortune 500, используют платформу Databricks Data Intelligence. Она помогает в решении комплексных задач, таких как раннее выявление и лечение заболеваний, разработка новых способов борьбы с изменением климата, обнаружения финансового мошенничества, создание фармацевтических препаратов и пр. Штаб-квартира Databricks расположена в Сан-Франциско (Калифорния, США), а представительства действуют по всему миру.
16.12.2024 [19:04], Руслан Авдеев
Databricks завершает раунд мегафинансирования на сумму $10 млрд [Обновлено]Основанная в 2013 году авторами Apache Spark компания Databricks завершает один из рекордных для венчурного капитала раундов финансирования, сообщает Reuters. Сообщается, что компания получит практически вдвое больше, чем рассчитывала — более $9,5 млрд. Но и эта сумма может вырасти, поскольку инвесторы горят желанием приобрести часть перспективной компании. Капитализация Databricks, которая предлагает инструментарий для анализа и обработки больших массивов данных, после завершения раунда, вероятно, превысит $60 млрд. Раунд, вероятно, будет возглавлен новым инвестором Thrive Capital, также участие примут Andreessen Horowitz, Insight Partners и GIC, уже снабжавшие компанию деньгами. Помимо прямых инвестиций обсуждается и долговое финансирование на $4,5 млрд, в том числе кредит на $2,5 млрд. При этом выручка компании в следующем финансовом году, по прогнозам, составит всего $3,8 млрд. Компания начинала деятельность с анализа больших данных, а затем вышла на рынок ИИ, создав облачную платформу для управления информацией, необходимой ИИ-приложениям, и семейство собственных LLM Dolly и DBRX. В сентябре стоимость компании оценивалась в $43 млрд. От бума систем искусственного интеллекта компания только выиграла. Платформа используется клиентами для хранения растущих объёмов данных, предназначенных для обучения ИИ. Если раунд финансирования завершится удачно, немало выиграют её первые сотрудники — полученные средства используют для выкупа акций с ограниченным сроком действия и покрытия налоговых затрат на покупки. Позже компания намерена выпустить для инвесторов привилегированные акции. По имеющимся данным, раунд организовали для решения вопросов с принадлежащими сотрудникам опционами с истекающим сроком действия. Нечто подобное в своё время провела платёжная компания Stripe Inc., в прошлом году получившая таким образом $6,5 млрд для выкупа акций. Databricks является конкурентом Snowflake, рыночная капитализация которой составляет $56 млрд (в пике было $120 млрд). IPO последней в своё время было названо крупнейшим за всю историю софтверной индустрии. Предполагается, что в Databricks пока не очень спешат с выходом на биржу, хотя эксперты прогнозируют серию выходов на IPO в следующем году. UPD 18.12.2024: Databricks объявила, что в ходе раунда J намерена собрать $10 млрд и уже получила $8,6 млрд при оценке капитализации в $62 млрд. В случае успешного завершения раунда общий объём инвестиций с момента основания компании в 2013 году составит $14 млрд.
10.06.2024 [22:02], Владимир Мироненко
Не хочешь конкурировать — купи: Databricks приобрела Tabular за $1+ млрд, чтобы унифицировать озёра данныхАмериканский стартап в сфере аналитики больших данных и машинного обучения Databricks объявил о приобретении компании по управлению данными Tabular. Точная сумма сделки не раскрывается, но глава Databricks Али Годси (Ali Ghodsi) сообщил в интервью CNBC, что стоимость покупки превышает $1 млрд. Соучредители Tabular присоединятся к Databricks, где будут работать над объединением клиентских баз и сообществ Tabular и Databricks. Компания Tabular была основана ими в 2021 году. Она предлагает продукты для управления данными, созданные на основе Apache Iceberg — проекта, которым создатели Tabular занимались в Netflix и позже передали в дар фонду Apache Software Foundation. Iceberg — открытый формат для таблиц сверхбольших данных. Databricks предлагает объектно-ориентированное озеро данных Lakehouse на базе собственного открытого формата Delta Lake. С момента создания Delta Lake в проекте приняли участие более 500 разработчиков. Более 10 тысю компаний по всему миру используют Delta Lake для обработки в среднем более 4 Эбайт данных каждый день. Это быстрорастущий бизнес, но Iceberg-решения не менее популярны и конкурируют с решениями Databricks, отметил ресурс Blocks & Files. При этом о полной совместимости между Iceberg и Delta Lake речи не было. Но в 2023 году компания также представила UniForm-таблицы, позволяющие работать с Delta Lake, Iceberg и Hudi. А после поглощения Databricks будет тесно сотрудничать с сообществами Delta Lake и Iceberg для разработки совместимых форматов озёр данных. В краткосрочной перспективе это будет реализовано в рамках Delta Lake UniForm, а в долгосрочной перспективе будет создан единый, открытый и общий стандарт.
28.03.2024 [22:01], Владимир Мироненко
Databricks представила открытую LLM DBRX, превосходящую GPT-3.5 TurboАмериканский стартап в сфере аналитики больших данных и машинного обучения Databricks объявил о выходе DBRX, большой языковой модели (LLM) общего назначения, которая, по его словам, превосходит в стандартных бенчмарках все существующие LLM с открытым исходным кодом, а также некоторые проприетарные ИИ-модели. Стартап заявил, что открывает исходный код модели, чтобы побудить пользователей отказаться от коммерческих альтернатив. Он отметил, что согласно исследованию Andreessen Horowitz LLC, почти 60 % лидеров в области ИИ-технологий заинтересованы в увеличении использования или переходе на open source, если открытые модели после тюнинга примерно соответствуют по производительности проприетарным моделям. ![]() Источник изображений: Databricks «Я считаю, что самые ценные данные хранятся внутри предприятий. ИИ как бы исключён из этих сфер, поэтому мы пытаемся реализовать это с помощью моделей с открытым исходным кодом», — цитирует ресурс SiliconANGLE заявление гендиректора Databricks Али Годси (Ali Ghodsi) на брифинге с журналистами. По словам Годси, лучше всего DBRX подходит для сфер, где критически важны управление и безопасность, например, для финансовых услуг и здравоохранения, или там, где важен тон ответов, например, в области самообслуживании клиентов. DBRX использует архитектуру Mixture of Experts (MoE, набор экспертов), которая делит процесс обучения между несколькими специализированными «экспертными» подсетями. Каждый «эксперт» владеет определёнными навыками, а исходный запрос оптимальным образом распределяется между «экспертами». Вице-президент Databricks по генеративному ИИ, перешедший в компанию вместе с приобретением MosaicML, соучредителем которой он был, заявил, что MoE работает даже лучше человека. Хотя DBRX с 132 млрд параметром почти в два раза больше Llama 2, она всё равно вдвое быстрее. Также сообщается, что DBRX превзошла существующие LLM с открытым исходным кодом Llama 2 70B и Mixtral-8x7B (тоже MoE), а также запатентованную GPT-3.5 Turbo в тестах на понимание языка, программирование, математику и логику. Обучение модели на общедоступных и лицензированных источниках данных в течение двухмесячного периода обошлось Databricks всего в $10 млн с использованием 3 тыс. ускорителей NVIDIA H100. По словам компании, при создании приложений генеративного ИИ модель DBRX можно использовать вместе с Databricks Mosaic AI, набором унифицированных инструментов для создания, развёртывания и мониторинга моделей ИИ. Базовая модель DBRX Base и продвинутая модель DBRX Instruct доступны по открытой лицензии для исследований и коммерческого использования на GitHub и Hugging Face. Разработчики могут уже сегодня создавать свои варианты DBRX на основе собственных данных на платформе Databricks.
16.09.2023 [21:34], Сергей Карасёв
Стартап Databricks привлёк ещё $500 млн, что повысило капитализацию компании до $43 млрдСтартап Databricks, разработчик платформы машинного обучения, анализа и обработки данных, сообщил о проведении раунда финансирования Series I: на развитие привлечено дополнительно $500 млн. Таким образом, на сегодняшний день общий объём инвестиций в эту компанию превысил $4 млрд. Databricks предоставляет озеро данных, которое предприятия могут использовать для хранения, организации и анализа больших объемов информации. Стартап также помогает заказчикам в развёртывании собственных приложений на базе генеративного ИИ. Компания основана в 2013 году создателями Apache Spark. ![]() Источник изображения: Gabby Jones / Bloomberg Отмечается, что Databricks быстро наращивает выручку: по итогам II четверти текущего финансового года, которая была закрыта 31 июля, показатель преодолел знаковый рубеж в $1,5 млрд — это более чем на 50 % превосходит прошлогодний результат. В глобальном масштабе решения Databricks применяют свыше 10 тыс. организаций, включая более половину компаний из списка Fortune 500. Раунд финансирования Series I проведён под руководством T. Rowe Price Associates. В программе также приняли участие Andreessen Horowitz, Baillie Gifford, ClearBridge Investments, Counterpoint Global (Morgan Stanley), Fidelity Management & Research Company, Franklin Templeton, GIC, Octahedron Capital, Tiger Global, Capital One Ventures, Ontario Teachers' Pension Plan и NVIDIA. Прошлый раунд финансирования Databricks был завершён в 2021 году: тогда стартап получил $1,6 млрд, а его рыночная стоимость достигла $38 млрд. Теперь же капитализация оценивается в $43 млрд при стоимости акций на уровне $73,5.
27.06.2023 [16:56], Владимир Мироненко
Databricks купила разработчика генеративного ИИ MosaicML за $1,3 млрдСтартап Databricks, разработчик платформы машинного обучения, анализа и обработки данных, объявил о приобретении компании-разработчика решений в области генеративного ИИ MosaicML Inc. С помощью разработанных MosaicML языковых моделей компании смогут обучать и выполнять точную настройку генеративных ИИ-моделей на основе собственных данных с высоким качеством и низкой стоимостью, а технологии оптимизации обучения моделей MosaicML помогут снизить затраты. MosaicML наиболее известна своим собственным семейством больших языковых моделей (LLM) MPT, с более чем 3,3 млрд загрузок модели MPT-7B. Семейство LLM компании с открытым исходным кодом основано на архитектуре MPT-7B, построенной с 7 млрд параметров и контекстным окном на 64 тыс. токенов. На днях MosaicML выпустила модель MPT-30B с 30 млрд параметров, которая гораздо мощнее MPT-7B и превосходит по качеству модель OpenAI GPT-3 (175 млрд параметров). ![]() Источник изображения: MosaicML MosaicML сообщила, что размер MPT-30B был специально подобран для развёртывания всего на одном ускорителе — либо NVIDIA A100 80 Гбайт (16-бит точность), либо A100 40 Гбайт (8-бит точность). По словам MosaicML, другие сопоставимые LLM, такие как Falcon-40B, имеют большее количество параметров и не могут обслуживаться на одном ускорителе, что увеличивает минимальную стоимость системы инференса. Платформа Databricks Lakehouse в сочетании с технологиями MosaicML предложит клиентам простой, быстрый и экономичный способ сохранить контроль над данными, а также обеспечить их безопасность и защитить правf собственности. Размещая модели в Databricks Lakehouse, компании смогут адаптировать их к конкретным корпоративным данным и безопасно развёртывать их. Использование обслуживаемых моделей, таких как от OpenAI, может привести к утечке данных и другим рискам. Это особенно важно для строго регулируемых отраслей — модель и данные должны оставаться вместе в изолированном окружении. Кроме того, решения MosaicML обеспечивают в 2–7 раз более быстрое обучение моделей по сравнению со стандартными подходами, предлагая при этом линейное масштабирование. Компания утверждает, что модели с несколькими миллиардами параметров теперь можно обучить за часы, а не за дни. Согласно пресс-релизу, при применении интегрированной платформы Databricks и MosaicML обучение и использование LLM будет стоить тысячи долларов, а не миллионы. «Теперь Databricks может расширить свою платформу для создания, обучения и размещения традиционных моделей машинного обучения на большие языковые модели, — заявил Джастин ДеБрабант (Justin DeBrabant), старший вице-президент ActionIQ Inc. — Это означает, что Databricks предлагает продукты и услуги на платформе Lakehouse. которые простираются от ETL до аналитики SQL, пользовательского машинного обучения, а теперь и до размещённых LLM». |
|