Ветер больших моделей неизбежно подул в индустрию больших данных, и порохом не пахнет.
Это несчастье приближается Кто-то заметил, что Databricks и Snowflake, два «старых врага» индустрии больших данных, оба выбрали самый важный ежегодный саммит каждого из них, который пройдет в одно и то же время в этом году — 26-29 июня.
Это то, чего не было за столько лет.
Мало того, они также «единодушно» переместили тему конференции этого года ближе к ИИ. Databricks напрямую назвал конференцию «Саммит Data+AI Summit», а один клик на официальном сайте — это огромный «Generation AI»:
Snowflake также добавила к своей конференции отличный атрибут «крупнейшая в мире тематическая конференция по данным, приложениям и искусственному интеллекту»:
Это показывает что? Это показывает, что две компании нагло вынуждают участников сделать выбор: если вы пойдете на их встречу, нам может быть уже поздно приходить снова.
Вы должны знать, что эти две компании, одна в Сан-Франциско, а другая в Лас-Вегасе, занимают 9 часов на машине и 1,5 часа на самолете. Участники хотят иметь и рыбу, и медвежью лапу, боюсь, что накидать придется вдоволь.
Грядет следующее большое дело, мало того, что время совпадает, обе компании пригласили важных гостей для выступления с программными докладами — Databricks пригласила генерального директора Microsoft Сатью Наделлу (Satya Nadella), Snowflake — генерального директора Nvidia Хуанг Ренсюня.
Каждый является боссом.
Некоторые пользователи сети напомнили всем, что, поскольку саммиты двух компаний проходили в одно и то же время, «если вы еще не выбрали сторону, вам пора выбирать».
Конечно, есть и немало людей, готовых бежать за обе стороны. Менеджер по продукции Striim Джон Кутай планирует выступить на обеих конференциях, но также «оценит расстояние и время между Лас-Вегасом и Сан-Франциско».
Пользователь сети, который еще не решился, спросил его, какой будет его речь на Databricks: «Я хочу поехать, но, увы, мне придется поехать в Сан-Франциско, когда придет время».
В связи с этим одному пользователю сети даже приснился возмутительный сон: «Мне просто приснилось, что все были заражены новой короной на конференции Snowflake, потому что Snowflake не хотела, чтобы мы участвовали в саммите Databricks…»
И Snowflake, и Databricks в настоящее время являются лидерами компаний, занимающихся аналитикой больших данных. Первый был основан в 2021 году и стал публичным в сентябре 2020 года. Цена акций выросла на 111,6% в первый день листинга и закрылась на уровне 253,93 доллара, что сделало его крупнейшим IPO программного обеспечения в истории Соединенных Штатов.
Кроме того, в список акционеров Snowflake входят такие известные инвесторы, как Salesforce и Buffett.
Компания Databricks, основанная в 2013 г., в настоящее время является супер-единорогом на первичном рынке.В 2021 г. компания получила два последовательных раунда крупномасштабного финансирования на уровне 1 млрд долл. США с оценкой в 38 млрд долл. США (данные за 2021 г.). .
Некоторые китайские практикующие больше привыкли называть его «кирпичным заводом».
Мало того, что внешний мир часто сравнивает эти две компании, они также всегда открыто и тайно конкурируют друг с другом.
Самый известный звонок — в 2021 году. В то время, когда Snowflake достигла рыночной стоимости в 100 миллиардов долларов за счет использования облачного хранилища данных, Databricks не могла сидеть на месте и опубликовала статью, в которой говорилось, что ее технология озера данных установила новый рекорд в тесте производительности TPC-DS.
Дело в том, что Databricks также освещает сторонние исследования, которые показывают до 2,5 раз фактическую производительность Snowflake.
Десять дней спустя Snowflake ответила, опубликовав результаты собственных тестов, заявив при этом, что выводы по сравнению производительности, опубликованные Databricks, неполны, а само исследование было ошибочным.
Основатель Snowflake также подчеркнул, что такие тесты бессмысленны, поскольку публикация результатов тестов баз данных в наше время «превращает обычное техническое общение в маркетинговый трюк, лишенный целостности».
Unwilling Databricks снова отреагировали, и основатель опубликовал блог, на этот раз с более серьезным обвинением: Snowflake фактически изменила входные данные TPC-DS для результатов тестирования.
С тех пор взаимное удушье между ними не прекращается.
В разговоре с инвестором Мэттом Турком в прошлом году Али Годси, соучредитель и генеральный директор Databricks, не стал уклоняться от разговора о конкуренции со Snowflake.
Сначала он коммерчески хвастался, что у Snowflake «вероятно, лучшее хранилище данных на рынке», и что «Databricks и Snowflake будут сосуществовать примерно у 70% клиентов».
Чтобы добавить сюда, Snowflake в основном использует технологию хранилища данных, а Databricks использует технологию озера данных, что также является основным различием между двумя техническими идеями.
Затем Али Годси продвигал свое собственное озеро данных: «У поставщиков общедоступных облачных вычислений есть стимул побуждать больше людей хранить данные в своих озерах данных… Я думаю, парадигма озера данных победит».
Погоня за производительностью продукта еще не окончена, и теперь Databricks и Snowflake тайно исследуют большую модель.
Databricks выпустила модель большого языка с открытым исходным кодом под названием Dolly (предположительно, в честь Долли, первой клонированной овцы) в марте этого года, заявив, что «за 30 долларов, сервер и три часа мы можем научить Долли начать взаимодействовать с человеческий уровень».
Это, очевидно, нацелено на продукты с более высоким порогом, такие как ChatGPT, а это означает, что ИИ больше не является чем-то, что могут себе позволить только крупные технологические компании.Без большого финансирования любой может разработать ИИ, который действительно похож на человека.
Затем в апреле Databricks выпустила Dolly 2.0, итеративную версию большой языковой модели с открытым исходным кодом.
Snowflake также постоянно продвигает большие модели: в апреле она опубликовала статью, в которой говорилось, что она создает ориентированную на данные платформу для генеративного ИИ и больших языковых моделей, и подробно объясняла, на чем это основано, и какое влияние это окажет.
В мае следующего года Snowflake объявила о приобретении стартапа Neeva, чтобы добавить генеративный поиск на основе ИИ к своей облачной платформе данных.
Хотя две компании еще не вступили на территорию друг друга с точки зрения крупных моделей ИИ, совпадающие сроки проведения этого ежегодного саммита уже объяснили их отношение.
Интересно, что когда кто-то ищет в Google «конференцию Snowflake», первым результатом является ссылка на конференцию Databricks, за которой следует ссылка Snowflake.
Это равносильно утверждению, что Databricks купила ключевые слова конкурентов для продажи собственной рекламы.
Мы также обнаружили, что при одновременном поиске Google «Databricks+Snowflake» первые два были рекламными объявлениями (этот результат отображался динамически) — Databricks по-прежнему рекламировал свои достижения на первой позиции в рейтинге торгов, но вторая является поставщиком технических услуг и продвигает свой сервис, чтобы помочь клиентам перейти на Snowflake. Этот запуск даже более интересен, чем две ситуации с прямыми торгами, которые кто-то обнаружил ранее. Databricks все еще можно интерпретировать (с точки зрения коммерческого наступления) как более агрессивный , Более сильная и воинственная сторона, но в конкуренции между ними некоторые поставщики технических услуг также ищут возможности для бизнеса и, похоже, считают, что переход на Snowflake более необходим...
В любом случае, большая битва вот-вот начнется снова. Сейчас нет недостатка в спойлерах в области больших моделей, а когда дело доходит до Databricks и Snowflake, может стать вопрос, кто кого убьет первым.
Посмотреть Оригинал
Содержание носит исключительно справочный характер и не является предложением или офертой. Консультации по инвестициям, налогообложению или юридическим вопросам не предоставляются. Более подробную информацию о рисках см. в разделе «Дисклеймер».
Большие модели разрывают индустрию баз данных: Databricks и Snowflake позволяют разработчикам выбирать сторону
Текст: Ли Хэзи Редактор: Вики Сяо
Ветер больших моделей неизбежно подул в индустрию больших данных, и порохом не пахнет.
Это несчастье приближается Кто-то заметил, что Databricks и Snowflake, два «старых врага» индустрии больших данных, оба выбрали самый важный ежегодный саммит каждого из них, который пройдет в одно и то же время в этом году — 26-29 июня.
Это то, чего не было за столько лет.
Мало того, они также «единодушно» переместили тему конференции этого года ближе к ИИ. Databricks напрямую назвал конференцию «Саммит Data+AI Summit», а один клик на официальном сайте — это огромный «Generation AI»:
Вы должны знать, что эти две компании, одна в Сан-Франциско, а другая в Лас-Вегасе, занимают 9 часов на машине и 1,5 часа на самолете. Участники хотят иметь и рыбу, и медвежью лапу, боюсь, что накидать придется вдоволь.
Грядет следующее большое дело, мало того, что время совпадает, обе компании пригласили важных гостей для выступления с программными докладами — Databricks пригласила генерального директора Microsoft Сатью Наделлу (Satya Nadella), Snowflake — генерального директора Nvidia Хуанг Ренсюня.
Каждый является боссом.
Некоторые пользователи сети напомнили всем, что, поскольку саммиты двух компаний проходили в одно и то же время, «если вы еще не выбрали сторону, вам пора выбирать».
Пользователь сети, который еще не решился, спросил его, какой будет его речь на Databricks: «Я хочу поехать, но, увы, мне придется поехать в Сан-Франциско, когда придет время».
Кроме того, в список акционеров Snowflake входят такие известные инвесторы, как Salesforce и Buffett.
Компания Databricks, основанная в 2013 г., в настоящее время является супер-единорогом на первичном рынке.В 2021 г. компания получила два последовательных раунда крупномасштабного финансирования на уровне 1 млрд долл. США с оценкой в 38 млрд долл. США (данные за 2021 г.). .
Некоторые китайские практикующие больше привыкли называть его «кирпичным заводом».
Мало того, что внешний мир часто сравнивает эти две компании, они также всегда открыто и тайно конкурируют друг с другом.
Самый известный звонок — в 2021 году. В то время, когда Snowflake достигла рыночной стоимости в 100 миллиардов долларов за счет использования облачного хранилища данных, Databricks не могла сидеть на месте и опубликовала статью, в которой говорилось, что ее технология озера данных установила новый рекорд в тесте производительности TPC-DS.
Десять дней спустя Snowflake ответила, опубликовав результаты собственных тестов, заявив при этом, что выводы по сравнению производительности, опубликованные Databricks, неполны, а само исследование было ошибочным.
Основатель Snowflake также подчеркнул, что такие тесты бессмысленны, поскольку публикация результатов тестов баз данных в наше время «превращает обычное техническое общение в маркетинговый трюк, лишенный целостности».
В разговоре с инвестором Мэттом Турком в прошлом году Али Годси, соучредитель и генеральный директор Databricks, не стал уклоняться от разговора о конкуренции со Snowflake.
Сначала он коммерчески хвастался, что у Snowflake «вероятно, лучшее хранилище данных на рынке», и что «Databricks и Snowflake будут сосуществовать примерно у 70% клиентов».
Чтобы добавить сюда, Snowflake в основном использует технологию хранилища данных, а Databricks использует технологию озера данных, что также является основным различием между двумя техническими идеями.
Затем Али Годси продвигал свое собственное озеро данных: «У поставщиков общедоступных облачных вычислений есть стимул побуждать больше людей хранить данные в своих озерах данных… Я думаю, парадигма озера данных победит».
Погоня за производительностью продукта еще не окончена, и теперь Databricks и Snowflake тайно исследуют большую модель.
Databricks выпустила модель большого языка с открытым исходным кодом под названием Dolly (предположительно, в честь Долли, первой клонированной овцы) в марте этого года, заявив, что «за 30 долларов, сервер и три часа мы можем научить Долли начать взаимодействовать с человеческий уровень».
Затем в апреле Databricks выпустила Dolly 2.0, итеративную версию большой языковой модели с открытым исходным кодом.
Snowflake также постоянно продвигает большие модели: в апреле она опубликовала статью, в которой говорилось, что она создает ориентированную на данные платформу для генеративного ИИ и больших языковых моделей, и подробно объясняла, на чем это основано, и какое влияние это окажет.
В мае следующего года Snowflake объявила о приобретении стартапа Neeva, чтобы добавить генеративный поиск на основе ИИ к своей облачной платформе данных.
Интересно, что когда кто-то ищет в Google «конференцию Snowflake», первым результатом является ссылка на конференцию Databricks, за которой следует ссылка Snowflake.
В любом случае, большая битва вот-вот начнется снова. Сейчас нет недостатка в спойлерах в области больших моделей, а когда дело доходит до Databricks и Snowflake, может стать вопрос, кто кого убьет первым.