Великі моделі розривають індустрію баз даних: Databricks і Snowflake дозволяють розробникам вибирати сторону

Текст: Li Hezi Редактор: VickyXiao

Вітер великих моделей неминуче подув до індустрії великих даних, і запах пороху не малий.

Це нещастя наближається. Хтось помітив, що Databricks і Snowflake, два «старі вороги» індустрії великих даних, обидва вибрали найважливіший щорічний саміт, який відбудеться цього року в один і той же час — 26-29 червня.

Це те, чого не було стільки років.

Мало того, вони ще й «одноголосно» наблизили тему цьогорічної конференції до ШІ. Databricks прямо назвав конференцію «Data+AI Summit», а один клік на офіційному веб-сайті — величезне «Generation AI»:

Snowflake також додала чудову характеристику своїй конференції, «найбільшій у світі тематичній конференції щодо даних, додатків та ШІ»:

Це показує що? Це свідчить про те, що дві компанії відверто змушують учасників зробити вибір: якщо ви підете на їхню зустріч, нам може бути пізно прийти знову.

Ви повинні знати, що ці дві компанії, одна в Сан-Франциско, а інша в Лас-Вегасі, займають 9 годин на машині та 1,5 години на літаку. Учасники хочуть мати і рибу, і ведмежу лапу, боюся, що доведеться підкидати.

Наближається наступна велика подія, не тільки збігається час, обидві компанії запросили важливих гостей виступити з основними промовами - Databricks запросила генерального директора Microsoft Сатья Наделла (Satya Nadella), Snowflake - генеральний директор Nvidia Хуан Реньсюнь.

Кожен є босом.

Деякі користувачі мережі нагадали всім, що оскільки саміти двох компаній проходили одночасно, «якщо ви ще не обрали сторону, вам пора обирати».

Звичайно, є також багато людей, які готові бігти з обох сторін. Менеджер із продуктів Striim Джон Кутай планує виступити на обох конференціях, але також «оцінить відстань і час між Лас-Вегасом і Сан-Франциско».

Користувач мережі, який ще не визначився, запитав його, якою буде його промова на Databricks: «Я хочу піти, але мені потрібно буде піти в Сан-Франциско, коли прийде час, на жаль».

З цього приводу одному користувачу мережі навіть приснився обурливий сон: «Мені просто наснилося, що всі заразилися новою короною на конференції Snowflake, тому що Snowflake не хотіла, щоб ми брали участь у саміті Databricks...»

І Snowflake, і Databricks наразі є лідерами аналітичних компаній великих даних. Перший був заснований у 2021 році та став публічним у вересні 2020 року. Ціна акцій зросла на 111,6% у перший день лістингу до 253,93 доларів США, що зробило це найбільше IPO програмного забезпечення в історії Сполучених Штатів.

Крім того, список акціонерів Snowflake також включає відомих інвесторів, таких як Salesforce і Баффет.

Databricks, заснована в 2013 році, зараз є супер-єдинорогом на первинному ринку. У 2021 році вона отримала два послідовні раунди великомасштабного фінансування на рівні 1 мільярда доларів США з оцінкою в 38 мільярдів доларів США (дані за 2021 рік). .

Деякі китайські практики більше звикли називати це «цегельним заводом».

Зовнішній світ не тільки часто порівнює ці дві компанії, але вони також завжди конкурують одна з одною відкрито й таємно.

Найвідоміший дзвінок – 2021 рік. У той час, побачивши, що Snowflake досягла ринкової вартості в 100 мільярдів, покладаючись на хмарне сховище даних, Databricks не могла сидіти на місці й опублікувала статтю, в якій говорилося, що її технологія озера даних встановила новий рекорд у порівняльному тесті TPC-DS.

Справа в тому, що Databricks також висвітлює сторонні дослідження, які показують у 2,5 рази реальну продуктивність Snowflake.

Десять днів потому Snowflake відповіла, оприлюднивши результати власних тестів, водночас заявивши, що висновки порівняння продуктивності, опубліковані Databricks, не були повними, а саме дослідження було помилковим.

Засновник Snowflake також підкреслив, що такі тести безглузді, публікація результатів тестів бази даних у цю епоху «перетворює звичайну технічну комунікацію на маркетинговий трюк, якому бракує цілісності».

Небажаючий Databricks знову відповів, і засновник опублікував блог, цього разу з більш серйозним звинуваченням: Snowflake насправді змінив вхідні дані TPC-DS для результатів тесту.

З тих пір взаємна задуха між двома не припиняється.

У минулорічній розмові з інвестором Меттом Терком Алі Годсі, співзасновник і генеральний директор Databricks, не уникав розмов про конкуренцію зі Snowflake.

Він спочатку комерційно похвалився, що Snowflake має «ймовірно найкраще сховище даних на ринку», і «Databricks і Snowflake співіснуватимуть, можливо, у 70% клієнтів».

Додамо, що Snowflake переважно використовує технологію сховища даних, тоді як Databricks використовує технологію озера даних, що також є головною відмінністю між двома технічними ідеями.

Тоді Алі Ґодсі просував своє власне озеро даних: «Провайдери публічних хмарних обчислень мають стимул спонукати більше людей до зберігання даних у своїх озерах даних... Я думаю, що парадигма озера даних переможе».

Гонитва за продуктивністю продукту ще не закінчена, і тепер Databricks і Snowflake таємно тикають у велику модель.

У березні цього року компанія Databricks випустила велику мовну модель із відкритим вихідним кодом під назвою «Доллі» (імовірно, на честь Доллі, першої клонованої вівці), у якій говориться, що «за 30 доларів, сервер і три години ми можемо навчити Доллі взаємодіяти в будь-який час. людський рівень».

Це, очевидно, спрямовано на продукти з вищим порогом, наприклад ChatGPT, що означає, що штучний інтелект більше не є чимось, що можуть собі дозволити лише великі технологічні компанії.Без великого фінансування будь-хто може розробити штучний інтелект, який справді схожий на людину.

У квітні компанія Databricks випустила Dolly 2.0, ітераційну версію великої мовної моделі з відкритим кодом.

Snowflake також постійно розкручує великі моделі.У квітні вона опублікувала статтю, в якій говориться, що створює орієнтовану на дані платформу для генеративного штучного інтелекту та великих мовних моделей, і детально пояснює основу для цього та вплив, який це матиме.

У травні наступного року Snowflake оголосила про придбання стартапу Neeva, щоб додати генеративний пошук на основі ШІ до своєї хмарної платформи даних.

Хоча дві компанії ще не вступили на територію одна одної з точки зору великих моделей штучного інтелекту, час проведення цього щорічного саміту вже пояснив їхнє ставлення.

Цікаво, що коли хтось шукає "Snowflake conference" у Google, першим результатом є посилання на конференцію Databricks, а потім посилання на Snowflake.

Це еквівалентно тому, що компанія Databricks купила ключові слова конкурентів, щоб продавати власну рекламу.

Ми також виявили, що коли Google шукав «Databricks+Snowflake» одночасно, перші два були рекламою (цей результат відображався динамічно) – Databricks все ще рекламувала свої досягнення на першій позиції в рейтингу ставок, але друга – це постачальник технічних послуг, і він рекламує свою послугу, щоб допомогти клієнтам перейти на Snowflake. Цей запуск навіть цікавіший, ніж дві ситуації з прямими ставками, які хтось виявив раніше. Databricks усе ще можна вважати (з точки зору комерційного наступу) більш агресивним .Сильніша та бойовіша сторона, але в конкуренції між ними деякі постачальники технічних послуг також шукають бізнес-можливостей і, схоже, вважають, що існує більша потреба у переході на Snowflake...

У будь-якому випадку велика битва ось-ось почнеться знову. Зараз спойлерів у сфері великих моделей не бракує, а коли справа доходить до Databricks і Snowflake, то може постати питання, хто кого вб'є першим.

Переглянути оригінал
Контент має виключно довідковий характер і не є запрошенням до участі або пропозицією. Інвестиційні, податкові чи юридичні консультації не надаються. Перегляньте Відмову від відповідальності , щоб дізнатися більше про ризики.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити