大模型讓數據庫行業撕起來了:Databricks和Snowflake讓開發者選邊站

文:李禾子編輯:VickyXiao

大模型的風已經不可避免地刮到了大數據行業,火藥味還不小。

這不快臨近了有人注意到,兩家大數據行業的“宿敵”Databricks和Snowflake,今年雙雙把各自一年一度最重要的峰會選在了同一時段——6月26日-29日舉辦。

這可是這麼多年來都沒有過的事。

不僅如此,他們還“不約而同”把今年大會的主題都往AI靠攏了。 Databricks直接給大會取名叫“Data+AI Summit”,官網一點進去就是一個碩大的“Generation AI”:

Snowflake也給自己的大會加了一個很牛的定語,“全球最大的數據、App和AI主題大會”:

這說明了什麼?說明兩家公司在明目張膽逼著參會者們做選擇:你要去了他們的會,再來我們這恐怕是來不及了。

要知道這倆公司,一個在舊金山,一個在拉斯維加斯,自駕要9個小時,飛機也得飛1個半小時。參會者想兼得魚和熊掌,怕不是要折騰個夠嗆。

下面重頭戲來了,不僅時間重合,兩家公司都各自請到了重磅嘉賓來發表主題演講——Databricks請到的是微軟的CEO薩蒂亞·納德拉(Satya Nadella),Snowflake則是英偉達CEO黃仁勳。

個個都是大佬。

有網友提醒大家,鑑於兩家公司的峰會在同一時間舉辦,“如果你還沒選邊站,那麼現在該你選擇的時候到了”。

當然也有不乏準備兩邊跑的人。 Striim公司的產品經理John Kutay就計劃在兩個大會上分別發表講話,不過也“將評估拉斯維加斯和舊金山兩地的路程和時間”。

有還沒做好決定的網友問他在Databricks上的發言內容會是啥,“我想去,但是到時候還得趕去SF,唉。”

對此,甚至還有個網友做了個離譜的夢,“剛剛夢到所有人都在Snowflake的大會上感染新冠了,因為Snowflake不想讓我們參加Databricks的峰會……”

Snowflake和Databricks都是目前大數據分析公司中的佼佼者。前者於2021年創辦,並在2020年9月上市,上市首日收盤股價飆升111.6%,報253.93美元,成為美國有史以來規模最大的軟件IPO。

此外,Snowflake的股東名單裡還不乏Salesforce和巴菲特這樣大名鼎鼎的投資方。

創辦於2013年的Databricks則是目前一級市場中的超級獨角獸,曾在2021年連續獲得兩輪10億美元級別的大額融資,估值高達380億美元(2021年數據)。

一些中國從業者也更習慣叫它“磚廠”。

兩家公司不僅經常被外界拿來做比較,彼此之間也總是明著暗著各種較勁。

最著名的一次喊話是在2021年。當時眼看著Snowflake靠著雲數據倉庫就做到了千億市值,Databricks坐不住了,發了一篇文章稱其數據湖技術創下了TPC-DS基準測試新記錄。

重點是,Databricks還強調了第三方研究表明其實際性能可達Snowflake的2.5倍。

接著過了十天,Snowflake做出回應,發布了自己的測試結果,同時稱Databricks公佈的性能比較結論缺乏完整性,而且研究本身也存在缺陷。

Snowflake創始人還強調這種基準測試沒什麼意義,在這個年代發布數據庫基準測試結果是“將正常的技術交流變成了缺乏完整性的營銷噱頭”。

不甘心的Databricks再次回應,創始人發了一篇博客,這次是更嚴重的指控:Snowflake為了測試結果竟然改了TPC-DS的輸入數據。

從那之後,兩家之間的互嗆就沒有停過。

在去年和投資人Matt Turck的一次對話中,Databricks的聯合創始人兼CEO Ali Ghodsi還不避諱地談到了與Snowflake的競爭。

他先是商業性地誇了下Snowflake有著“可能是市場上最好的數據倉庫”,並且“Databricks與Snowflake將共存於可能70%的客戶中”。

這裡補充一點,Snowflake主要用的是數據倉庫技術,Databricks用的則是數據湖技術,這也是兩家技術思路最主要的不同。

接著Ali Ghodsi就宣傳起了自家的數據湖,“公有云計算供應商有動力推動更多人把數據存到他們的數據湖中……我認為數據湖的範式將獲勝。”

產品性能上的你追我趕還沒完,現在Databricks和Snowflake又暗戳戳在大模型上較上勁了。

Databricks在今年3月發布了一個名叫Dolly(據說是為了向第一隻克隆羊多莉致敬)的開源大語言模型,稱“只需30美元、一台服務器和三個小時,我們就能教Dolly開始進行人類級別的交互”。

這明擺著也是在針對ChatGPT這樣門檻更高的產品,意思就是AI不再是只有大型科技公司才能負擔得起的東西,不用拿多少融資,任何人都能開發出一個真正像人類的AI。

Databricks接著又在4月發布了該大語言模型的開源迭代版本Dolly 2.0。

Snowflake這邊也在不斷炒作大模型,在4月發布文章稱正在為生成式AI和大語言模型搭建一個以數據為中心的平台,並在文中詳細解讀了這麼做的依據和將帶來的影響。

隨後的5月,Snowflake宣布收購初創公司Neeva,以在其數據云平台中添加基於AI的生成搜索。

雖然在AI大模型方面兩家公司還沒有互踏進對方的領地,不過這次年度峰會舉辦時間的重疊已經說明了他們的態度。

有趣的是,有人在谷歌搜索“Snowflake conference”,出來的第一個結果卻是Databricks家的大會鏈接,其次才是Snowflake的。

就等於說,Databricks買了競爭對手的關鍵字,來賣自己的廣告。

我們也發現,在谷歌同時輸入“Databricks+Snowflake”搜索,前兩條都是廣告(這個結果是動態展示的)——Databricks依然在競價排名的第一位置宣傳著自己取得的成績,但第二則是一家技術服務商,在宣傳自己幫客戶遷移到Snowflake的服務,這個投放甚至比前面有人發現的兩家直接競價的情況更有意思,Databricks依然可以被解讀為(在商業攻勢上)進攻性更強、更有戰鬥力的一方,但在兩家的競爭中一些技術服務商也在抓緊尋找商機,而且似乎更認為轉移到Snowflake的需求更大…

不論如何,一場大戰又要打響了。現在大模型領域不缺攪局者,到了Databricks和Snowflake這裡,興許就成了誰先乾掉誰的問題。

查看原文
本頁面內容僅供參考,非招攬或要約,也不提供投資、稅務或法律諮詢。詳見聲明了解更多風險披露。
  • 讚賞
  • 留言
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate.io APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)