文: Li Hezi 編集者: VickyXiaoビッグデータ業界にも必然的に大型モデルの風が吹き、火薬の匂いも少なくない。ビッグデータ業界の 2 つの「宿敵」である Databricks と Snowflake が、それぞれの最も重要な年次サミットを今年 6 月 26 日から 29 日の同時期に開催することを選択したことに誰かが気づきました。これはもう何年も起きていないことだ。それだけでなく、彼らは「満場一致で」今年のカンファレンスのテーマをAIに近づけることにしました。 Databricks はこのカンファレンスを直接「Data+AI Summit」と名付けました。公式 Web サイトでワンクリックすると、巨大な「Generation AI」が表示されます。 Snowflake はまた、そのカンファレンス「世界最大のデータ、アプリ、AI をテーマにしたカンファレンス」に素晴らしい賛辞を追加しました。 これは何を示していますか?これは、両社があからさまに参加者に選択を迫っていることを示している。もしあなたが彼らの会議に行ったら、我々が再び来るには手遅れになるかもしれない。これら 2 つの会社、1 つはサンフランシスコにあり、もう 1 つはラスベガスにあり、車で 9 時間、飛行機で 1.5 時間かかることを知っておく必要があります。参加者は魚と熊の足の両方を食べたいと思っていますが、十分に投げ合う必要があるのではないかと心配しています。次の大きな出来事は、時期が一致するだけでなく、両社が基調講演に重要なゲストを招待しました - Databricks は Microsoft CEO の Satya Nadella (Satya Nadella) を招待し、Snowflake は Nvidia の CEO である Huang Renxun を招待しました。誰もが上司です。一部のネチズンは、両社の首脳会談が同時に開催されたため、「まだどちらの側を選ぶかが決まっていないのなら、今が選ぶ時期だ」と注意を促した。 もちろん、両側を走る準備ができている人もたくさんいます。 Striim プロダクト マネージャーの John Kutay 氏は、両方のカンファレンスで講演する予定ですが、「ラスベガスとサンフランシスコの間の距離と時間についても評価する」予定です。決意が固まっていなかったネチズンは、Databricks でのスピーチはどうなるのかと彼に尋ね、「行きたいけど、時間が来たらサンフランシスコに行かなきゃいけないんだ、残念だ」と答えた。 これに関して、あるネチズンはとんでもない夢を見ました。「スノーフレークのカンファレンスで全員が新しいクラウンに感染する夢を見たんです。スノーフレークは私たちがデータブリックスサミットに参加することを望んでいなかったので...」 Snowflake と Databricks はどちらも現在、ビッグデータ分析企業のリーダーです。前者は2021年に設立され、2020年9月に上場した。株価は上場初日に111.6%急騰し、253.93ドルで取引を終え、米国史上最大のソフトウェアIPOとなった。さらに、Snowflake の株主リストには、Salesforce やバフェットなどの著名な投資家も含まれています。2013 年に設立された Databricks は現在、プライマリー市場におけるスーパー ユニコーンであり、2021 年には 2 ラウンド連続で 10 億米ドル規模の大規模資金調達を受けており、評価額は 380 億米ドルに達しています (2021 年のデータ) 。中国の開業医の中には、それを「レンガ工場」と呼ぶことに慣れている人もいます。両社は外の世界からよく比較されるだけでなく、常に公然と、そして秘密裏に互いに競争しています。最も有名な呼び出しは 2021 年です。当時、Snowflake がクラウド データ ウェアハウスに依存して市場価値 1,000 億を達成したのを見て、Databricks は黙っていられず、同社のデータ レイク テクノロジーが TPC-DS ベンチマーク テストで新記録を樹立したという記事を発表しました。 重要なのは、Databricks は、Snowflake の実際のパフォーマンスが最大 2.5 倍であることを示すサードパーティの調査も強調していることです。10日後、Snowflakeはこれに応じ、独自のテスト結果を公表したが、Databricksが公表したパフォーマンス比較の結論は完全性を欠き、研究自体に欠陥があると主張した。Snowflakeの創設者はまた、そのようなベンチマークは無意味であると強調し、この時代にデータベースのベンチマーク結果を公開することは「通常の技術コミュニケーションを誠実さを欠いたマーケティングの仕掛けに変える」ことになると述べた。 不本意な Databricks は再び反応し、創設者は今度はより深刻な告発をブログに投稿しました。Snowflake が実際にテスト結果の TPC-DS の入力データを変更したというものでした。 それ以来、二人のお互いの息苦しさは止まらなかった。Databricks の共同創設者兼 CEO である Ali Ghodsi は、昨年の投資家マット・タークとの会話の中で、Snowflake との競争について躊躇しませんでした。同氏は最初に商業的に、Snowflakeは「おそらく市場で最高のデータウェアハウス」であり、「DatabricksとSnowflakeはおそらく顧客の70%で共存するだろう」と自慢した。ここで付け加えておきますが、Snowflake は主にデータ ウェアハウス テクノロジーを使用するのに対し、Databricks はデータ レイク テクノロジーを使用します。これが 2 つの技術思想の主な違いでもあります。次に、Ali Ghodsi 氏は、自身のデータ レイクを宣伝し、「パブリック クラウド コンピューティング プロバイダーには、より多くの人にデータ レイクへのデータの保存を促すインセンティブがあります。データ レイク パラダイムが勝つと思います。」と述べました。製品のパフォーマンスの追求はまだ終わっておらず、現在 Databricks と Snowflake が密かにこのビッグモデルを狙っています。Databricks は今年 3 月に、Dolly と呼ばれるオープンソースの大規模言語モデル (おそらく最初のクローン羊である Dolly に敬意を表したもの) をリリースし、「30 ドルとサーバーと 3 時間で、Dolly に対話の開始を教えることができる」と述べました。人間のレベル」。 これは明らかに ChatGPT のような敷居の高い製品を狙ったものであり、AI はもはや大手テクノロジー企業だけが買えるものではなく、多額の資金を必要とせずに誰でも真に人間に近い AI を開発できるようになるということを意味します。その後、Databricks は、大規模言語モデルのオープンソース反復バージョンである Dolly 2.0 を 4 月にリリースしました。Snowflake も常に大規模モデルを宣伝しており、4 月には生成 AI と大規模言語モデルのためのデータ中心のプラットフォームを構築しているとの記事を発表し、その根拠とそれがもたらす影響について詳しく説明しました。翌年 5 月、Snowflake は、自社のデータ クラウド プラットフォームに AI ベースの生成検索を追加するためにスタートアップ Neeva を買収すると発表しました。 両社はAIの大型モデルに関してはまだお互いの領域に踏み込んでいないが、この年次サミットのタイミングが重なったことで、両社の姿勢はすでに明らかになっている。興味深いことに、誰かが Google で「Snowflake カンファレンス」を検索すると、最初の結果は Databricks のカンファレンス リンクであり、次に Snowflake のカンファレンス リンクが表示されます。 これは、Databricks が自社の広告を販売するために競合他社のキーワードを購入したと言うのと同じです。 また、Google が「Databricks+Snowflake」を同時に検索した場合、最初の 2 つは広告であったこともわかりました (この結果は動的に表示されました)。Databricks は依然として入札ランキングの 1 位でその成果を宣伝していましたが、2 番目は広告でした。テクニカル サービス プロバイダーであり、顧客の Snowflake への移行を支援するサービスを宣伝しています。この立ち上げは、誰かが以前に発見した 2 つの直接入札状況よりもさらに興味深いです。Databricks は、依然として (商業攻撃の観点から) より攻撃的であると解釈できます。より強力で好戦的な側ですが、この 2 つの競争の中で、一部の技術サービス プロバイダーもビジネス チャンスを求めており、Snowflake への移行の必要性がより高いと考えているようです...いずれにせよ、また大きな戦いが始まろうとしている。大型モデルの分野ではネタバレが絶えませんが、Databricks と Snowflake に関しては、どちらが先に誰を殺すかという問題になるかもしれません。
ビッグモデルがデータベース業界を引き裂く: Databricks と Snowflake により開発者はどちらの側につくかを選択できる
文: Li Hezi 編集者: VickyXiao
ビッグデータ業界にも必然的に大型モデルの風が吹き、火薬の匂いも少なくない。
ビッグデータ業界の 2 つの「宿敵」である Databricks と Snowflake が、それぞれの最も重要な年次サミットを今年 6 月 26 日から 29 日の同時期に開催することを選択したことに誰かが気づきました。
これはもう何年も起きていないことだ。
それだけでなく、彼らは「満場一致で」今年のカンファレンスのテーマをAIに近づけることにしました。 Databricks はこのカンファレンスを直接「Data+AI Summit」と名付けました。公式 Web サイトでワンクリックすると、巨大な「Generation AI」が表示されます。
これら 2 つの会社、1 つはサンフランシスコにあり、もう 1 つはラスベガスにあり、車で 9 時間、飛行機で 1.5 時間かかることを知っておく必要があります。参加者は魚と熊の足の両方を食べたいと思っていますが、十分に投げ合う必要があるのではないかと心配しています。
次の大きな出来事は、時期が一致するだけでなく、両社が基調講演に重要なゲストを招待しました - Databricks は Microsoft CEO の Satya Nadella (Satya Nadella) を招待し、Snowflake は Nvidia の CEO である Huang Renxun を招待しました。
誰もが上司です。
一部のネチズンは、両社の首脳会談が同時に開催されたため、「まだどちらの側を選ぶかが決まっていないのなら、今が選ぶ時期だ」と注意を促した。
決意が固まっていなかったネチズンは、Databricks でのスピーチはどうなるのかと彼に尋ね、「行きたいけど、時間が来たらサンフランシスコに行かなきゃいけないんだ、残念だ」と答えた。
さらに、Snowflake の株主リストには、Salesforce やバフェットなどの著名な投資家も含まれています。
2013 年に設立された Databricks は現在、プライマリー市場におけるスーパー ユニコーンであり、2021 年には 2 ラウンド連続で 10 億米ドル規模の大規模資金調達を受けており、評価額は 380 億米ドルに達しています (2021 年のデータ) 。
中国の開業医の中には、それを「レンガ工場」と呼ぶことに慣れている人もいます。
両社は外の世界からよく比較されるだけでなく、常に公然と、そして秘密裏に互いに競争しています。
最も有名な呼び出しは 2021 年です。当時、Snowflake がクラウド データ ウェアハウスに依存して市場価値 1,000 億を達成したのを見て、Databricks は黙っていられず、同社のデータ レイク テクノロジーが TPC-DS ベンチマーク テストで新記録を樹立したという記事を発表しました。
10日後、Snowflakeはこれに応じ、独自のテスト結果を公表したが、Databricksが公表したパフォーマンス比較の結論は完全性を欠き、研究自体に欠陥があると主張した。
Snowflakeの創設者はまた、そのようなベンチマークは無意味であると強調し、この時代にデータベースのベンチマーク結果を公開することは「通常の技術コミュニケーションを誠実さを欠いたマーケティングの仕掛けに変える」ことになると述べた。
Databricks の共同創設者兼 CEO である Ali Ghodsi は、昨年の投資家マット・タークとの会話の中で、Snowflake との競争について躊躇しませんでした。
同氏は最初に商業的に、Snowflakeは「おそらく市場で最高のデータウェアハウス」であり、「DatabricksとSnowflakeはおそらく顧客の70%で共存するだろう」と自慢した。
ここで付け加えておきますが、Snowflake は主にデータ ウェアハウス テクノロジーを使用するのに対し、Databricks はデータ レイク テクノロジーを使用します。これが 2 つの技術思想の主な違いでもあります。
次に、Ali Ghodsi 氏は、自身のデータ レイクを宣伝し、「パブリック クラウド コンピューティング プロバイダーには、より多くの人にデータ レイクへのデータの保存を促すインセンティブがあります。データ レイク パラダイムが勝つと思います。」と述べました。
製品のパフォーマンスの追求はまだ終わっておらず、現在 Databricks と Snowflake が密かにこのビッグモデルを狙っています。
Databricks は今年 3 月に、Dolly と呼ばれるオープンソースの大規模言語モデル (おそらく最初のクローン羊である Dolly に敬意を表したもの) をリリースし、「30 ドルとサーバーと 3 時間で、Dolly に対話の開始を教えることができる」と述べました。人間のレベル」。
その後、Databricks は、大規模言語モデルのオープンソース反復バージョンである Dolly 2.0 を 4 月にリリースしました。
Snowflake も常に大規模モデルを宣伝しており、4 月には生成 AI と大規模言語モデルのためのデータ中心のプラットフォームを構築しているとの記事を発表し、その根拠とそれがもたらす影響について詳しく説明しました。
翌年 5 月、Snowflake は、自社のデータ クラウド プラットフォームに AI ベースの生成検索を追加するためにスタートアップ Neeva を買収すると発表しました。
興味深いことに、誰かが Google で「Snowflake カンファレンス」を検索すると、最初の結果は Databricks のカンファレンス リンクであり、次に Snowflake のカンファレンス リンクが表示されます。
いずれにせよ、また大きな戦いが始まろうとしている。大型モデルの分野ではネタバレが絶えませんが、Databricks と Snowflake に関しては、どちらが先に誰を殺すかという問題になるかもしれません。