Các mô hình lớn xé nát ngành công nghiệp cơ sở dữ liệu: Databricks và Snowflake cho phép các nhà phát triển chọn bên

2023-06-12 02:33:32

Text: Li Hezi Editor: VickyXiao

Làn gió của các mô hình lớn chắc chắn đã thổi đến ngành công nghiệp dữ liệu lớn và mùi thuốc súng không nhỏ.

Điều không vui này đang đến gần, có người để ý rằng Databricks và Snowflake, hai "kẻ thù cũ" của ngành dữ liệu lớn, đều chọn hội nghị thượng đỉnh thường niên quan trọng nhất của mỗi bên sẽ được tổ chức vào cùng thời điểm trong năm nay - 26-29/6.

Đây là điều đã không xảy ra trong rất nhiều năm.

Không chỉ vậy, họ còn “đồng lòng” chuyển chủ đề của hội nghị năm nay đến gần hơn với AI. Databricks đã trực tiếp đặt tên cho hội nghị là "Hội nghị thượng đỉnh về dữ liệu + AI" và một cú nhấp chuột vào trang web chính thức là một "Thế hệ AI" khổng lồ:

Snowflake cũng đã thêm một đóng góp lớn cho hội nghị của mình, "hội nghị về chủ đề AI, ứng dụng và dữ liệu lớn nhất thế giới":

Điều này cho thấy điều gì? Điều đó cho thấy rằng hai công ty đang ngang nhiên ép buộc những người tham gia phải đưa ra lựa chọn: nếu bạn đến cuộc họp của họ, có thể đã quá muộn để chúng tôi quay lại.

Bạn phải biết rằng hai công ty này, một ở San Francisco và một ở Las Vegas, mất 9 giờ đi ô tô và 1,5 giờ đi máy bay. Người tham gia muốn có cả cá lẫn chân gấu, e rằng phải quăng đủ.

Điều quan trọng tiếp theo đang đến, không chỉ thời gian trùng khớp, cả hai công ty đã mời những vị khách quan trọng để có bài phát biểu quan trọng - Databricks đã mời Giám đốc điều hành Microsoft Satya Nadella (Satya Nadella), Snowflake là Giám đốc điều hành của Nvidia Huang Renxun.

Mọi người đều là ông chủ.

Một số cư dân mạng nhắc nhở mọi người rằng vì hội nghị thượng đỉnh của hai công ty được tổ chức cùng một lúc, "nếu bạn chưa chọn một bên, thì đã đến lúc bạn chọn."

Tất nhiên, cũng có nhiều người sẵn sàng chạy theo cả hai phía. Giám đốc sản phẩm Striim John Kutay dự định phát biểu tại cả hai hội nghị, nhưng cũng sẽ "đánh giá khoảng cách và thời gian giữa Las Vegas và San Francisco."

Một cư dân mạng chưa quyết định đã hỏi anh ấy rằng bài phát biểu của anh ấy trên Databricks sẽ như thế nào, “Tôi muốn đi, nhưng tôi phải đến SF khi đến lúc, than ôi.”

Về vấn đề này, một cư dân mạng thậm chí còn có một giấc mơ kỳ quặc: "Tôi chỉ mơ thấy mọi người đều bị nhiễm vương miện mới tại hội nghị Snowflake, bởi vì Snowflake không muốn chúng tôi tham gia hội nghị thượng đỉnh Databricks ..."

Cả Snowflake và Databricks hiện đang dẫn đầu trong các công ty phân tích dữ liệu lớn. Công ty trước đây được thành lập vào năm 2021 và ra mắt công chúng vào tháng 9 năm 2020. Giá cổ phiếu đã tăng 111,6% vào ngày đầu tiên niêm yết, đóng cửa ở mức 253,93 đô la, trở thành đợt IPO phần mềm lớn nhất trong lịch sử Hoa Kỳ.

Ngoài ra, danh sách cổ đông của Snowflake còn có những nhà đầu tư nổi tiếng như Salesforce và Buffett.

Được thành lập vào năm 2013, Databricks hiện là một siêu kỳ lân trên thị trường sơ cấp, trong năm 2021 đã nhận được hai vòng gọi vốn quy mô lớn liên tiếp ở mức 1 tỷ USD, với mức định giá lên tới 38 tỷ USD (dữ liệu năm 2021) .

Một số học viên Trung Quốc quen gọi nó là "nhà máy gạch".

Hai công ty không chỉ thường xuyên bị thế giới bên ngoài so sánh mà còn luôn cạnh tranh với nhau một cách công khai và bí mật.

Cuộc gọi nổi tiếng nhất là vào năm 2021. Vào thời điểm đó, khi chứng kiến Snowflake đạt được giá trị thị trường 100 tỷ nhờ dựa vào kho dữ liệu đám mây, Databricks đã không thể ngồi yên và đăng một bài báo nói rằng công nghệ hồ dữ liệu của họ đã lập kỷ lục mới trong bài kiểm tra điểm chuẩn TPC-DS.

Vấn đề là, Databricks cũng nêu bật các nghiên cứu của bên thứ ba cho thấy hiệu suất thực tế của Snowflake cao gấp 2,5 lần.

Mười ngày sau, Snowflake trả lời, công bố kết quả thử nghiệm của riêng mình, đồng thời tuyên bố rằng kết luận so sánh hiệu suất do Databricks công bố thiếu tính đầy đủ và bản thân nghiên cứu cũng có sai sót.

Người sáng lập Snowflake cũng nhấn mạnh rằng những điểm chuẩn như vậy là vô nghĩa, việc công bố kết quả điểm chuẩn cơ sở dữ liệu trong thời đại này là “biến giao tiếp kỹ thuật thông thường thành một mánh lới tiếp thị thiếu chính trực”.

Databricks không muốn trả lời một lần nữa và người sáng lập đã đăng một blog, lần này với một lời buộc tội nghiêm trọng hơn: Snowflake thực sự đã thay đổi dữ liệu đầu vào của TPC-DS cho kết quả thử nghiệm.

Kể từ đó, sự nghẹn ngào lẫn nhau giữa cả hai không ngừng.

Trong cuộc trò chuyện với nhà đầu tư Matt Turck vào năm ngoái, Ali Ghodsi, đồng sáng lập kiêm CEO của Databricks, đã không ngại nói về sự cạnh tranh với Snowflake.

Lần đầu tiên anh ấy khoe khoang về mặt thương mại rằng Snowflake "có lẽ là kho dữ liệu tốt nhất trên thị trường" và "Databricks và Snowflake sẽ cùng tồn tại trong khoảng 70% khách hàng".

Nói thêm ở đây, Snowflake chủ yếu sử dụng công nghệ kho dữ liệu, trong khi Databricks sử dụng công nghệ hồ dữ liệu, đây cũng là điểm khác biệt chính giữa hai ý tưởng kỹ thuật.

Sau đó, Ali Ghodsi đã quảng bá hồ dữ liệu của riêng mình, "Các nhà cung cấp điện toán đám mây công cộng có động cơ khuyến khích nhiều người hơn lưu trữ dữ liệu trong hồ dữ liệu của họ... Tôi nghĩ mô hình hồ dữ liệu sẽ thắng."

Việc theo đuổi hiệu suất sản phẩm vẫn chưa kết thúc, và giờ đây Databricks và Snowflake đang bí mật chọc vào mô hình lớn.

Databricks đã phát hành một mô hình ngôn ngữ lớn mã nguồn mở có tên là Dolly (được cho là để tỏ lòng kính trọng với Dolly, con cừu nhân bản đầu tiên) vào tháng 3 năm nay, nói rằng "với 30 đô la, một máy chủ và ba giờ, chúng tôi có thể dạy Dolly bắt đầu tương tác tại một cấp độ con người”.

Điều này rõ ràng là nhằm vào các sản phẩm có ngưỡng cao hơn như ChatGPT, điều đó có nghĩa là AI không còn là thứ mà chỉ các công ty công nghệ lớn mới có thể mua được, mà không cần nhiều tài chính, bất kỳ ai cũng có thể phát triển một AI thực sự giống con người.

Databricks sau đó đã phát hành Dolly 2.0, một phiên bản mã nguồn mở lặp lại của mô hình ngôn ngữ lớn, vào tháng Tư.

Snowflake cũng liên tục thổi phồng các mô hình lớn. Nó đã xuất bản một bài báo vào tháng 4 nói rằng họ đang xây dựng một nền tảng tập trung vào dữ liệu cho các mô hình ngôn ngữ lớn và AI tổng quát, đồng thời giải thích chi tiết cơ sở để làm như vậy và tác động mà nó sẽ mang lại.

Tháng 5 năm sau, Snowflake thông báo mua lại công ty khởi nghiệp Neeva để thêm tính năng tìm kiếm tổng quát dựa trên AI vào nền tảng đám mây dữ liệu của mình.

Mặc dù hai công ty chưa bước vào lãnh thổ của nhau về các mô hình lớn AI, nhưng thời gian chồng chéo của hội nghị thượng đỉnh hàng năm này đã giải thích thái độ của họ.

Điều thú vị là khi ai đó tìm kiếm "Snowflake conference" trên Google, kết quả đầu tiên là liên kết hội nghị của Databricks, tiếp theo là của Snowflake.

Điều đó tương đương với việc nói rằng Databricks đã mua từ khóa của đối thủ cạnh tranh để bán quảng cáo của chính họ.

Chúng tôi cũng nhận thấy rằng khi Google tìm kiếm "Databricks+Snowflake" cùng một lúc, hai kết quả đầu tiên là quảng cáo (kết quả này được hiển thị động) - Databricks vẫn quảng cáo thành tích của mình ở vị trí đầu tiên của xếp hạng đấu thầu, nhưng kết quả thứ hai là một nhà cung cấp dịch vụ kỹ thuật và đang quảng bá dịch vụ của mình để giúp khách hàng chuyển sang Snowflake. Lần ra mắt này thậm chí còn thú vị hơn hai tình huống đặt giá thầu trực tiếp mà ai đó đã phát hiện ra trước đó. Databricks vẫn có thể được hiểu là (về mặt tấn công thương mại) tích cực hơn . Bên mạnh hơn và hiếu chiến hơn, nhưng trong cuộc cạnh tranh giữa hai bên, một số nhà cung cấp dịch vụ kỹ thuật cũng đang tìm kiếm cơ hội kinh doanh và dường như cho rằng cần phải chuyển giao cho Snowflake nhiều hơn ...

Trong mọi trường hợp, một trận chiến lớn sắp bắt đầu lại. Bây giờ không thiếu những kẻ phá đám trong lĩnh vực mô hình lớn, khi nói đến Databricks và Snowflake, nó có thể trở thành câu hỏi ai sẽ giết ai trước.

Xem bản gốc

Nội dung chỉ mang tính chất tham khảo, không phải là lời chào mời hay đề nghị. Không cung cấp tư vấn về đầu tư, thuế hoặc pháp lý. Xem Tuyên bố miễn trừ trách nhiệm để biết thêm thông tin về rủi ro.

Phần thưởng
Thích
Bình luận
Chia sẻ

Bình luận

0/400

Không có bình luận

Chủ đề
#BTC#
206622 Trạng thái
#PI#
151870 Trạng thái
#ETH#
130170 Trạng thái
4#GateioInto11#
77244 Trạng thái
5#ContentStar#
64620 Trạng thái
6#BOME#
59484 Trạng thái
7#GT#
58872 Trạng thái
8#DOGE#
54411 Trạng thái
9#MAGA#
51579 Trạng thái
10#SLERF#
50315 Trạng thái

Ghim

sơ đồ trang web