จากนั้น Ali Ghodsi ส่งเสริม data lake ของเขาเอง "ผู้ให้บริการคลาวด์คอมพิวติ้งสาธารณะมีแรงจูงใจที่จะผลักดันให้ผู้คนจัดเก็บข้อมูลใน data lake ของพวกเขามากขึ้น... ฉันคิดว่ากระบวนทัศน์ data lake จะเป็นผู้ชนะ"
เห็นได้ชัดว่าสิ่งนี้มุ่งเป้าไปที่ผลิตภัณฑ์ที่มีเกณฑ์สูงกว่าเช่น ChatGPT ซึ่งหมายความว่า AI จะไม่ใช่สิ่งที่บริษัทเทคโนโลยีขนาดใหญ่เท่านั้นที่จะจ่ายได้อีกต่อไป ใครๆ ก็สามารถพัฒนา AI ที่เหมือนมนุษย์ได้อย่างแท้จริงโดยไม่ต้องใช้เงินทุนมากนัก
Snowflake กำลังเร่งสร้างโมเดลขนาดใหญ่อย่างต่อเนื่อง โดยเผยแพร่บทความในเดือนเมษายน โดยระบุว่ากำลังสร้างแพลตฟอร์มที่มีข้อมูลเป็นศูนย์กลางสำหรับเจเนอเรทีฟ AI และโมเดลภาษาขนาดใหญ่ และอธิบายรายละเอียดพื้นฐานสำหรับการทำเช่นนั้นและผลกระทบที่จะเกิดขึ้น
ในเดือนพฤษภาคมถัดมา Snowflake ประกาศการเข้าซื้อกิจการของสตาร์ทอัพ Neeva เพื่อเพิ่มการค้นหาเชิงกำเนิดโดยใช้ AI ลงในแพลตฟอร์มดาต้าคลาวด์
แม้ว่าทั้งสองบริษัทจะยังไม่ได้ก้าวเข้าสู่ดินแดนของกันและกันในแง่ของแบบจำลองขนาดใหญ่ของ AI แต่ช่วงเวลาที่ทับซ้อนกันของการประชุมสุดยอดประจำปีนี้ได้อธิบายทัศนคติของพวกเขาแล้ว
น่าสนใจ เมื่อมีคนค้นหา "การประชุม Snowflake" บน Google ผลลัพธ์แรกคือลิงก์การประชุมของ Databricks ตามด้วย Snowflake's
โมเดลขนาดใหญ่ฉีกอุตสาหกรรมฐานข้อมูล: Databricks และ Snowflake ให้นักพัฒนาเลือกข้าง
ข้อความ: Li Hezi บรรณาธิการ: VickyXiao
สายลมของโมเดลขนาดใหญ่พัดเข้าหาอุตสาหกรรมบิ๊กดาต้าอย่างหลีกเลี่ยงไม่ได้ และกลิ่นดินปืนก็ไม่น้อยหน้า
ความทุกข์ระทมนี้กำลังใกล้เข้ามา มีคนสังเกตว่า Databricks และ Snowflake สอง "ศัตรูเก่า" ของอุตสาหกรรม Big Data ทั้งคู่เลือกการประชุมสุดยอดประจำปีที่สำคัญที่สุดของแต่ละคนที่จะจัดขึ้นพร้อมกันในปีนี้คือวันที่ 26-29 มิถุนายน
นี่คือสิ่งที่ไม่ได้เกิดขึ้นมาหลายปีแล้ว
ไม่เพียงแค่นั้น พวกเขายัง "เป็นเอกฉันท์" ที่เปลี่ยนธีมของการประชุมปีนี้ให้เข้าใกล้ AI มากขึ้น Databricks ตั้งชื่อการประชุมโดยตรงว่า "Data+AI Summit" และเพียงคลิกเดียวบนเว็บไซต์ทางการก็เป็น "Generation AI" ขนาดใหญ่:
คุณต้องรู้ว่าทั้งสองบริษัทนี้ หนึ่งแห่งในซานฟรานซิสโกและอีกแห่งในลาสเวกัส ใช้เวลาเดินทางโดยรถยนต์ 9 ชั่วโมงและ 1.5 ชั่วโมงโดยเครื่องบิน ผู้เข้าร่วมต้องการทั้งปลาและตีนหมีฉันเกรงว่าจะต้องโยนพอ
เรื่องใหญ่เรื่องต่อไปกำลังจะมาถึง ไม่เพียงแต่เวลาตรงกันเท่านั้น ทั้งสองบริษัทได้เชิญแขกคนสำคัญมากล่าวสุนทรพจน์ - Databricks เชิญ Satya Nadella ซีอีโอของ Microsoft (Satya Nadella) และ Snowflake เป็น CEO ของ Nvidia Huang Renxun
ทุกคนเป็นเจ้านาย
ชาวเน็ตบางคนเตือนทุกคนว่าเนื่องจากการประชุมสุดยอดของทั้งสองบริษัทจัดขึ้นพร้อมกัน "ถ้าคุณยังไม่ได้เลือกข้าง ก็ถึงเวลาที่คุณต้องเลือก"
ชาวเน็ตที่ตัดสินใจไม่ถูกถามเขาว่าสุนทรพจน์ของเขาใน Databricks จะเป็นอย่างไร “ฉันอยากไป แต่ฉันต้องไป SF เมื่อถึงเวลา อนิจจา”
นอกจากนี้ รายชื่อผู้ถือหุ้นของ Snowflake ยังรวมถึงนักลงทุนที่มีชื่อเสียง เช่น Salesforce และ Buffett
Databricks ก่อตั้งขึ้นในปี 2556 ปัจจุบันเป็นซุปเปอร์ยูนิคอร์นในตลาดหลัก ในปี 2564 ได้รับการระดมทุนขนาดใหญ่ 2 รอบติดต่อกันที่ระดับ 1 พันล้านดอลลาร์สหรัฐโดยมีมูลค่าสูงถึง 38 พันล้านดอลลาร์สหรัฐ (ข้อมูลปี 2564) .
ผู้ปฏิบัติงานชาวจีนบางคนคุ้นเคยกับการเรียกที่นี่ว่า "โรงอิฐ" มากกว่า
ไม่เพียงแต่ทั้งสองบริษัทจะถูกเปรียบเทียบกันโดยโลกภายนอกเท่านั้น แต่พวกเขายังแข่งขันกันเองอย่างเปิดเผยและเป็นความลับอยู่เสมอ
การโทรที่โด่งดังที่สุดคือในปี 2564 ในเวลานั้น เมื่อเห็นว่า Snowflake มีมูลค่าตลาดถึง 100 พันล้านโดยอาศัยคลังข้อมูลบนคลาวด์ Databricks จึงไม่สามารถนิ่งเฉยได้ และตีพิมพ์บทความที่ระบุว่าเทคโนโลยี data lake สร้างสถิติใหม่ในการทดสอบเกณฑ์มาตรฐาน TPC-DS
สิบวันต่อมา Snowflake ตอบโดยเปิดเผยผลการทดสอบของตัวเอง ในขณะที่อ้างว่าข้อสรุปการเปรียบเทียบประสิทธิภาพที่เผยแพร่โดย Databricks ขาดความสมบูรณ์ และการวิจัยเองก็มีข้อบกพร่อง
ผู้ก่อตั้ง Snowflake ยังย้ำว่าเกณฑ์มาตรฐานดังกล่าวไม่มีความหมาย การเผยแพร่ผลเกณฑ์มาตรฐานฐานข้อมูลในยุคนี้คือ "เปลี่ยนการสื่อสารทางเทคนิคธรรมดาให้กลายเป็นกลไกทางการตลาดที่ขาดความสมบูรณ์"
ในการสนทนากับนักลงทุน Matt Turck เมื่อปีที่แล้ว Ali Ghodsi ผู้ร่วมก่อตั้งและซีอีโอของ Databricks ไม่อายที่จะพูดถึงการแข่งขันกับ Snowflake
เขาโอ้อวดในเชิงพาณิชย์เป็นครั้งแรกว่า Snowflake มี "น่าจะเป็นคลังข้อมูลที่ดีที่สุดในตลาด" และ "Databricks และ Snowflake จะอยู่ร่วมกันในลูกค้าประมาณ 70%"
หากต้องการเพิ่มที่นี่ Snowflake ใช้เทคโนโลยีคลังข้อมูลเป็นหลัก ในขณะที่ Databricks ใช้เทคโนโลยีดาต้าเลค ซึ่งเป็นความแตกต่างหลักระหว่างแนวคิดทางเทคนิคทั้งสอง
จากนั้น Ali Ghodsi ส่งเสริม data lake ของเขาเอง "ผู้ให้บริการคลาวด์คอมพิวติ้งสาธารณะมีแรงจูงใจที่จะผลักดันให้ผู้คนจัดเก็บข้อมูลใน data lake ของพวกเขามากขึ้น... ฉันคิดว่ากระบวนทัศน์ data lake จะเป็นผู้ชนะ"
การแสวงหาประสิทธิภาพของผลิตภัณฑ์ยังไม่สิ้นสุด และตอนนี้ Databricks และ Snowflake กำลังแอบแหย่รุ่นใหญ่
Databricks เปิดตัวโมเดลภาษาโอเพ่นซอร์สขนาดใหญ่ชื่อ Dolly (ซึ่งคาดว่าจะเป็นการแสดงความเคารพต่อ Dolly แกะโคลนตัวแรก) ในเดือนมีนาคมปีนี้ โดยกล่าวว่า "ในราคา $30 เซิร์ฟเวอร์ และสามชั่วโมง เราสามารถสอนให้ Dolly เริ่มโต้ตอบได้ที่ ระดับมนุษย์"
จากนั้น Databricks ได้เปิดตัว Dolly 2.0 ซึ่งเป็นเวอร์ชันโอเพ่นซอร์สซ้ำของโมเดลภาษาขนาดใหญ่ในเดือนเมษายน
Snowflake กำลังเร่งสร้างโมเดลขนาดใหญ่อย่างต่อเนื่อง โดยเผยแพร่บทความในเดือนเมษายน โดยระบุว่ากำลังสร้างแพลตฟอร์มที่มีข้อมูลเป็นศูนย์กลางสำหรับเจเนอเรทีฟ AI และโมเดลภาษาขนาดใหญ่ และอธิบายรายละเอียดพื้นฐานสำหรับการทำเช่นนั้นและผลกระทบที่จะเกิดขึ้น
ในเดือนพฤษภาคมถัดมา Snowflake ประกาศการเข้าซื้อกิจการของสตาร์ทอัพ Neeva เพื่อเพิ่มการค้นหาเชิงกำเนิดโดยใช้ AI ลงในแพลตฟอร์มดาต้าคลาวด์
น่าสนใจ เมื่อมีคนค้นหา "การประชุม Snowflake" บน Google ผลลัพธ์แรกคือลิงก์การประชุมของ Databricks ตามด้วย Snowflake's
ไม่ว่าในกรณีใด การต่อสู้ครั้งใหญ่กำลังจะเริ่มขึ้นอีกครั้ง ตอนนี้ไม่ขาดแคลนสปอยเลอร์ในด้านโมเดลขนาดใหญ่ เมื่อพูดถึง Databricks และ Snowflake อาจกลายเป็นคำถามว่าใครจะฆ่าใครก่อน