โมเดลขนาดใหญ่ฉีกอุตสาหกรรมฐานข้อมูล: Databricks และ Snowflake ให้นักพัฒนาเลือกข้าง

ข้อความ: Li Hezi บรรณาธิการ: VickyXiao

สายลมของโมเดลขนาดใหญ่พัดเข้าหาอุตสาหกรรมบิ๊กดาต้าอย่างหลีกเลี่ยงไม่ได้ และกลิ่นดินปืนก็ไม่น้อยหน้า

ความทุกข์ระทมนี้กำลังใกล้เข้ามา มีคนสังเกตว่า Databricks และ Snowflake สอง "ศัตรูเก่า" ของอุตสาหกรรม Big Data ทั้งคู่เลือกการประชุมสุดยอดประจำปีที่สำคัญที่สุดของแต่ละคนที่จะจัดขึ้นพร้อมกันในปีนี้คือวันที่ 26-29 มิถุนายน

นี่คือสิ่งที่ไม่ได้เกิดขึ้นมาหลายปีแล้ว

ไม่เพียงแค่นั้น พวกเขายัง "เป็นเอกฉันท์" ที่เปลี่ยนธีมของการประชุมปีนี้ให้เข้าใกล้ AI มากขึ้น Databricks ตั้งชื่อการประชุมโดยตรงว่า "Data+AI Summit" และเพียงคลิกเดียวบนเว็บไซต์ทางการก็เป็น "Generation AI" ขนาดใหญ่:

Snowflake ยังเพิ่มคุณสมบัติที่ยอดเยี่ยมให้กับการประชุม "การประชุมธีมข้อมูลแอพและ AI ที่ใหญ่ที่สุดในโลก":

นี่แสดงว่าอะไร? แสดงให้เห็นว่าทั้งสองบริษัทกำลังบังคับให้ผู้เข้าร่วมเลือกอย่างโจ่งแจ้ง: ถ้าคุณไปประชุมของพวกเขา อาจสายเกินไปที่เราจะมาอีกครั้ง

คุณต้องรู้ว่าทั้งสองบริษัทนี้ หนึ่งแห่งในซานฟรานซิสโกและอีกแห่งในลาสเวกัส ใช้เวลาเดินทางโดยรถยนต์ 9 ชั่วโมงและ 1.5 ชั่วโมงโดยเครื่องบิน ผู้เข้าร่วมต้องการทั้งปลาและตีนหมีฉันเกรงว่าจะต้องโยนพอ

เรื่องใหญ่เรื่องต่อไปกำลังจะมาถึง ไม่เพียงแต่เวลาตรงกันเท่านั้น ทั้งสองบริษัทได้เชิญแขกคนสำคัญมากล่าวสุนทรพจน์ - Databricks เชิญ Satya Nadella ซีอีโอของ Microsoft (Satya Nadella) และ Snowflake เป็น CEO ของ Nvidia Huang Renxun

ทุกคนเป็นเจ้านาย

ชาวเน็ตบางคนเตือนทุกคนว่าเนื่องจากการประชุมสุดยอดของทั้งสองบริษัทจัดขึ้นพร้อมกัน "ถ้าคุณยังไม่ได้เลือกข้าง ก็ถึงเวลาที่คุณต้องเลือก"

แน่นอนว่ายังมีอีกหลายคนที่พร้อมจะวิ่งตามทั้งสองฝ่าย John Kutay ผู้จัดการผลิตภัณฑ์ Striim วางแผนที่จะพูดในการประชุมทั้งสอง แต่จะ "ประเมินระยะทางและเวลาระหว่างลาสเวกัสและซานฟรานซิสโกด้วย"

ชาวเน็ตที่ตัดสินใจไม่ถูกถามเขาว่าสุนทรพจน์ของเขาใน Databricks จะเป็นอย่างไร “ฉันอยากไป แต่ฉันต้องไป SF เมื่อถึงเวลา อนิจจา”

ในเรื่องนี้ ชาวเน็ตคนหนึ่งถึงกับฝันร้ายว่า "ฉันแค่ฝันว่าทุกคนติดเชื้อมงกุฎใหม่ในการประชุม Snowflake เพราะ Snowflake ไม่ต้องการให้เราเข้าร่วมการประชุมสุดยอด Databricks..."

ปัจจุบันทั้ง Snowflake และ Databricks เป็นผู้นำในบริษัทวิเคราะห์ข้อมูลขนาดใหญ่ อดีตก่อตั้งขึ้นในปี 2564 และเปิดตัวในเดือนกันยายน 2563 ราคาหุ้นพุ่งขึ้น 111.6% ในวันแรกของการเข้าจดทะเบียนปิดที่ 253.93 ดอลลาร์ ทำให้เป็นการเสนอขายซอฟต์แวร์ IPO ที่ใหญ่ที่สุดในประวัติศาสตร์ของสหรัฐอเมริกา

นอกจากนี้ รายชื่อผู้ถือหุ้นของ Snowflake ยังรวมถึงนักลงทุนที่มีชื่อเสียง เช่น Salesforce และ Buffett

Databricks ก่อตั้งขึ้นในปี 2556 ปัจจุบันเป็นซุปเปอร์ยูนิคอร์นในตลาดหลัก ในปี 2564 ได้รับการระดมทุนขนาดใหญ่ 2 รอบติดต่อกันที่ระดับ 1 พันล้านดอลลาร์สหรัฐโดยมีมูลค่าสูงถึง 38 พันล้านดอลลาร์สหรัฐ (ข้อมูลปี 2564) .

ผู้ปฏิบัติงานชาวจีนบางคนคุ้นเคยกับการเรียกที่นี่ว่า "โรงอิฐ" มากกว่า

ไม่เพียงแต่ทั้งสองบริษัทจะถูกเปรียบเทียบกันโดยโลกภายนอกเท่านั้น แต่พวกเขายังแข่งขันกันเองอย่างเปิดเผยและเป็นความลับอยู่เสมอ

การโทรที่โด่งดังที่สุดคือในปี 2564 ในเวลานั้น เมื่อเห็นว่า Snowflake มีมูลค่าตลาดถึง 100 พันล้านโดยอาศัยคลังข้อมูลบนคลาวด์ Databricks จึงไม่สามารถนิ่งเฉยได้ และตีพิมพ์บทความที่ระบุว่าเทคโนโลยี data lake สร้างสถิติใหม่ในการทดสอบเกณฑ์มาตรฐาน TPC-DS

ประเด็นก็คือ Databricks ยังเน้นการศึกษาของบุคคลที่สามซึ่งแสดงประสิทธิภาพที่แท้จริงของ Snowflake ถึง 2.5 เท่า

สิบวันต่อมา Snowflake ตอบโดยเปิดเผยผลการทดสอบของตัวเอง ในขณะที่อ้างว่าข้อสรุปการเปรียบเทียบประสิทธิภาพที่เผยแพร่โดย Databricks ขาดความสมบูรณ์ และการวิจัยเองก็มีข้อบกพร่อง

ผู้ก่อตั้ง Snowflake ยังย้ำว่าเกณฑ์มาตรฐานดังกล่าวไม่มีความหมาย การเผยแพร่ผลเกณฑ์มาตรฐานฐานข้อมูลในยุคนี้คือ "เปลี่ยนการสื่อสารทางเทคนิคธรรมดาให้กลายเป็นกลไกทางการตลาดที่ขาดความสมบูรณ์"

Databricks ที่ไม่เต็มใจตอบโต้อีกครั้ง และผู้ก่อตั้งโพสต์บล็อก คราวนี้ด้วยข้อกล่าวหาที่ร้ายแรงกว่า: Snowflake เปลี่ยนข้อมูลอินพุตของ TPC-DS สำหรับผลการทดสอบ

ตั้งแต่นั้นมา การสำลักซึ่งกันและกันระหว่างทั้งสองก็ยังไม่หยุดลง

ในการสนทนากับนักลงทุน Matt Turck เมื่อปีที่แล้ว Ali Ghodsi ผู้ร่วมก่อตั้งและซีอีโอของ Databricks ไม่อายที่จะพูดถึงการแข่งขันกับ Snowflake

เขาโอ้อวดในเชิงพาณิชย์เป็นครั้งแรกว่า Snowflake มี "น่าจะเป็นคลังข้อมูลที่ดีที่สุดในตลาด" และ "Databricks และ Snowflake จะอยู่ร่วมกันในลูกค้าประมาณ 70%"

หากต้องการเพิ่มที่นี่ Snowflake ใช้เทคโนโลยีคลังข้อมูลเป็นหลัก ในขณะที่ Databricks ใช้เทคโนโลยีดาต้าเลค ซึ่งเป็นความแตกต่างหลักระหว่างแนวคิดทางเทคนิคทั้งสอง

จากนั้น Ali Ghodsi ส่งเสริม data lake ของเขาเอง "ผู้ให้บริการคลาวด์คอมพิวติ้งสาธารณะมีแรงจูงใจที่จะผลักดันให้ผู้คนจัดเก็บข้อมูลใน data lake ของพวกเขามากขึ้น... ฉันคิดว่ากระบวนทัศน์ data lake จะเป็นผู้ชนะ"

การแสวงหาประสิทธิภาพของผลิตภัณฑ์ยังไม่สิ้นสุด และตอนนี้ Databricks และ Snowflake กำลังแอบแหย่รุ่นใหญ่

Databricks เปิดตัวโมเดลภาษาโอเพ่นซอร์สขนาดใหญ่ชื่อ Dolly (ซึ่งคาดว่าจะเป็นการแสดงความเคารพต่อ Dolly แกะโคลนตัวแรก) ในเดือนมีนาคมปีนี้ โดยกล่าวว่า "ในราคา $30 เซิร์ฟเวอร์ และสามชั่วโมง เราสามารถสอนให้ Dolly เริ่มโต้ตอบได้ที่ ระดับมนุษย์"

เห็นได้ชัดว่าสิ่งนี้มุ่งเป้าไปที่ผลิตภัณฑ์ที่มีเกณฑ์สูงกว่าเช่น ChatGPT ซึ่งหมายความว่า AI จะไม่ใช่สิ่งที่บริษัทเทคโนโลยีขนาดใหญ่เท่านั้นที่จะจ่ายได้อีกต่อไป ใครๆ ก็สามารถพัฒนา AI ที่เหมือนมนุษย์ได้อย่างแท้จริงโดยไม่ต้องใช้เงินทุนมากนัก

จากนั้น Databricks ได้เปิดตัว Dolly 2.0 ซึ่งเป็นเวอร์ชันโอเพ่นซอร์สซ้ำของโมเดลภาษาขนาดใหญ่ในเดือนเมษายน

Snowflake กำลังเร่งสร้างโมเดลขนาดใหญ่อย่างต่อเนื่อง โดยเผยแพร่บทความในเดือนเมษายน โดยระบุว่ากำลังสร้างแพลตฟอร์มที่มีข้อมูลเป็นศูนย์กลางสำหรับเจเนอเรทีฟ AI และโมเดลภาษาขนาดใหญ่ และอธิบายรายละเอียดพื้นฐานสำหรับการทำเช่นนั้นและผลกระทบที่จะเกิดขึ้น

ในเดือนพฤษภาคมถัดมา Snowflake ประกาศการเข้าซื้อกิจการของสตาร์ทอัพ Neeva เพื่อเพิ่มการค้นหาเชิงกำเนิดโดยใช้ AI ลงในแพลตฟอร์มดาต้าคลาวด์

แม้ว่าทั้งสองบริษัทจะยังไม่ได้ก้าวเข้าสู่ดินแดนของกันและกันในแง่ของแบบจำลองขนาดใหญ่ของ AI แต่ช่วงเวลาที่ทับซ้อนกันของการประชุมสุดยอดประจำปีนี้ได้อธิบายทัศนคติของพวกเขาแล้ว

น่าสนใจ เมื่อมีคนค้นหา "การประชุม Snowflake" บน Google ผลลัพธ์แรกคือลิงก์การประชุมของ Databricks ตามด้วย Snowflake's

เท่ากับว่า Databricks ซื้อคีย์เวิร์ดของคู่แข่งเพื่อขายโฆษณาของตัวเอง

นอกจากนี้ เรายังพบว่าเมื่อ Google ค้นหา "Databricks+Snowflake" พร้อมกัน สองรายการแรกคือโฆษณา (ผลลัพธ์นี้แสดงแบบไดนามิก) - Databricks ยังคงโฆษณาความสำเร็จในตำแหน่งแรกของการจัดอันดับการเสนอราคา แต่อันดับที่สองคือ ผู้ให้บริการด้านเทคนิคและกำลังส่งเสริมบริการเพื่อช่วยให้ลูกค้าย้ายไปยัง Snowflake การเปิดตัวนี้น่าสนใจยิ่งกว่าการประมูลโดยตรงสองสถานการณ์ที่มีผู้ค้นพบก่อนหน้านี้ Databricks ยังสามารถตีความได้ว่า . ฝ่ายที่แข็งแกร่งและต่อสู้กันมากขึ้นแต่ในการแข่งขันระหว่างทั้งสองผู้ให้บริการด้านเทคนิคบางรายก็มองหาโอกาสทางธุรกิจเช่นกันและดูเหมือนจะคิดว่ามีความจำเป็นมากกว่าที่จะถ่ายโอนไปยัง Snowflake...

ไม่ว่าในกรณีใด การต่อสู้ครั้งใหญ่กำลังจะเริ่มขึ้นอีกครั้ง ตอนนี้ไม่ขาดแคลนสปอยเลอร์ในด้านโมเดลขนาดใหญ่ เมื่อพูดถึง Databricks และ Snowflake อาจกลายเป็นคำถามว่าใครจะฆ่าใครก่อน

ดูต้นฉบับ

เนื้อหานี้มีสำหรับการอ้างอิงเท่านั้น ไม่ใช่การชักชวนหรือข้อเสนอ ไม่มีคำแนะนำด้านการลงทุน ภาษี หรือกฎหมาย ดูข้อจำกัดความรับผิดชอบสำหรับการเปิดเผยความเสี่ยงเพิ่มเติม

รางวัล
ถูกใจ
แสดงความคิดเห็น
แชร์

แสดงความคิดเห็น

0/400

ไม่มีความคิดเห็น

หัวข้อถ่ายทอดสด
#BTC#
204k โพสต์
#PI#
143k โพสต์
#ETH#
129k โพสต์
4#GateioInto11#
77k โพสต์
5#ContentStar#
65k โพสต์
6#BOME#
60k โพสต์
7#GT#
59k โพสต์
8#DOGE#
54k โพสต์
9#MAGA#
52k โพสต์
10#SLERF#
51k โพสต์

ปักหมุด

แผนผังเว็บไซต์