Los grandes modelos destrozan la industria de las bases de datos: Databricks y Snowflake permiten a los desarrolladores elegir bandos

Texto: Li Hezi Editor: VickyXiao

El viento de los modelos grandes inevitablemente ha soplado en la industria de los grandes datos, y el olor a pólvora no es pequeño.

Esta infelicidad se acerca Alguien notó que Databricks y Snowflake, los dos "viejos enemigos" de la industria de big data, eligieron la cumbre anual más importante de cada uno para celebrarse al mismo tiempo este año, del 26 al 29 de junio.

Esto es algo que no ha sucedido en tantos años.

No solo eso, sino que también "por unanimidad" acercaron el tema de la conferencia de este año a la IA. Databricks nombró directamente a la conferencia "Data+AI Summit", y un clic en el sitio web oficial es una enorme "Generación AI":

Snowflake también agregó un gran atributo a su conferencia, "la conferencia temática de datos, aplicaciones e IA más grande del mundo":

¿Esto muestra qué? Muestra que las dos empresas están obligando descaradamente a los participantes a tomar una decisión: si vas a su reunión, puede ser demasiado tarde para que volvamos.

Debes saber que estas dos empresas, una en San Francisco y otra en Las Vegas, tardan 9 horas en auto y 1,5 horas en avión. Los participantes quieren tener pez y pata de oso, me temo que tendrán que tirar lo suficiente.

Se acerca la próxima gran cosa, no solo el tiempo coincide, ambas compañías han invitado a invitados importantes para dar discursos de apertura: Databricks invitó al CEO de Microsoft, Satya Nadella (Satya Nadella), Snowflake es el CEO de Nvidia Huang Renxun.

Todo el mundo es un jefe.

Algunos internautas recordaron a todos que dado que las cumbres de las dos empresas se llevaron a cabo al mismo tiempo, "si aún no ha elegido un lado, es hora de que elija".

Por supuesto, también hay muchas personas que están listas para correr en ambos lados. El gerente de producto de Striim, John Kutay, planea hablar en ambas conferencias, pero también "evaluará la distancia y el tiempo entre Las Vegas y San Francisco".

Un internauta que no se había decidido le preguntó cuál sería su discurso en Databricks: "Quiero ir, pero tengo que ir a SF cuando llegue el momento, por desgracia".

Al respecto, un internauta incluso tuvo un sueño escandaloso: "Soñé que todos estaban infectados con la nueva corona en la conferencia de Snowflake, porque Snowflake no quería que participáramos en la cumbre de Databricks...".

Tanto Snowflake como Databricks son actualmente líderes en empresas de análisis de big data. La primera se fundó en 2021 y se hizo pública en septiembre de 2020. El precio de las acciones se disparó un 111,6 % el primer día de cotización para cerrar en 253,93 dólares, lo que la convierte en la oferta pública inicial de software más grande en la historia de los Estados Unidos.

Además, la lista de accionistas de Snowflake también incluye inversores conocidos como Salesforce y Buffett.

Fundada en 2013, Databricks es actualmente un súper unicornio en el mercado primario. En 2021, ha recibido dos rondas consecutivas de financiamiento a gran escala por valor de mil millones de dólares estadounidenses, con una valoración de hasta 38 mil millones de dólares estadounidenses (datos de 2021). .

Algunos practicantes chinos están más acostumbrados a llamarla "fábrica de ladrillos".

El mundo exterior no solo compara a menudo a las dos empresas, sino que también siempre compiten entre sí abierta y secretamente.

La llamada más famosa es en 2021. En ese momento, al ver que Snowflake alcanzaba un valor de mercado de 100 000 millones al confiar en el almacenamiento de datos en la nube, Databricks no podía quedarse quieto y publicó un artículo que decía que su tecnología de lago de datos estableció un nuevo récord en la prueba comparativa TPC-DS.

El punto es que Databricks también destaca estudios de terceros que muestran hasta 2,5 veces el rendimiento real de Snowflake.

Diez días después, Snowflake respondió y publicó los resultados de sus propias pruebas, al tiempo que afirmaba que las conclusiones de la comparación de rendimiento publicadas por Databricks no estaban completas y que la investigación en sí era defectuosa.

El fundador de Snowflake también enfatizó que tales puntos de referencia no tienen sentido, publicar los resultados de los puntos de referencia de la base de datos en esta era es "convertir la comunicación técnica normal en un truco de marketing que carece de integridad".

Unwilling Databricks respondió nuevamente y el fundador publicó un blog, esta vez con una acusación más seria: Snowflake en realidad cambió los datos de entrada de TPC-DS para los resultados de la prueba.

Desde entonces, el atragantamiento mutuo entre ambos no ha cesado.

En una conversación con el inversionista Matt Turck el año pasado, Ali Ghodsi, cofundador y director ejecutivo de Databricks, no rehuyó hablar sobre la competencia con Snowflake.

Primero se jactó comercialmente de que Snowflake tiene "probablemente el mejor almacén de datos del mercado" y "Databricks y Snowflake coexistirán en quizás el 70% de los clientes".

Para agregar aquí, Snowflake usa principalmente tecnología de almacenamiento de datos, mientras que Databricks usa tecnología de lago de datos, que también es la principal diferencia entre las dos ideas técnicas.

Luego, Ali Ghodsi promocionó su propio lago de datos: "Los proveedores de computación en la nube pública tienen un incentivo para impulsar a más personas a almacenar datos en sus lagos de datos... Creo que el paradigma del lago de datos ganará".

La búsqueda del rendimiento del producto aún no ha terminado, y ahora Databricks y Snowflake están hurgando en secreto en el gran modelo.

Databricks lanzó un modelo de lenguaje grande de código abierto llamado Dolly (supuestamente en homenaje a Dolly, la primera oveja clonada) en marzo de este año, diciendo que "por $30, un servidor y tres horas, podemos enseñarle a Dolly a interactuar en un nivel humano".

Obviamente, esto está dirigido a productos con un umbral más alto como ChatGPT, lo que significa que la IA ya no es algo que solo las grandes empresas de tecnología pueden pagar. Sin mucha financiación, cualquiera puede desarrollar una IA que sea verdaderamente humana.

Luego, Databricks lanzó Dolly 2.0, una versión iterativa de código abierto del modelo de lenguaje grande, en abril.

Snowflake también promociona constantemente modelos grandes. En abril, publicó un artículo en el que afirma que está construyendo una plataforma centrada en datos para IA generativa y modelos de lenguaje grande, y explica en detalle la base para hacerlo y el impacto que traerá.

En mayo siguiente, Snowflake anunció la adquisición de la startup Neeva para agregar la búsqueda generativa basada en IA a su plataforma de nube de datos.

Aunque las dos compañías aún no han entrado en el territorio de la otra en términos de modelos grandes de IA, la superposición de fechas de esta cumbre anual ya ha explicado sus actitudes.

Curiosamente, cuando alguien busca "Conferencia de Snowflake" en Google, el primer resultado es el enlace de la conferencia de Databricks, seguido por el de Snowflake.

Es equivalente a decir que Databricks compró las palabras clave de los competidores para vender sus propios anuncios.

También encontramos que cuando Google buscaba "Databricks+Snowflake" al mismo tiempo, los dos primeros eran anuncios (este resultado se mostraba de forma dinámica) - Databricks todavía anunciaba sus logros en la primera posición del ranking de ofertas, pero el segundo es un proveedor de servicios técnicos, y está promocionando su servicio para ayudar a los clientes a migrar a Snowflake. Este lanzamiento es aún más interesante que las dos situaciones de licitación directa que alguien descubrió anteriormente. Los databricks aún pueden interpretarse como (en términos de ofensiva comercial) más agresivos El bando más fuerte y combativo, pero en la competencia entre ambos, algunos proveedores de servicios técnicos también buscan oportunidades de negocio, y parecen pensar que hay una mayor necesidad de traspasar a Snowflake...

En cualquier caso, una gran batalla está a punto de comenzar de nuevo. Ahora no faltan los spoilers en el campo de los modelos grandes. Cuando se trata de Databricks y Snowflake, puede convertirse en una cuestión de quién matará a quién primero.

Ver originales

El contenido es solo de referencia, no una solicitud u oferta. No se proporciona asesoramiento fiscal, legal ni de inversión. Consulte el Descargo de responsabilidad para obtener más información sobre los riesgos.

Recompensa
Me gusta
Comentar
Compartir

Comentar

0/400

Sin comentarios

Tema
#BTC#
204k publicaciones
#PI#
143k publicaciones
#ETH#
129k publicaciones
4#GateioInto11#
77k publicaciones
5#ContentStar#
65k publicaciones
6#BOME#
60k publicaciones
7#GT#
59k publicaciones
8#DOGE#
54k publicaciones
9#MAGA#
52k publicaciones
10#SLERF#
51k publicaciones

Anclado