Les grands modèles déchirent l'industrie des bases de données : Databricks et Snowflake permettent aux développeurs de choisir leur camp

Texte : Li Hezi Éditeur : VickyXiao

Le vent des grands modèles a inévitablement soufflé sur l'industrie du big data, et l'odeur de la poudre à canon n'est pas petite.

Quelqu'un a remarqué que Databricks et Snowflake, les deux "vieux ennemis" de l'industrie du big data, ont tous deux choisi que le sommet annuel le plus important de chacun se tienne au même moment cette année, du 26 au 29 juin.

C'est quelque chose qui ne s'est pas produit depuis tant d'années.

Non seulement cela, mais ils ont également "unanimement" rapproché le thème de la conférence de cette année de l'IA. Databricks a directement nommé la conférence "Data+AI Summit", et un clic sur le site officiel est une énorme "Génération AI":

Snowflake a également ajouté un excellent attribut à sa conférence, "la plus grande conférence thématique sur les données, les applications et l'IA au monde":

Cela montre quoi ? Cela montre que les deux entreprises obligent de manière flagrante les participants à faire un choix : si vous allez à leur rencontre, il sera peut-être trop tard pour que nous revenions.

Il faut savoir que ces deux compagnies, l'une à San Francisco et l'autre à Las Vegas, mettent 9h en voiture et 1h30 en avion. Les participants veulent avoir à la fois du poisson et de la patte d'ours, je crains qu'ils ne soient obligés d'en lancer suffisamment.

La prochaine grande chose arrive, non seulement le temps coïncide, les deux sociétés ont invité des invités importants à prononcer des discours liminaires - Databricks a invité le PDG de Microsoft, Satya Nadella (Satya Nadella), Snowflake est le PDG de Nvidia Huang Renxun.

Tout le monde est un patron.

Certains internautes ont rappelé à tous que puisque les sommets des deux sociétés se tenaient en même temps, "si vous n'avez pas encore choisi de camp, il est temps pour vous de choisir".

Bien sûr, il y a aussi beaucoup de gens qui sont prêts à courir des deux côtés. Le chef de produit Striim, John Kutay, prévoit de prendre la parole lors des deux conférences, mais "évaluera également la distance et le temps entre Las Vegas et San Francisco".

Un internaute indécis lui demande quel serait son discours sur Databricks : "Je veux y aller, mais je dois aller à SF le moment venu, hélas."

À ce sujet, un internaute a même fait un rêve scandaleux : "J'ai juste rêvé que tout le monde était infecté par la nouvelle couronne lors de la conférence Snowflake, car Snowflake ne voulait pas que nous participions au sommet Databricks..."

Snowflake et Databricks sont actuellement des leaders dans les sociétés d'analyse de données volumineuses. Le premier a été fondé en 2021 et est devenu public en septembre 2020. Le cours de l'action a grimpé de 111,6 % le premier jour de la cotation pour clôturer à 253,93 $, ce qui en fait la plus grande introduction en bourse de logiciels de l'histoire des États-Unis.

En outre, la liste des actionnaires de Snowflake comprend également des investisseurs bien connus tels que Salesforce et Buffett.

Fondée en 2013, Databricks est actuellement une super licorne sur le marché primaire.En 2021, elle a reçu deux tours de financement consécutifs à grande échelle à hauteur de 1 milliard de dollars US, avec une valorisation pouvant atteindre 38 milliards de dollars US (données 2021) .

Certains pratiquants chinois sont plus habitués à l'appeler une "usine de briques".

Non seulement les deux entreprises sont souvent comparées par le monde extérieur, mais elles se font toujours concurrence ouvertement et secrètement.

L'appel le plus célèbre est en 2021. À cette époque, voyant Snowflake atteindre une valeur marchande de 100 milliards en s'appuyant sur un entrepôt de données cloud, Databricks ne pouvait pas rester immobile et a publié un article disant que sa technologie de lac de données établissait un nouveau record dans le test de référence TPC-DS.

Le fait est que Databricks met également en évidence des études tierces qui montrent jusqu'à 2,5 fois les performances réelles de Snowflake.

Dix jours plus tard, Snowflake a répondu en publiant ses propres résultats de test, tout en affirmant que les conclusions de comparaison des performances publiées par Databricks manquaient d'exhaustivité et que la recherche elle-même était imparfaite.

Le fondateur de Snowflake a également souligné que de tels benchmarks n'ont aucun sens, la publication des résultats des benchmarks de bases de données à cette époque "transforme la communication technique normale en un gadget marketing manquant d'intégrité".

Réticent, Databricks a de nouveau répondu et le fondateur a publié un blog, cette fois avec une accusation plus grave : Snowflake a en fait modifié les données d'entrée de TPC-DS pour les résultats des tests.

Depuis lors, l'étouffement mutuel entre les deux n'a pas cessé.

Lors d'une conversation avec l'investisseur Matt Turck l'année dernière, Ali Ghodsi, co-fondateur et PDG de Databricks, n'a pas hésité à parler de concurrence avec Snowflake.

Il s'est d'abord vanté commercialement que Snowflake a "probablement le meilleur entrepôt de données sur le marché", et "Databricks et Snowflake coexisteront chez peut-être 70% des clients".

Pour ajouter ici, Snowflake utilise principalement la technologie d'entrepôt de données, tandis que Databricks utilise la technologie de lac de données, qui est également la principale différence entre les deux idées techniques.

Puis Ali Ghodsi a fait la promotion de son propre lac de données : "Les fournisseurs publics de cloud computing sont incités à pousser davantage de personnes à stocker des données dans leurs lacs de données... Je pense que le paradigme du lac de données l'emportera."

La poursuite de la performance des produits n'est pas encore terminée, et maintenant Databricks et Snowflake s'attaquent secrètement au grand modèle.

Databricks a publié un grand modèle de langage open source appelé Dolly (soi-disant en hommage à Dolly, le premier mouton cloné) en mars de cette année, en disant que "pour 30 $, un serveur et trois heures, nous pouvons apprendre à Dolly à commencer à interagir à un niveau humain ».

Ceci est évidemment destiné aux produits avec un seuil plus élevé comme ChatGPT, ce qui signifie que l'IA n'est plus quelque chose que seules les grandes entreprises technologiques peuvent se permettre.. Sans beaucoup de financement, n'importe qui peut développer une IA vraiment humaine.

Databricks a ensuite publié Dolly 2.0, une version itérative open source du grand modèle de langage, en avril.

Snowflake fait également constamment la promotion de grands modèles et a publié un article en avril déclarant qu'il était en train de construire une plate-forme centrée sur les données pour l'IA générative et les grands modèles de langage, et a expliqué en détail la base pour le faire et l'impact que cela apportera.

En mai suivant, Snowflake a annoncé l'acquisition de la startup Neeva pour ajouter la recherche générative basée sur l'IA à sa plate-forme cloud de données.

Bien que les deux sociétés ne soient pas encore entrées sur le territoire de l'autre en termes de grands modèles d'IA, le calendrier qui se chevauche de ce sommet annuel a déjà expliqué leurs attitudes.

Fait intéressant, lorsque quelqu'un recherche "Conférence Snowflake" sur Google, le premier résultat est le lien de conférence de Databricks, suivi de celui de Snowflake.

Cela revient à dire que Databricks a acheté les mots-clés de concurrents pour vendre leurs propres publicités.

Nous avons également constaté que lorsque Google recherchait "Databricks+Snowflake" en même temps, les deux premiers étaient des publicités (ce résultat s'affichait dynamiquement) - Databricks annonçait toujours ses réalisations en première position du classement des enchères, mais la seconde C'est un fournisseur de services techniques, et il fait la promotion de son service pour aider les clients à migrer vers Snowflake. Ce lancement est encore plus intéressant que les deux situations d'enchères directes que quelqu'un a découvertes plus tôt. Databricks peut encore être interprété comme (en termes d'offensive commerciale) plus agressif Le côté plus fort et plus combatif, mais dans la compétition entre les deux, certains prestataires techniques sont également à la recherche d'opportunités commerciales, et semblent penser qu'il y a un plus grand besoin de passer à Snowflake...

En tout cas, une grande bataille est sur le point de recommencer. Maintenant, les spoilers ne manquent pas dans le domaine des grands modèles, et quand il s'agit de Databricks et de Snowflake, il peut s'agir de savoir qui tuera qui en premier.

Voir l'original
Le contenu est fourni à titre de référence uniquement, il ne s'agit pas d'une sollicitation ou d'une offre. Aucun conseil en investissement, fiscalité ou juridique n'est fourni. Consultez l'Avertissement pour plus de détails sur les risques.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate.io app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)