Grandes modelos destroem a indústria de banco de dados: Databricks e Snowflake permitem que os desenvolvedores escolham lados

2023-06-12 02:33:32

Texto: Li Hezi Editora: VickyXiao

O vento de grandes modelos inevitavelmente soprou para a indústria de big data, e o cheiro de pólvora não é pequeno.

Essa infelicidade está se aproximando. Alguém notou que Databricks e Snowflake, os dois "velhos inimigos" da indústria de big data, escolheram o encontro anual mais importante de cada um para ser realizado ao mesmo tempo este ano - 26 a 29 de junho.

Isso é algo que não acontecia há tantos anos.

Não apenas isso, mas também "unanimemente" aproximaram o tema da conferência deste ano da IA. A Databricks nomeou diretamente a conferência "Data+AI Summit", e um clique no site oficial é uma enorme "Generation AI":

A Snowflake também adicionou um grande atributo à sua conferência, "a maior conferência temática de dados, aplicativos e IA do mundo":

Isso mostra o que? Isso mostra que as duas empresas estão descaradamente obrigando os participantes a fazer uma escolha: se você for à reunião deles, pode ser tarde demais para voltarmos.

Você deve saber que essas duas empresas, uma em San Francisco e outra em Las Vegas, levam 9 horas de carro e 1,5 horas de avião. Os participantes querem ter peixe e pata de urso, receio que tenham que jogar fora o suficiente.

A próxima grande novidade está chegando, não apenas o tempo coincide, ambas as empresas convidaram convidados importantes para fazer palestras - Databricks convidou o CEO da Microsoft, Satya Nadella (Satya Nadella), Snowflake é o CEO da Nvidia Huang Renxun.

Todo mundo é um chefe.

Alguns internautas lembraram a todos que, como as cúpulas das duas empresas foram realizadas ao mesmo tempo, "se você ainda não escolheu um lado, é hora de escolher".

Claro, também há muitas pessoas que estão prontas para concorrer em ambos os lados. O gerente de produto da Striim, John Kutay, planeja falar em ambas as conferências, mas também "avaliará a distância e o tempo entre Las Vegas e São Francisco".

Um internauta que não havia se decidido perguntou a ele qual seria seu discurso no Databricks: “Eu quero ir, mas tenho que ir para SF quando chegar a hora, infelizmente”.

A esse respeito, um internauta até teve um sonho ultrajante: "Eu apenas sonhei que todos estavam infectados com a nova coroa na conferência Snowflake, porque Snowflake não queria que participássemos da cúpula Databricks ..."

Atualmente, Snowflake e Databricks são líderes em empresas de análise de big data. A primeira foi fundada em 2021 e abriu o capital em setembro de 2020. O preço das ações subiu 111,6% no primeiro dia de listagem, fechando em $ 253,93, tornando-se o maior IPO de software da história dos Estados Unidos.

Além disso, a lista de acionistas da Snowflake também inclui investidores conhecidos, como Salesforce e Buffett.

Fundada em 2013, a Databricks é atualmente um super unicórnio no mercado primário. Em 2021, recebeu duas rodadas consecutivas de financiamento de grande escala no nível de US$ 1 bilhão, com uma avaliação de até US$ 38 bilhões (dados de 2021) .

Alguns praticantes chineses estão mais acostumados a chamá-la de "fábrica de tijolos".

Não apenas as duas empresas são frequentemente comparadas pelo mundo exterior, mas também sempre competem uma com a outra aberta e secretamente.

A chamada mais famosa é em 2021. Naquela época, vendo o Snowflake atingir um valor de mercado de 100 bilhões ao confiar no armazenamento de dados em nuvem, o Databricks não conseguiu ficar parado e publicou um artigo dizendo que sua tecnologia de data lake estabeleceu um novo recorde no teste de benchmark TPC-DS.

A questão é que o Databricks também destaca estudos de terceiros que mostram até 2,5 vezes o desempenho real do Snowflake.

Dez dias depois, Snowflake respondeu, divulgando seus próprios resultados de teste, alegando que as conclusões de comparação de desempenho publicadas pela Databricks careciam de integridade e que a própria pesquisa era falha.

O fundador do Snowflake também enfatizou que tais benchmarks não têm sentido, publicar resultados de benchmark de banco de dados nesta era é "transformar a comunicação técnica normal em um truque de marketing sem integridade".

Databricks relutantes respondeu novamente, e o fundador postou um blog, desta vez com uma acusação mais séria: Snowflake realmente mudou os dados de entrada do TPC-DS para os resultados do teste.

Desde então, o engasgo mútuo entre os dois não parou.

Em uma conversa com o investidor Matt Turck no ano passado, Ali Ghodsi, cofundador e CEO da Databricks, não se esquivou de falar sobre a concorrência com a Snowflake.

Ele primeiro se gabou comercialmente de que o Snowflake tem "provavelmente o melhor data warehouse do mercado" e "Databricks e Snowflake coexistirão em talvez 70% dos clientes".

Para adicionar aqui, o Snowflake usa principalmente a tecnologia de data warehouse, enquanto o Databricks usa a tecnologia de data lake, que também é a principal diferença entre as duas ideias técnicas.

Em seguida, Ali Ghodsi promoveu seu próprio data lake: "Os provedores públicos de computação em nuvem têm um incentivo para levar mais pessoas a armazenar dados em seus data lakes... Acho que o paradigma do data lake vencerá."

A busca pelo desempenho do produto ainda não acabou, e agora Databricks e Snowflake estão cutucando secretamente o modelo grande.

Databricks lançou um grande modelo de linguagem de código aberto chamado Dolly (supostamente em homenagem a Dolly, a primeira ovelha clonada) em março deste ano, dizendo que "por $ 30, um servidor e três horas, podemos ensinar Dolly começa a interagir em um nível humano".

Obviamente, isso se destina a produtos com um limite mais alto, como o ChatGPT, o que significa que a IA não é mais algo que apenas grandes empresas de tecnologia podem pagar. Sem muito financiamento, qualquer pessoa pode desenvolver uma IA verdadeiramente semelhante à humana.

A Databricks então lançou o Dolly 2.0, uma versão iterativa de código aberto do modelo de linguagem grande, em abril.

A Snowflake também está constantemente promovendo grandes modelos. Publicou um artigo em abril afirmando que está construindo uma plataforma centrada em dados para IA generativa e modelos de linguagem grande, e explicou em detalhes a base para fazer isso e o impacto que isso trará.

No mês de maio seguinte, a Snowflake anunciou a aquisição da startup Neeva para adicionar pesquisa generativa baseada em IA à sua plataforma de nuvem de dados.

Embora as duas empresas ainda não tenham entrado no território uma da outra em termos de grandes modelos de IA, a sobreposição do calendário desta cúpula anual já explicou suas atitudes.

Curiosamente, quando alguém pesquisa por "Snowflake conference" no Google, o primeiro resultado é o link da conferência do Databricks, seguido pelo Snowflake's.

É equivalente a dizer que a Databricks comprou as palavras-chave dos concorrentes para vender seus próprios anúncios.

Também descobrimos que quando o Google pesquisava "Databricks+Snowflake" ao mesmo tempo, os dois primeiros eram anúncios (esse resultado era exibido dinamicamente) - Databricks ainda anunciava suas conquistas na primeira posição do ranking de lances, mas a segunda é um provedor de serviços técnicos e está promovendo seu serviço para ajudar os clientes a migrar para o Snowflake. Este lançamento é ainda mais interessante do que as duas situações de licitação direta que alguém descobriu anteriormente. Databricks ainda pode ser interpretado como (em termos de ofensiva comercial) mais agressivo O lado mais forte e combativo, mas na competição entre os dois, alguns prestadores de serviços técnicos também procuram oportunidades de negócio, e parecem achar que há uma maior necessidade de se transferirem para o Floco de Neve...

De qualquer forma, uma grande batalha está prestes a recomeçar. Agora não faltam spoilers no campo de grandes modelos.Quando se trata de Databricks e Snowflake, pode se tornar uma questão de quem matará quem primeiro.

Ver original

O conteúdo serve apenas de referência e não constitui uma solicitação ou oferta. Não é prestado qualquer aconselhamento em matéria de investimento, fiscal ou jurídica. Consulte a Declaração de exoneração de responsabilidade para obter mais informações sobre os riscos.

Recompensa
gostar
Comentar
Partilhar

Comentar

0/400

Nenhum comentário

Tópico
#BTC#
206622 publicações
#PI#
151869 publicações
#ETH#
130170 publicações
4#GateioInto11#
77244 publicações
5#ContentStar#
64620 publicações
6#BOME#
59484 publicações
7#GT#
58872 publicações
8#DOGE#
54411 publicações
9#MAGA#
51579 publicações
10#SLERF#
50315 publicações

Pino