O vento de grandes modelos inevitavelmente soprou para a indústria de big data, e o cheiro de pólvora não é pequeno.
Essa infelicidade está se aproximando. Alguém notou que Databricks e Snowflake, os dois "velhos inimigos" da indústria de big data, escolheram o encontro anual mais importante de cada um para ser realizado ao mesmo tempo este ano - 26 a 29 de junho.
Isso é algo que não acontecia há tantos anos.
Não apenas isso, mas também "unanimemente" aproximaram o tema da conferência deste ano da IA. A Databricks nomeou diretamente a conferência "Data+AI Summit", e um clique no site oficial é uma enorme "Generation AI":
A Snowflake também adicionou um grande atributo à sua conferência, "a maior conferência temática de dados, aplicativos e IA do mundo":
Isso mostra o que? Isso mostra que as duas empresas estão descaradamente obrigando os participantes a fazer uma escolha: se você for à reunião deles, pode ser tarde demais para voltarmos.
Você deve saber que essas duas empresas, uma em San Francisco e outra em Las Vegas, levam 9 horas de carro e 1,5 horas de avião. Os participantes querem ter peixe e pata de urso, receio que tenham que jogar fora o suficiente.
A próxima grande novidade está chegando, não apenas o tempo coincide, ambas as empresas convidaram convidados importantes para fazer palestras - Databricks convidou o CEO da Microsoft, Satya Nadella (Satya Nadella), Snowflake é o CEO da Nvidia Huang Renxun.
Todo mundo é um chefe.
Alguns internautas lembraram a todos que, como as cúpulas das duas empresas foram realizadas ao mesmo tempo, "se você ainda não escolheu um lado, é hora de escolher".
Claro, também há muitas pessoas que estão prontas para concorrer em ambos os lados. O gerente de produto da Striim, John Kutay, planeja falar em ambas as conferências, mas também "avaliará a distância e o tempo entre Las Vegas e São Francisco".
Um internauta que não havia se decidido perguntou a ele qual seria seu discurso no Databricks: “Eu quero ir, mas tenho que ir para SF quando chegar a hora, infelizmente”.
A esse respeito, um internauta até teve um sonho ultrajante: "Eu apenas sonhei que todos estavam infectados com a nova coroa na conferência Snowflake, porque Snowflake não queria que participássemos da cúpula Databricks ..."
Atualmente, Snowflake e Databricks são líderes em empresas de análise de big data. A primeira foi fundada em 2021 e abriu o capital em setembro de 2020. O preço das ações subiu 111,6% no primeiro dia de listagem, fechando em $ 253,93, tornando-se o maior IPO de software da história dos Estados Unidos.
Além disso, a lista de acionistas da Snowflake também inclui investidores conhecidos, como Salesforce e Buffett.
Fundada em 2013, a Databricks é atualmente um super unicórnio no mercado primário. Em 2021, recebeu duas rodadas consecutivas de financiamento de grande escala no nível de US$ 1 bilhão, com uma avaliação de até US$ 38 bilhões (dados de 2021) .
Alguns praticantes chineses estão mais acostumados a chamá-la de "fábrica de tijolos".
Não apenas as duas empresas são frequentemente comparadas pelo mundo exterior, mas também sempre competem uma com a outra aberta e secretamente.
A chamada mais famosa é em 2021. Naquela época, vendo o Snowflake atingir um valor de mercado de 100 bilhões ao confiar no armazenamento de dados em nuvem, o Databricks não conseguiu ficar parado e publicou um artigo dizendo que sua tecnologia de data lake estabeleceu um novo recorde no teste de benchmark TPC-DS.
A questão é que o Databricks também destaca estudos de terceiros que mostram até 2,5 vezes o desempenho real do Snowflake.
Dez dias depois, Snowflake respondeu, divulgando seus próprios resultados de teste, alegando que as conclusões de comparação de desempenho publicadas pela Databricks careciam de integridade e que a própria pesquisa era falha.
O fundador do Snowflake também enfatizou que tais benchmarks não têm sentido, publicar resultados de benchmark de banco de dados nesta era é "transformar a comunicação técnica normal em um truque de marketing sem integridade".
Databricks relutantes respondeu novamente, e o fundador postou um blog, desta vez com uma acusação mais séria: Snowflake realmente mudou os dados de entrada do TPC-DS para os resultados do teste.
Desde então, o engasgo mútuo entre os dois não parou.
Em uma conversa com o investidor Matt Turck no ano passado, Ali Ghodsi, cofundador e CEO da Databricks, não se esquivou de falar sobre a concorrência com a Snowflake.
Ele primeiro se gabou comercialmente de que o Snowflake tem "provavelmente o melhor data warehouse do mercado" e "Databricks e Snowflake coexistirão em talvez 70% dos clientes".
Para adicionar aqui, o Snowflake usa principalmente a tecnologia de data warehouse, enquanto o Databricks usa a tecnologia de data lake, que também é a principal diferença entre as duas ideias técnicas.
Em seguida, Ali Ghodsi promoveu seu próprio data lake: "Os provedores públicos de computação em nuvem têm um incentivo para levar mais pessoas a armazenar dados em seus data lakes... Acho que o paradigma do data lake vencerá."
A busca pelo desempenho do produto ainda não acabou, e agora Databricks e Snowflake estão cutucando secretamente o modelo grande.
Databricks lançou um grande modelo de linguagem de código aberto chamado Dolly (supostamente em homenagem a Dolly, a primeira ovelha clonada) em março deste ano, dizendo que "por $ 30, um servidor e três horas, podemos ensinar Dolly começa a interagir em um nível humano".
Obviamente, isso se destina a produtos com um limite mais alto, como o ChatGPT, o que significa que a IA não é mais algo que apenas grandes empresas de tecnologia podem pagar. Sem muito financiamento, qualquer pessoa pode desenvolver uma IA verdadeiramente semelhante à humana.
A Databricks então lançou o Dolly 2.0, uma versão iterativa de código aberto do modelo de linguagem grande, em abril.
A Snowflake também está constantemente promovendo grandes modelos. Publicou um artigo em abril afirmando que está construindo uma plataforma centrada em dados para IA generativa e modelos de linguagem grande, e explicou em detalhes a base para fazer isso e o impacto que isso trará.
No mês de maio seguinte, a Snowflake anunciou a aquisição da startup Neeva para adicionar pesquisa generativa baseada em IA à sua plataforma de nuvem de dados.
Embora as duas empresas ainda não tenham entrado no território uma da outra em termos de grandes modelos de IA, a sobreposição do calendário desta cúpula anual já explicou suas atitudes.
Curiosamente, quando alguém pesquisa por "Snowflake conference" no Google, o primeiro resultado é o link da conferência do Databricks, seguido pelo Snowflake's.
É equivalente a dizer que a Databricks comprou as palavras-chave dos concorrentes para vender seus próprios anúncios.
Também descobrimos que quando o Google pesquisava "Databricks+Snowflake" ao mesmo tempo, os dois primeiros eram anúncios (esse resultado era exibido dinamicamente) - Databricks ainda anunciava suas conquistas na primeira posição do ranking de lances, mas a segunda é um provedor de serviços técnicos e está promovendo seu serviço para ajudar os clientes a migrar para o Snowflake. Este lançamento é ainda mais interessante do que as duas situações de licitação direta que alguém descobriu anteriormente. Databricks ainda pode ser interpretado como (em termos de ofensiva comercial) mais agressivo O lado mais forte e combativo, mas na competição entre os dois, alguns prestadores de serviços técnicos também procuram oportunidades de negócio, e parecem achar que há uma maior necessidade de se transferirem para o Floco de Neve...
De qualquer forma, uma grande batalha está prestes a recomeçar. Agora não faltam spoilers no campo de grandes modelos.Quando se trata de Databricks e Snowflake, pode se tornar uma questão de quem matará quem primeiro.
Ver original
O conteúdo serve apenas de referência e não constitui uma solicitação ou oferta. Não é prestado qualquer aconselhamento em matéria de investimento, fiscal ou jurídica. Consulte a Declaração de exoneração de responsabilidade para obter mais informações sobre os riscos.
Grandes modelos destroem a indústria de banco de dados: Databricks e Snowflake permitem que os desenvolvedores escolham lados
Texto: Li Hezi Editora: VickyXiao
O vento de grandes modelos inevitavelmente soprou para a indústria de big data, e o cheiro de pólvora não é pequeno.
Essa infelicidade está se aproximando. Alguém notou que Databricks e Snowflake, os dois "velhos inimigos" da indústria de big data, escolheram o encontro anual mais importante de cada um para ser realizado ao mesmo tempo este ano - 26 a 29 de junho.
Isso é algo que não acontecia há tantos anos.
Não apenas isso, mas também "unanimemente" aproximaram o tema da conferência deste ano da IA. A Databricks nomeou diretamente a conferência "Data+AI Summit", e um clique no site oficial é uma enorme "Generation AI":
Você deve saber que essas duas empresas, uma em San Francisco e outra em Las Vegas, levam 9 horas de carro e 1,5 horas de avião. Os participantes querem ter peixe e pata de urso, receio que tenham que jogar fora o suficiente.
A próxima grande novidade está chegando, não apenas o tempo coincide, ambas as empresas convidaram convidados importantes para fazer palestras - Databricks convidou o CEO da Microsoft, Satya Nadella (Satya Nadella), Snowflake é o CEO da Nvidia Huang Renxun.
Todo mundo é um chefe.
Alguns internautas lembraram a todos que, como as cúpulas das duas empresas foram realizadas ao mesmo tempo, "se você ainda não escolheu um lado, é hora de escolher".
Um internauta que não havia se decidido perguntou a ele qual seria seu discurso no Databricks: “Eu quero ir, mas tenho que ir para SF quando chegar a hora, infelizmente”.
Além disso, a lista de acionistas da Snowflake também inclui investidores conhecidos, como Salesforce e Buffett.
Fundada em 2013, a Databricks é atualmente um super unicórnio no mercado primário. Em 2021, recebeu duas rodadas consecutivas de financiamento de grande escala no nível de US$ 1 bilhão, com uma avaliação de até US$ 38 bilhões (dados de 2021) .
Alguns praticantes chineses estão mais acostumados a chamá-la de "fábrica de tijolos".
Não apenas as duas empresas são frequentemente comparadas pelo mundo exterior, mas também sempre competem uma com a outra aberta e secretamente.
A chamada mais famosa é em 2021. Naquela época, vendo o Snowflake atingir um valor de mercado de 100 bilhões ao confiar no armazenamento de dados em nuvem, o Databricks não conseguiu ficar parado e publicou um artigo dizendo que sua tecnologia de data lake estabeleceu um novo recorde no teste de benchmark TPC-DS.
Dez dias depois, Snowflake respondeu, divulgando seus próprios resultados de teste, alegando que as conclusões de comparação de desempenho publicadas pela Databricks careciam de integridade e que a própria pesquisa era falha.
O fundador do Snowflake também enfatizou que tais benchmarks não têm sentido, publicar resultados de benchmark de banco de dados nesta era é "transformar a comunicação técnica normal em um truque de marketing sem integridade".
Em uma conversa com o investidor Matt Turck no ano passado, Ali Ghodsi, cofundador e CEO da Databricks, não se esquivou de falar sobre a concorrência com a Snowflake.
Ele primeiro se gabou comercialmente de que o Snowflake tem "provavelmente o melhor data warehouse do mercado" e "Databricks e Snowflake coexistirão em talvez 70% dos clientes".
Para adicionar aqui, o Snowflake usa principalmente a tecnologia de data warehouse, enquanto o Databricks usa a tecnologia de data lake, que também é a principal diferença entre as duas ideias técnicas.
Em seguida, Ali Ghodsi promoveu seu próprio data lake: "Os provedores públicos de computação em nuvem têm um incentivo para levar mais pessoas a armazenar dados em seus data lakes... Acho que o paradigma do data lake vencerá."
A busca pelo desempenho do produto ainda não acabou, e agora Databricks e Snowflake estão cutucando secretamente o modelo grande.
Databricks lançou um grande modelo de linguagem de código aberto chamado Dolly (supostamente em homenagem a Dolly, a primeira ovelha clonada) em março deste ano, dizendo que "por $ 30, um servidor e três horas, podemos ensinar Dolly começa a interagir em um nível humano".
A Databricks então lançou o Dolly 2.0, uma versão iterativa de código aberto do modelo de linguagem grande, em abril.
A Snowflake também está constantemente promovendo grandes modelos. Publicou um artigo em abril afirmando que está construindo uma plataforma centrada em dados para IA generativa e modelos de linguagem grande, e explicou em detalhes a base para fazer isso e o impacto que isso trará.
No mês de maio seguinte, a Snowflake anunciou a aquisição da startup Neeva para adicionar pesquisa generativa baseada em IA à sua plataforma de nuvem de dados.
Curiosamente, quando alguém pesquisa por "Snowflake conference" no Google, o primeiro resultado é o link da conferência do Databricks, seguido pelo Snowflake's.
De qualquer forma, uma grande batalha está prestes a recomeçar. Agora não faltam spoilers no campo de grandes modelos.Quando se trata de Databricks e Snowflake, pode se tornar uma questão de quem matará quem primeiro.