AMD lança desafio de chip AI, mas Nvidia ainda está sozinha

Autor: Zhao Jian

Fonte: Jiazi Guangnian

Crédito da imagem: Gerado por ferramentas Unbounded AI

O CEO da Nvidia, Huang Renxun, está tentando dar à indústria a impressão de que a IA é igual à Nvidia.

Hoje, com a explosão de grandes modelos de linguagem de IA, os chips de GPU da Nvidia para inteligência artificial são quase a única opção para concluir o treinamento de IA que requer um poder de computação extremamente alto.

Esse desequilíbrio extremo de oferta e demanda tornou as GPUs da Nvidia difíceis de encontrar. Até o CEO da OpenAI, Sam Altman, está reclamando que a escassez de chips afetou o desenvolvimento do ChatGPT.

Huang Renxun deve estar feliz em ouvir isso. Em 2023, impulsionado pela demanda por IA, o valor de mercado da Nvidia ultrapassará um trilhão de dólares americanos.

No entanto, algumas pessoas estão tentando quebrar o status de "busca solitária da derrota" da Nvidia no campo da inteligência artificial.

Na quarta-feira, a AMD (Advanced Semiconductor) lançou oficialmente o chip carro-chefe anual Instinct MI300 em sua primeira conferência de lançamento de produtos de "inteligência artificial e centro de dados", um superchip que pode competir com a série Grace Hopper da Nvidia.

O Instinct MI300 tem duas versões: o MI300X possui apenas GPU, que é especialmente projetado para treinamento de modelos de IA e contém 153 bilhões de transistores; MI300A é uma APU que integra várias CPUs, GPUs e memória de alta largura de banda (AMD proposta no conceito de produto de 2011), empacotada com 146 bilhões de transistores.

O lançamento do Instinct MI300 significa que a Nvidia não é mais a única opção para empresas de IA em termos de poder de computação. A AMD realmente conseguiu atrair alguns unicórnios de estrelas da IA, como Hugging Face, a AMD otimizará o modelo para sua CPU, GPU e outros hardwares de IA.

O Instinct MI300 carrega as ambições da AMD no campo da inteligência artificial. A CEO da AMD, Lisa Su, disse recentemente: "Se você olhar para cinco anos, verá inteligência artificial em todos os produtos da AMD e ela se tornará o maior impulsionador do crescimento".

A AMD é a antiga rival da Nvidia, a competição entre as duas no mercado de GPUs já dura 17 anos, e na maioria das vezes terminava com a vitória da Nvidia.

E desta vez, a AMD, que já se provou uma vez no mercado de CPU, pode copiar sua experiência de sucesso para o mercado de GPU?

1.AMD quer coroa de IA da Nvidia

A AMD é uma antiga empresa de semicondutores bem conhecida no mundo, fundada em 1969. De acordo com os dados do ranking das empresas globais de semicondutores divulgados pelo Gartner este ano, a AMD ocupa o sétimo lugar.

A CPU é o berço da AMD. Em 1981, a AMD obteve a autorização dos processadores da série Intel X86 e tornou-se a segunda na indústria de uma só vez durante o período de bônus da era do PC, e a segunda nesta indústria faz isso há décadas.

Além da CPU, a AMD gradualmente estabeleceu um layout de chip completo de "CPU+GPU+DPU+FPGA" por meio de fusões e aquisições contínuas.

Algumas das fusões e aquisições mais importantes incluem:

  • Em julho de 2006, a AMD gastou US$ 5,4 bilhões para adquirir a ATI, a segunda maior na indústria de GPU na época, lançando oficialmente a competição de GPU com a Nvidia;
  • Em fevereiro de 2022, a AMD gastou US$ 49,8 bilhões para concluir a aquisição da fabricante de FPGA Xilinx para fortalecer seu layout no negócio de data center;
  • Em abril de 2022, a AMD anunciou a aquisição da fabricante de chips DPU Pensando por US$ 1,9 bilhão para continuar expandindo seus negócios de data center.

A estrutura de negócios da AMD é dividida em quatro setores principais: data center, cliente, jogos e negócios integrados.

O data center inclui toda a receita relacionada ao servidor da AMD; a receita do cliente envolve principalmente desktops e computadores pessoais, que costumavam ser um dos principais negócios da AMD, mas agora a proporção da receita não é alta; o negócio de jogos envolve principalmente o produto GPU linha, Sony, Microsoft é um grande cliente estável, o negócio incorporado vem principalmente do negócio Xilinx original.

À medida que a inteligência artificial se torna uma tendência, o data center se tornou um negócio que os grandes gigantes da nuvem atribuem grande importância e investem fortemente, e também é um campo de batalha para Nvidia, Intel e AMD.

Na reunião anterior do relatório financeiro do primeiro trimestre de 2023, a AMD enfatizou que a IA é atualmente o primeiro foco estratégico da empresa, e a AMD está comprometida em construir uma matriz de produtos de IA mais diversificada.

Ontem, a conferência de lançamento de produto da AMD foi pela primeira vez com o tema "inteligência artificial e data center". Su Zifeng enfatizou na coletiva de imprensa que, impulsionadas por modelos de linguagem em larga escala, as oportunidades de mercado para inteligência artificial estão aumentando e o potencial de mercado pode aumentar dos atuais US$ 30 bilhões para cerca de US$ 150 bilhões até 2027.

A AMD não quer perder este banquete de IA, mas a Nvidia é uma montanha que precisa ser superada.

No último relatório financeiro trimestral, a receita de negócios de data center da AMD foi de US$ 1,295 bilhão, em comparação com US$ 1,293 bilhão no trimestre anterior, basicamente sem crescimento. Por outro lado, a receita de negócios de data center da Nvidia no primeiro trimestre deste ano atingiu um recorde, alta de 14% em relação ao ano anterior, para US$ 4,28 bilhões, mais de três vezes a da AMD.

De acordo com o fundo de hedge quantitativo Khaveen Investments, a participação de mercado da GPU de data center da Nvidia chegará a 88% em 2022, e a AMD e a Intel dividirão o restante.

Embora a AMD seja um player antigo no mercado de GPU, seus produtos anteriores da série GPU foram usados principalmente nas áreas de processamento de imagem e raciocínio de IA, enquanto o treinamento de IA, que requer mais computação paralela, entrou no mercado posteriormente.

O lançamento do Instinct MI300 significa que a AMD está tentando mudar o domínio da Nvidia no mercado de treinamento de IA.

2. Entre no treinamento de IA

O Instinct MI300 é o primeiro "APU" de alto desempenho para o data center - um conceito pioneiro da AMD.

Em 2011 (o quinto ano após a aquisição da ATI pela AMD), a AMD comparou os cérebros esquerdo e direito de humanos com CPU e GPU em sua concepção de produto e, com base nisso, propôs uma estratégia de produto heterogênea "CPU+GPU" e a chamou de APU .

Análoga ao cérebro humano, a AMD acredita que o lado esquerdo do cérebro é mais como uma CPU, responsável pelo processamento lógico de informações, como operações seriais, números e aritmética, pensamento analítico, compreensão, classificação, ordenação, etc., enquanto o lado direito do cérebro é mais como uma GPU, responsável pela computação paralela, múltiplas modalidades, pensamento criativo e imaginação, etc.

Imagem da Huatai Research

No entanto, em 2011, a AMD estava no ponto mais baixo da "década perdida", seja na linha de CPU ou na linha de GPU, não conseguiu produzir produtos excelentes o suficiente e o desenvolvimento da APU não foi satisfatório.

Quando chegou a hora de março de 2020, a AMD lançou uma nova versão de microarquitetura CDNA, especialmente projetada para computação de alto desempenho e computação de IA em data centers. Antes disso, a GPU da AMD usava a mesma arquitetura para resolver as necessidades de jogos e cenários de computação ao mesmo tempo, o que não favorece a otimização de diferentes cenários.

Os produtos da série Instinct são projetados para computação de alto desempenho HPC e computação AI. O recém-lançado MI300 segue totalmente o Grace Hopper da Nvidia em termos de especificações e desempenho.

O Instinct MI300 adota o processo de 5 nm da TSMC e possui duas versões diferentes: o MI300X possui apenas GPU, projetado para treinamento de modelos de IA, e contém 153 bilhões de transistores; MI300A é uma combinação de várias CPUs, GPUs e memória de alta largura de banda A APU contém 146 bilhões de transistores .

A AMD afirma que o Instinct MI300 tem desempenho de IA 8 vezes maior do que o MI250 da geração anterior, o que pode reduzir o tempo de treinamento de modelos de IA muito grandes, como ChatGPT e DALL-E, de meses para semanas, economizando milhões de dólares em contas de eletricidade.

A AMD demonstrou o modelo Falcon do MI300x executando 40 bilhões de parâmetros na coletiva de imprensa, permitindo que ela escrevesse um poema sobre São Francisco. "Os modelos estão se tornando cada vez mais famintos por capacidade, e você realmente precisa de várias GPUs para executar os modelos de linguagem grandes mais recentes", disse Su, observando que com mais memória nos chips AMD, os desenvolvedores não precisarão de tanta.

A AMD ainda não anunciou o preço do MI300, mas a administração afirmou na teleconferência de resultados do FY23T1 que os produtos de data center continuarão com o estilo de preço econômico anterior, com foco na abertura do mercado primeiro.

A AMD espera que o MI300 seja lançado até o final deste ano e será instalado no supercomputador exascale EI Capitan do Lawrence Livermore National Laboratory e em outros modelos de IA de clientes em nuvem de grande escala.

O analista do Morgan Stanley, Joseph Moore, deu uma orientação otimista, dizendo que a AMD tem visto "pedidos estáveis" de clientes, e a receita relacionada à IA da empresa em 2024 deve chegar a US$ 400 milhões, podendo até chegar a US$ 1,2 bilhão - essa expectativa é 12 vezes mais do que antes.

No entanto, embora a AMD seja quase a única empresa capaz de desafiar a Nvidia, deve ser um processo muito difícil.

3. Fosso da Nvidia

Após o lançamento do produto AMD, o mercado de capitais respondeu medíocremente, o preço das ações da AMD caiu mais de 3%, ao contrário, o preço das ações da Nvidia subiu 3,9% e seu valor de mercado ultrapassou um trilhão de dólares americanos novamente.

Aos olhos dos investidores, o chip anual MI300 da AMD ainda parece difícil de abalar os alicerces da Nvidia.

Por exemplo, a AMD não revelou na conferência quais os principais clientes que recebeu suporte para seu chip anual. Kevin Krewell, principal analista da TIRIAS Research, disse: "Acho que nenhum (grande cliente) indicou que usará MI300X ou MI300A, o que pode desapontar Wall Street. Eles esperam que a AMD anuncie que já fez alguns sábio substituiu a Nvidia."

Os clientes atualmente divulgados são apenas o unicórnio em grande escala de código aberto Hugging Face e o Lawrence Livermore National Laboratory divulgado anteriormente. Mas os dois não são da mesma ordem de grandeza dos gigantes da nuvem que têm maior demanda por chips de data center.

Em termos de desempenho do chip em si, embora o MI300 supere a Nvidia em alguns parâmetros, como o número de transistores ser maior que os 54 bilhões do A100, a Nvidia poderá em breve compensar isso por meio de iterações de produto.

Na verdade, a Nvidia já está fazendo isso. Em 29 de maio, duas semanas antes da conferência da AMD, a Nvidia lançou oficialmente o novo superchip GH200 Grace Hopper na conferência pré-show COMPUTEX 2023, com 200 bilhões de transistores, superior ao MI300.

Mais importante, a Nvidia também anunciou que Google, Microsoft e Meta serão os primeiros grandes clientes a adotar este super chip.

**Além do excelente produto em si, o outro fosso inexpugnável da Nvidia é sua ecologia CUDA. **

A NVIDIA lançou o ecossistema CUDA em 2007. Ao usar o CUDA, os desenvolvedores podem usar a GPU da Nvidia para processamento geral de computação, não apenas processamento gráfico.

CUDA fornece uma interface de programação intuitiva que permite aos desenvolvedores escrever código paralelo em C, C++, Python e outras linguagens.

O mestre de AI Wu Enda comentou certa vez sobre isso: "Antes do surgimento de CUDA, pode não haver mais de 100 pessoas no mundo que podem usar a programação de GPU. Depois de ter CUDA, usar GPU tornou-se uma coisa muito fácil."

A AMD lançou o ROCm em 2016 com o objetivo de estabelecer um ecossistema que possa substituir o CUDA. Em 2023, os desenvolvedores CUDA chegarão a 4 milhões, incluindo grandes clientes corporativos como a Adobe. Quanto mais usuários, melhor a aderência.Levará tempo para o ROCm, que começou tarde, construir um ecossistema de desenvolvedores.

"Embora a AMD seja competitiva em termos de desempenho de hardware, as pessoas ainda não acreditam que as soluções de software da AMD possam competir com a Nvidia", disse Anshel Sag, analista da Moor Insights & Strategy.

Este é um fosso exclusivo pertencente à Nvidia. É extremamente desafiador para a AMD romper.

4. O sucesso da AMD pode ser difícil de replicar

Para a AMD, talvez o menos temido seja encarar o desafio.

De 2006 a 2016, foi a "década perdida" da AMD. Durante esse período, os dois maiores concorrentes da AMD, Intel e Nvidia, estão passando por iterações de produtos impulsionadas pela Lei de Moore.

A Intel pratica a "estratégia do pêndulo Tick-Tock" e faz uma grande atualização iterativa do produto a cada dois anos (processo de um ano, design de microarquitetura de um ano); Dobrando o desempenho em 6 meses - sob a orientação da empresa, o produto será atualizado a cada seis meses.

A AMD não conseguiu acompanhar o ritmo de atualização de produtos dos dois líderes do setor, e o desenvolvimento da empresa estava à beira do colapso até Su Zifeng assumir o cargo de quinto CEO da AMD em 2014.

A AMD que Su Lifeng acabou de assumir está uma bagunça. Seu mercado de notebooks é ocupado pela Intel, o mercado emergente de smartphones é dividido por Nvidia, Qualcomm e Samsung, e a participação no mercado de servidores encolheu de 1/4 do original para apenas 2%. A AMD teve que demitir cerca de um quarto de seus funcionários, e o preço de suas ações girava em torno de US$ 2, e os analistas diziam que era "ininvestível".

Naquela época, o CEO da Intel, Ke Zaiqi, comentou sobre a AMD: "Esta empresa nunca mais voltará, então não se importe de focar no novo concorrente Qualcomm."

Mas todo mundo conhece a história depois disso. Sob a liderança de Su Zifeng, a AMD lutou por uma bela reviravolta no mercado de CPUs. Não apenas corroeu gradualmente a participação de mercado da Intel, mas o preço de suas ações também ultrapassou historicamente a Intel em fevereiro de 2022.

A razão pela qual a AMD conseguiu entrar no mercado de CPU é que ela aproveitou os erros estratégicos de sua rival Intel.

No elo de fabricação de chips, AMD e Intel escolheram caminhos diferentes. A AMD vendeu seu negócio de fabricação de chips em 2009, estabeleceu uma joint venture com a fundição independente Gexin e focou apenas no design de chips (Fabless), o que permitiu à AMD escolher uma fundição terceirizada independente (Foundry). A Intel integra o design e a fabricação de chips (IDM) desde o início.

Nos primeiros dias do desenvolvimento da indústria de semicondutores, um IDM altamente integrado verticalmente como a Intel era o modelo mais popular. O co-fundador da AMD, Jerry Sanders, também disse um ditado famoso: “Homens de verdade têm fabs.” Mas, ironicamente, a AMD teve a oportunidade de completar o contra-ataque precisamente porque mais tarde desfez-se do fab .

Depois de 2014, o processo de fabricação de chips da Intel encontrou dificuldades técnicas, e a taxa de rendimento dos chips de 10nm (equivalente a 7nm da TSMC) não era boa, o que levou a vários atrasos na produção em massa de 10nm originalmente programada para o segundo semestre de 2016, e foi finalmente lançado no segundo semestre de 2019. A estratégia Tick-Tock na qual a Intel vinha insistindo antes também foi abandonada por motivos de tecnologia de processo.

O fundador da Intel, Gordon Moore, propôs a Lei de Moore, mas a Intel agora está sofrendo com a "maldição da Lei de Moore". Isso permite que a AMD aproveite a oportunidade para ultrapassar.

Em 2018, a AMD cooperou pela primeira vez com a GlobalFoundries para lançar a arquitetura Zen+ com um processo de 12nm, superando a Intel com um processo de 14nm pela primeira vez. Então, em 2019, a AMD cooperou com a TSMC para lançar a arquitetura Zen 2 do processo de 7 nm (equivalente aos 10 nm da Intel), líder da Intel. Desde então, a Intel ficou atrás da AMD em termos de processo de fabricação e não melhorou até agora.

Hoje, um cenário semelhante de "o segundo filho desafia o chefe" parece ser reencenado, mas o campo de batalha mudou da CPU para a GPU. Embora a AMD ainda seja a AMD liderada por "Su Ma", a Nvidia liderada por Huang Renxun é mais popular do que a Intel naquela época.

No Vale do Silício, Huang Renxun é conhecido como um homem agressivo. Ele gosta de usar roupas de couro preto e está sempre pronto para revidar. Quando o preço das ações subiu para US$ 100, ele até tatuou o logotipo da Nvidia em seu braço.

Em 2016, Huang Renxun não levou a AMD a sério, ele comentou diretamente que havia uma lacuna de "9 e 0" entre a Nvidia e a AMD. No início de 2019, a AMD correu para lançar a placa gráfica de 7nm antes da Nvidia. Huang Renxun parecia não se importar com isso na superfície e disse diretamente que "esta placa gráfica é muito comum".

Hoje, a AMD mais uma vez desafiou a Nvidia com produtos melhores. De um lado está a presunçosa AMD e do outro está a Nvidia, que busca a derrota para Dugu.Uma guerra de GPU contra a inteligência artificial acaba de começar.

Ver original
O conteúdo serve apenas de referência e não constitui uma solicitação ou oferta. Não é prestado qualquer aconselhamento em matéria de investimento, fiscal ou jurídica. Consulte a Declaração de exoneração de responsabilidade para obter mais informações sobre os riscos.
  • Recompensa
  • Comentar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Pino
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate.io
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)