Discurso completo de Jensen Huang na GTC2026: A procura de IA atinge biliões de dólares, a potência computacional salta 350 vezes, OpenClaw permite que cada empresa se torne AaaS

動區BlockTempo
FET-2,55%

A CEO da NVIDIA, Jensen Huang, anunciou na GTC 2026 a “demanda de pelo menos 1 trilhão de dólares até 2027”, e usou fábricas de tokens, o sistema CUDA, o sistema monstruoso Vera Rubin, o sistema operacional de agentes OpenClaw para traçar o plano da próxima década da NVIDIA.
(Resumindo: Jensen Huang na GTC falou sobre “DLSS 5, NemoClaw” e acendeu a chama da IA: FET subiu 20%, NEAR, Worldcoin atingiram máximos recentes)
(Complemento: O Ministério da Segurança Nacional da China alertou sobre “criação de lagostas”: OpenClaw tem quatro minas terrestres de segurança, seu dispositivo pode ser invadido)

Índice do artigo

Alternar

  • Abertura: o efeito de volante de vinte anos do CUDA
  • Economia da fábrica de tokens: data centers deixam de armazenar arquivos e passam a produzir tokens
  • Vera Rubin: 350 vezes em dois anos, isso não é a Lei de Moore, é uma curva diferente
  • Verdadeira intenção da aquisição da Groq: tornar o rápido mais rápido, o caro mais caro
  • DLSS 5: a era da computação gráfica chega ao seu momento GPT
  • OpenClaw: o sistema operacional da era dos agentes inteligentes
  • O futuro de cada engenheiro com orçamento de tokens
  • IA física e exército de robôs
  • Próxima geração: arquitetura Feynman + data center espacial

Em 16 de março de 2026, a NVIDIA abriu sua conferência GTC, e Jensen Huang subiu ao palco e disse uma frase que silenciou a audiência: “No ano passado, falei de uma demanda de 500 bilhões de dólares com alta confiança. Agora, neste exato momento, vejo um número de pelo menos 1 trilhão de dólares. E tenho certeza de que a demanda real é ainda maior.”

Ao dizer isso, o preço das ações da NVIDIA subiu mais de 4,3% no mesmo dia. Mas Jensen Huang não estava apenas reportando números; passou toda a palestra explicando de onde vinha esse 1 trilhão de dólares e por que ainda não era suficiente.

Abertura: o efeito de volante de vinte anos do CUDA

O ponto de partida da palestra foi a especialidade da NVIDIA — CUDA. Este ano marca o 20º aniversário do CUDA, e Jensen Huang o descreveu como a “lógica estratégica de 100%” da NVIDIA.

Resumindo: CUDA é a tecnologia que permite aos desenvolvedores programar GPUs. Quando surgiu há vinte anos, ninguém tinha certeza do sucesso, mas a NVIDIA investiu grande parte de seus recursos para sustentá-lo. Agora, olhando para trás, essa decisão criou uma barreira quase inimitável — bilhões de GPUs rodando CUDA ao redor do mundo, dezenas de milhares de projetos open source dependentes dele, e todos os provedores de nuvem integrando essa tecnologia.

Jensen Huang chama isso de “volante”: grande volume de máquinas → atrai desenvolvedores → eles criam novos algoritmos → avanços nos algoritmos abrem novos mercados → expansão do mercado aumenta o volume de máquinas → o volante continua girando. Ainda melhor, a NVIDIA continua otimizando o software; por exemplo, a arquitetura Ampere, de seis anos atrás, ainda tem preços de aluguel na nuvem que sobem — porque mais aplicações estão rodando nela, e elas valem cada vez mais.

Economia da fábrica de tokens: data centers deixam de armazenar arquivos e passam a produzir tokens

Este é o conceito central da palestra de Jensen Huang, e a lógica-chave para explicar a demanda de 1 trilhão de dólares.

Simplificando: no passado, data centers eram “depósitos”, usados para guardar arquivos e dados; no futuro, serão “fábricas”, produzindo a unidade básica de IA — tokens (que podem ser entendidos como as menores unidades de pensamento e fala da IA).

Jensen Huang diz que cada data center é limitado pela energia: uma instalação de 1 GW (gigawatt) nunca se tornará de 2 GW, isso é uma lei física. Então, a questão central da competição é: com a mesma energia, quem consegue produzir mais tokens? Quem tem maior throughput de tokens por watt, quem tem menor custo de produção, vence.

Tokens terão preços por camadas, como classe executiva e econômica:

  • Camada gratuita (alto throughput, baixa velocidade)
  • Camada intermediária (cerca de 3 dólares por milhão de tokens)
  • Camada avançada (cerca de 6 dólares por milhão de tokens)
  • Camada de alta velocidade (cerca de 45 dólares por milhão de tokens)
  • Camada ultrarrápida (cerca de 150 dólares por milhão de tokens)

Em outras palavras, com uma GPU, Jensen Huang recomenda distribuir sua potência entre diferentes níveis de serviço — quanto maior o throughput e mais rápida a velocidade, maior o lucro. Ele estima que, em relação à geração Hopper, o novo sistema Grace Blackwell pode gerar até 5 vezes mais receita com a mesma potência.

Vera Rubin: 350 vezes em dois anos, isso não é a Lei de Moore, é uma curva diferente

Jensen Huang diz que, ao falar da geração Hopper, poderia mostrar uma única peça de chip; mas, ao falar de Vera Rubin, pensa-se no sistema completo.

Dados: em um data center de 1 GW, a taxa de geração de tokens passou de 22 milhões por segundo para 700 milhões por segundo, um aumento de 350 vezes em dois anos. Em comparação, a Lei de Moore só traz cerca de 1,5 vezes de aumento no mesmo período.

Como é esse sistema monstruoso? Vera Rubin é totalmente líquido, elimina cabos tradicionais, e um rack que levava dois dias para ser instalado agora leva duas horas. Microsoft Azure confirmou que seu primeiro rack Vera Rubin está em operação.

Verdadeira intenção da aquisição da Groq: tornar o rápido mais rápido, o caro mais caro

A integração da tecnologia da Groq não visa substituir as GPUs próprias, mas fazer “inferência assimétrica” — ou seja, dividir a inferência de IA em duas etapas, usando a ferramenta mais adequada para cada uma.

A chip da Groq tem muita SRAM de alta velocidade (500MB), muito rápida, mas pouca memória, ideal para a etapa final de geração de tokens. A Vera Rubin tem muita memória (288GB), adequada para cálculos iniciais em grande escala e cache.

A NVIDIA usa o software Dynamo para conectar as duas: a “pré-carregamento” e o mecanismo de atenção na decodificação ficam na Vera Rubin, enquanto a geração de tokens sensível à latência fica na Groq. As duas se conectam por Ethernet, reduzindo a latência geral em cerca de 50%.

Jensen Huang também recomenda: se o trabalho for principalmente de alto throughput, use 100% Vera Rubin; se precisar de geração de código de alto valor, reserve cerca de 25% do data center para Groq. Os chips LP30 da Groq, fabricados pela Samsung, começarão a ser entregues no terceiro trimestre.

DLSS 5: a era da computação gráfica chega ao seu momento GPT

Jensen Huang diz que, há dez anos, a GeForce trouxe IA para o mundo todo; agora, a IA está remodelando a computação gráfica. Ele chama essa nova tecnologia de “Neural Rendering” (Renderização Neural), ou seja, DLSS 5.

A ideia central é combinar gráficos 3D determinísticos (com estrutura clara e controle preciso) com a estética probabilística da IA generativa. Dados estruturados garantem controle, enquanto a IA torna a imagem mais bonita do que a realidade. Jensen Huang afirma que essa fusão de “dados estruturados + IA generativa” será repetida em várias indústrias.

OpenClaw: o sistema operacional da era dos agentes inteligentes

Peter Steinberger criou o OpenClaw, que Jensen Huang chama de “o projeto open source mais popular da história, que em semanas superou os 30 anos de conquistas do Linux”.

O que é o OpenClaw? Em linguagem simples: permite que agentes de IA gerenciem recursos, chamem ferramentas, leiam e escrevam arquivos, executem tarefas agendadas e dividam grandes problemas em tarefas menores, distribuídas a sub-agentes — como um sistema operacional que faz os programas rodarem no computador, mas para IA em ambientes empresariais.

Jensen Huang diz: “Cada SaaS será uma AaaS.” Ou seja, empresas de software não venderão mais apenas ferramentas, mas serviços de agentes de IA que fazem o trabalho por você.

Porém, há um desafio: esses agentes podem acessar dados sensíveis e executar códigos, o que precisa de controle rigoroso no ambiente corporativo. Para isso, a NVIDIA lançou o NeMo Claw, uma referência empresarial com mecanismos de estratégia e roteadores de privacidade, garantindo a implementação segura dos agentes na empresa.

Cada engenheiro terá um orçamento de tokens no futuro

Jensen Huang faz uma previsão concreta: “No futuro, cada engenheiro na empresa precisará de um orçamento anual de tokens. Eles terão um salário de dezenas de milhares de dólares, e eu lhes darei uma cota de tokens equivalente a metade do salário, para multiplicar por 10 sua produtividade.”

Ele afirma que isso não é uma metáfora, mas uma métrica de competitividade futura: quanto mais tokens você fornecer a um engenheiro, mais valor ele poderá criar. Cada empresa será tanto consumidora quanto produtora de tokens.

IA física e exército de robôs

Jensen Huang diz que as inteligências digitais atuam no mundo digital, enquanto a IA física é a inteligência incorporada — ou seja, robôs.

Na GTC deste ano, foram apresentados 110 robôs, abrangendo quase todas as empresas de pesquisa e desenvolvimento de robótica do mundo.

Na direção de veículos autônomos, Jensen Huang anunciou que BYD, Hyundai, Nissan e Geely se juntaram à plataforma RoboTaxi Ready da NVIDIA, com uma produção anual combinada de 18 milhões de veículos, além de Mercedes-Benz, Toyota e GM. A NVIDIA também anunciou parceria com Uber para implantar e integrar veículos RoboTaxi em várias cidades.

Na parte final, o robô Olaf, da Disney, subiu ao palco, usando o chip Jetson como cérebro, aprendendo a andar no Omniverse, e usando o Newton para simular a física do mundo real. Jensen Huang brincou: “Achei que fosse mais alto. Nunca vi um boneco de neve tão baixo.”

Próxima geração: arquitetura Feynman + data center espacial

No encerramento, Jensen Huang revelou a próxima arquitetura de computação, Feynman, que suportará por primeira vez cabos de cobre e fibra óptica em uma mesma plataforma, com expansão horizontal.

Mais além, imagina-se o “Vera Rubin Space-1” — um data center no espaço, levando o poder de computação de IA além da Terra.

Jensen Huang resumiu a palestra em quatro pontos: o ponto de inflexão na inferência, a era das fábricas de IA, a revolução dos agentes OpenClaw, a implementação em escala da IA física. E 1 trilhão de dólares é apenas o começo.

Ver original
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.
Comentário
0/400
Sem comentários