Nvidia começou a vender métodos para fazer pás

Autor: Ada, Deep Tide TechFlow

São Francisco, Centro de Convenções de San Jose, GTC ao vivo.

O principal cientista da Nvidia, Bill Dally, está no palco, de frente para Jeff Dean, do Google. Os dois conversam quando Dally lança um número: “Anteriormente, migrar um conjunto padrão de unidades contendo cerca de 2500 a 3000 unidades levava uma equipe de 8 engenheiros cerca de 10 meses.”

Ele faz uma pausa.

“Agora, basta uma única GPU de placa única, rodando uma noite.”

Não há exclamações na plateia, pois quem entendeu essa frase sabe exatamente o que ela significa. O trabalho de 8 engenheiros por 10 meses foi consumido por uma GPU produzida internamente em uma única noite. E Dally ainda acrescenta: os resultados obtidos em área, consumo de energia e atraso, igualam ou até superam o design humano.

No dia seguinte, as notícias interpretaram como “Nvidia usa IA para projetar GPUs”.

Mas a verdade por trás disso é muito mais interessante do que o título das notícias.

O que a Nvidia está fazendo internamente?

O que a Nvidia está rodando internamente não é uma caixa preta, mas várias cadeias de ferramentas que foram aprimoradas ao longo de anos.

NB-Cell é um programa baseado em aprendizado por reforço, dedicado à tarefa árdua de migrar conjuntos padrão de unidades. Prefix RL visa resolver um problema de pesquisa de longo prazo na colocação de fases de avanço em cadeias de previsão de avanço. Dally afirma que o layout gerado por esse sistema “é algo que os humanos nunca conseguiriam imaginar”, e que, em comparação com o design humano, os principais indicadores melhoraram cerca de 20% a 30%.

Além disso, há dois LLMs internos, Chip Nemo e Bug Nemo. A Nvidia alimenta esses dois grandes modelos com o código RTL de cada GPU, documentação de arquitetura e especificações de design ao longo da história. Segundo Dally, isso equivale a destilar a memória muscular de vinte anos da Nvidia, de G80 a Blackwell, em um modelo interno, de modo que um novato possa se conectar diretamente a vinte anos de experiência de engenheiros veteranos.

Então, “IA pode projetar GPUs”?

Muito pelo contrário. Dally diz: “Gostaria muito de um dia poder simplesmente dizer ‘me dê uma GPU nova para projetar’, mas ainda estamos longe disso.”

A Nvidia não usou IA para projetar uma GPU. Mas fez outra coisa que, no futuro, impedirá que toda a indústria funcione sem ela.

Compra de 2 bilhões de dólares na área de EDA

Em 1º de dezembro de 2025, a Nvidia adquiriu por 2 bilhões de dólares uma participação na Synopsys, uma das três maiores empresas de EDA. As duas partes assinaram um acordo de desenvolvimento conjunto, integrando a pilha de computação acelerada da Nvidia ao fluxo de trabalho completo de EDA da Synopsys, com o Blackwell e a próxima geração de GPUs Rubin sendo profundamente integrados ao Synopsys.ai.

A posição da Synopsys precisa de explicação. Quase todas as chips avançadas de processo, como a série M da Apple, AMD MI, Google TPU, são projetadas quase inteiramente usando as ferramentas da Synopsys ou Cadence. Essas duas empresas, junto com a Siemens EDA, monopolizam as ferramentas de base para o design de chips. Você pode usar chips da Qualcomm ou a linha de produção da TSMC, mas não consegue escapar do software dessas três empresas.

Três meses após a aquisição da Synopsys, a Nvidia trouxe também Cadence, Siemens e Dassault, anunciando que todas estão desenvolvendo ferramentas de design de chips baseadas em GPUs Nvidia com IA.

Os dados de benchmark divulgados pela Nvidia são impressionantes: a PrimeSim da Synopsys é quase 30 vezes mais rápida no Blackwell, Proteus é 20 vezes mais rápido, e o Sentaurus no B200 é 12 vezes mais acelerado em comparação com CPU. MediaTek usa H100 para acelerar em 6 vezes o Cadence Spectre. Astera Labs usa Synopsys + Nvidia para acelerar a validação de chips em 3,5 vezes.

Um detalhe que merece destaque: a plataforma Millennium M2000 da Cadence, que é “exclusivamente baseada na Nvidia Blackwell para o mercado de EDA”.

A palavra “exclusivamente” é a mais importante. Ou seja, as ferramentas de EDA antes rodavam em CPUs, e tanto a Qualcomm quanto a TSMC podiam usá-las. No futuro, para usar a ferramenta de EDA mais rápida, só será possível comprando uma GPU da Nvidia.

A verdadeira forma do volante

A maioria das pessoas entende o volante da Nvidia assim: vende GPUs para empresas de IA, que treinam grandes modelos, esses modelos provam que GPUs são insubstituíveis, e assim mais pessoas compram GPUs.

Esse ciclo já é assustador. Mas há uma camada abaixo dele.

A Nvidia usa suas próprias ferramentas para projetar a próxima geração de GPUs, aumentando a eficiência de design entre gerações, e ao mesmo tempo vinculando toda a cadeia de ferramentas de EDA do setor ao seu hardware. Os concorrentes querem acompanhar, mas até as ferramentas que usam precisam ser alugadas do ecossistema da Nvidia.

Por trás do relatório que fez a ação da AMD despencar, está essa ansiedade. Mesmo que a Nvidia e a Synopsys digam que “não há obrigação de comprar hardware Nvidia ao investir”, o mercado sabe: as funções avançadas de EDA são lançadas primeiro em hardware Nvidia, e AMD e Intel só podem depender de uma rota de “otimização para a plataforma do maior rival”.

Imagine que, no futuro, engenheiros da AMD queiram projetar uma GPU comparável ao Blackwell. Ao abrir as ferramentas da Synopsys, elas funcionam mais rápido na GPU da Nvidia. Então, eles terão que aceitar um ciclo de design duas vezes mais lento ou comprar várias GPUs da Nvidia para projetar uma GPU que supere a Nvidia.

A pá ainda está vendendo, mas o modo de vender mudou.

A situação real das GPUs nacionais

Aqui, é preciso apresentar alguns números que trazem clareza.

No mesmo ano em que a Nvidia atingiu um lucro líquido de mais de 70 bilhões de dólares em 2025, as “quatro pequenas” de GPUs nacionais — Moore Threads, Muxi, Biren e Suiyuan — estavam na fila para IPO.

O prospecto da Moore Threads mostra que, de 2022 a 2024, a empresa acumulou uma perda líquida de 5 bilhões de yuans, e no primeiro semestre de 2025 perdeu mais 271 milhões de yuans, totalizando uma perda acumulada de 1,478 bilhões de yuans até 30 de junho. A gestão estima que só em 2027 a empresa poderá alcançar lucro consolidado. A Muxi tem uma situação um pouco melhor, com perdas acumuladas de mais de 3 bilhões de yuans em três anos. A mais problemática é a Biren, que perdeu mais de 6,3 bilhões de yuans em três anos e meio, e sua receita no primeiro semestre de 2025 foi de apenas 5,89 milhões de yuans, muito abaixo dos 70,2 milhões de yuans da Moore Threads no mesmo período.

Quanto ao investimento em P&D, a Moore Threads gastou em 2022 uma porcentagem de 2422,51% da receita, e em 2024 ainda mantém um índice de 309,88%. O dinheiro gasto em P&D por ano é mais de três vezes a receita. Isso não é gestão empresarial, é uma transfusão contínua de sangue, sustentada pelo mercado de ações e pelo recente acesso ao STAR Market.

No nível de ferramentas, a situação é ainda mais crítica. O prospecto da Huada Jiutian de IPO em 2022 mostra que suas ferramentas suportam apenas parcialmente o processo de fabricação em 5nm. A GigaDevice consegue cobrir processos de 7nm, 5nm e 3nm, mas só faz ferramentas pontuais, sem uma cobertura completa do fluxo de trabalho.

O fundador da Huada Jiutian, Liu Weiping, admite abertamente: “O suporte do EDA nacional para processos avançados ainda é claramente insuficiente, especialmente para 7nm, 5nm e 3nm. Atualmente, o EDA nacional consegue suportar até 14nm. Embora tenhamos domínio sobre a tecnologia de 7nm, a integração profunda do 7nm com aplicações reais ainda requer esforço coordenado de toda a cadeia industrial.”

Ou seja, o EDA de fluxo completo para processos avançados ainda é praticamente inviável nacionalmente. As empresas de GPU nacionais ainda usam ferramentas da Synopsys e Cadence para projetar chips. Em 2025, o ex-presidente Trump anunciou controles de exportação para softwares críticos, embora sem implementação concreta, e as ferramentas de EDA para processos abaixo de 7nm continuam sob rígido controle. A liberação dessas licenças depende de terceiros.

A reação do mercado de capitais é surreal. No dia do IPO da Muxi, a ação fechou a 829,9 yuans, com alta de 692,95% no dia. A Moore Threads, após o IPO, chegou a ser a terceira maior ação da A-share, atrás apenas de Kweichow Moutai e Cambrian, com valor de mercado estimado em cerca de 359,5 bilhões de yuans, segundo cálculos baseados no preço na época.

Por trás desses números, está um negócio real: empresas que ainda queimam dinheiro, que dependem de ferramentas controladas por outros países para continuar projetando chips, sendo avaliadas no mercado secundário como “futuras Nvidia nacionais”.

E as ferramentas que essas empresas usam para projetar chips estão se tornando parte do ecossistema da Nvidia. A ligação de 2 bilhões de dólares com a Synopsys, a etiqueta “exclusivamente baseada na Nvidia Blackwell” no Cadence Millennium M2000, transformam a corrida por essa tecnologia em um paradoxo.

Uma cadeia completa do projeto à fabricação

Voltando à conversa na GTC.

Dally foi bastante humilde: “A IA ainda está longe de projetar chips por conta própria”, essa frase a Nvidia já repete há quatro ou cinco anos. Mas a forma de falar vem mudando. Quatro anos atrás era “IA pode ajudar no design”, três anos atrás era “IA pode automatizar algumas etapas”, e este ano é “em uma noite, fazer o trabalho de 8 pessoas em 10 meses”. Cada ano, uma evolução; cada ano, uma frase de que “ainda estamos longe do objetivo final”. Quando olhamos para trás, o que parecia distante há três anos, agora foi alcançado, e o que ainda parece distante é definido pelo que os concorrentes ainda não conseguem fazer.

Nos últimos doze meses, a Nvidia fez basicamente uma coisa: aplicar IA nas partes mais valiosas e com maior barreira de entrada na cadeia de produção de chips, e vender essas ferramentas camada por camada para toda a indústria.

Na ponta do design de chips, a IA do Chip Nemo assume o controle; na migração de conjuntos padrão de unidades e otimização de layout, NB-Cell e Prefix RL lideram; toda a cadeia de ferramentas de EDA, vinculada ao GPU da Nvidia por meio de um investimento de 2 bilhões de dólares na Synopsys e pelo “exclusivo baseado na Blackwell” do Cadence; na fabricação, o cálculo de litografia é feito pelo cuLitho, já em uso na TSMC.

De projeto a fabricação, cada etapa foi refeita com IA pela Nvidia. E todas convergem para um mesmo ponto: para usar a ferramenta mais rápida, você precisa comprar a GPU da Nvidia.

Para qualquer concorrente que queira projetar uma GPU capaz de superar a Blackwell, o que já aconteceu, a situação é embaraçosa. As ferramentas de EDA mais rápidas para projetar essa GPU estão na GPU da Nvidia; o cálculo de litografia mais rápido para fabricá-la vem de uma biblioteca de algoritmos da Nvidia; o poder de computação para treinar a IA de design também é da Nvidia.

Quem você quer derrotar, está te alugando todas as ferramentas necessárias para vencê-lo. O aluguel é anual, e o preço sobe a cada contrato renovado.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar