Cortina de silício - ForkLog: criptomoedas, IA, singularidade, futuro

чипы памяти# Cortina de Silício

Placas gráficas, memória RAM, SSD — o que vem a seguir?

A era da abundância digital, em que qualquer entusiasta podia montar um servidor doméstico capaz de competir com as capacidades de uma pequena empresa, está a chegar ao fim. A posse de hardware próprio e avançado torna-se cada vez mais uma questão de elitismo, face ao aumento dos preços dos chips de memória e às filas de pré-encomenda.

No novo artigo da ForkLog, analisamos por que as placas gráficas se tornaram um recurso para a indústria de IA, por que a Nvidia já não gosta de gamers, e por que freelancers e designers precisam de alugar potência em centros de dados na nuvem. Mas a principal questão que tentámos responder é: como é que a escassez de chips afetará a descentralização da blockchain, onde SSDs e DRAM desempenham, na maioria dos casos, um papel fundamental.

Tecno-feudalismo ou dificuldades temporárias

Recentemente, pelos discursos de líderes da indústria de IA e fabricantes de microchips de memória, parece que a era de possuir um computador pessoal potente (PC) está a chegar ao fim.

No espaço de informação, discute-se ativamente a intervenção do fundador da Amazon, Jeff Bezos, em 2024, ao comparar o uso de PCs com um gerador de eletricidade na era da eletricidade centralizada nas tomadas. Parte da comunidade vê nele um visionário na situação atual.

Os modelos mais recentes de hardware tornaram-se o principal recurso computacional para treinar e manter Large Language Models (LLMs). A IA está a esgotar os stocks de microchips HBM, cuja capacidade antes era destinada ao segmento de SSDs e memória RAM. Como resultado do aumento dos preços dos componentes, o mercado poderá perder, já este ano, uma categoria inteira de dispositivos económicos.

No início de fevereiro, os investigadores da TrendForce aumentaram as previsões de preços dos chips. Esperam um aumento de 90–95% nos contratos de memória DRAM para consumidores já no primeiro trimestre de 2026, devido ao boom do setor de IA. A previsão anterior era de 55–60%.

Além disso, o treino de LLMs exige volumes colossais de dados. O setor empresarial adquiriu stocks de SSDs de pelo menos 2 TB com alta resistência de escrita. Fabricantes de chips de silício, cujo negócio de IA garante maiores lucros, planeiam reorganizar as suas capacidades de produção.

No final de 2025, a líder na produção de microchips de memória, a Micron Technology — anteriormente uma das principais defensoras da manutenção do segmento de desktops — anunciou o encerramento da linha de produtos para consumidores Crucial. A produção será encerrada no segundo trimestre de 2026, após quase 30 anos de existência da marca.

A Micron também planeia aumentar a produção de microchips HBM. A empresa investiu 9,6 mil milhões de dólares na construção de novas instalações em Hiroshima, no Japão.

Em 12 de fevereiro, a Samsung Electronics anunciou o início do fornecimento de chips HBM4 avançados a clientes não revelados. Assim, tenta reduzir a desvantagem face aos concorrentes na produção de componentes críticos para aceleradores de IA da Nvidia, incluindo a SK Hynix.

O maior fabricante mundial de microchips encontra-se numa posição difícil: é o principal fornecedor de memória para a Nvidia, ao mesmo tempo que lidera no segmento de smartphones e eletrónica de consumo. É importante para a empresa manter contratos de alta margem na IA, sem perder posições na produção de gadgets.

Em setembro do ano passado, a direção da Samsung Semiconductor tentou equilibrar a situação. A empresa confirmou que as linhas de produção de memória GDDR7 para placas gráficas topo de gama podem suportar tanto gamers e criadores de conteúdo, como estações de trabalho profissionais.

Estas microchips são usadas na flagship da linha gamer da Nvidia — GeForce RTX 5090. Apresentada em janeiro de 2025, a placa gráfica continua a ser líder indiscutível, embora o preço anunciado há um ano, de 1999 dólares, não corresponda à realidade atual. No momento da redação, as ofertas variam entre 4000 e 5000 dólares.

Fonte: Nvidia. O mercado altamente adaptável na China, como de costume, aproveita as oportunidades. Segundo a Nikkei Asia, os maiores fabricantes chineses de memória, CXMT e YMTC, estão interessados em expandir significativamente as suas capacidades.

Em 2027, planeiam lançar fábricas em Xangai e Wuhan, com foco principal na produção de DRAM e NAND, e não HBM, como fazem os líderes de mercado.

Alex Petrov, ex-CIO/CTO do grupo Bitfury e cofundador da Hyperfusion, acredita que não faz sentido esperar que os preços baixem, devendo antes redistribuir os custos.

«Não vale a pena esperar, vivemos aqui e agora. Se precisa de hardware para trabalhar, mineração ou um nó — compre agora, aceitando os preços elevados, e reserve o que puder dispensar temporariamente. A procura adiada até 2028 pode ser enorme e imprevisível, resta esperar pelos velhos DDR3/4 e pelo lançamento de novas DDR6», partilhou o especialista numa entrevista à ForkLog.

Por que placas gráficas?

Por que as placas gráficas, que em 2000 permitiam jogar Quake III Arena, e em 2015, Fallout 4, foram primeiro conquistadas pelo PoW-mining e depois absorvidas pela indústria de IA? A resposta está na especificidade dos aceleradores gráficos, que é mais fácil de explicar comparando-os com o CPU.

O CPU é um génio capaz de resolver qualquer tarefa de programação: escrever poesia, calcular impostos, gerir o sistema operativo. Mas as ações são executadas sequencialmente em cada núcleo.

Ao contrário, a GPU é uma fábrica com milhares de trabalhadores simples. Cada um deles é mais burro que um génio, mas consegue atuar em paralelo.

Para renderizar um quadro num jogo, é preciso calcular a cor de milhões de pixels. Isso equivale ao mesmo número de operações matemáticas por segundo. O chip gráfico foi criado para cálculos paralelos.

Situação semelhante ocorre na mineração PoW com placas gráficas. Mineração é uma espécie de lotaria, onde o dispositivo precisa de milhões de tentativas por segundo para encontrar o hash correto. As GPUs eram perfeitas para esse propósito, o que levou à primeira onda de escassez até à transição do Ethereum para PoS em 2022.

Os processadores gráficos tornaram-se uma verdadeira descoberta para a indústria de IA. Os atuais LLMs, como o ChatGPT ou Gemini, são essencialmente tabelas gigantes de números (matrizes). O seu treino consiste na multiplicação contínua dessas matrizes para ajustar os “pesos” (ligações entre neurónios).

A matemática que cria reflexos na água em Cyberpunk 2077 é a mesma álgebra linear que sustenta o treino de redes neurais. Mas a IA exige não só poder de cálculo, mas também uma velocidade de transmissão de dados colosal. A memória de vídeo comum para jogos não chega — foi substituída por HBM cara e escassa, hoje alvo de luta entre os gigantes tecnológicos.

A Nvidia percebeu a tendência a tempo e, desde a arquitetura Volta, começou a incluir nas placas “núcleos tensoriais”. Capazes de multiplicar matrizes simultaneamente, são dedicados exclusivamente a tarefas de IA.

GPU por hora e perda do offline

Na situação atual, durante pelo menos dois anos, produtores de conteúdo, videógrafos, designers, gamers, programadores, arquitetos de IA e todos cuja atividade depende de hardware potente terão que fazer uma escolha. Ou optam por alugar recursos na nuvem ou pagam fortunas por um upgrade do PC.

Devido à escassez e às filas por componentes, a procura por assinaturas de serviços de computação na nuvem está a crescer, tornando os centros de dados mais orientados ao cliente. Existem empresas que oferecem acesso flexível a computação e GPUs alugadas, como Lambda Labs, Vast.ai, Hyperfusion, LeaderGPU, Hostkey e outros.

O serviço RunPod oferece a possibilidade de usar a placa de topo RTX 5090 por 0,89 dólares por hora.

Fonte: Runpod. A plataforma Shadow fornece uma secretária remota sem limites na execução de jogos ou software profissional para engenheiros e designers. Serviços semelhantes, como GeForce Now ou Xbox Cloud, não oferecem essa liberdade, mas têm preços diferentes.

Fonte: Shadow. Já agora, com uma conexão estável, uma smart TV pode transformar-se numa estação de trabalho potente, bastando encomendar o hardware necessário. Assim, muitas possibilidades antes inacessíveis tornam-se acessíveis, embora toda a responsabilidade pela qualidade e funcionamento contínuo passe para os operadores dos data centers, que podem priorizar clientes mais importantes ou aplicar sanções.

Petrov destacou que os centros de dados garantem disponibilidade 24/7, alimentação de reserva, redundância de ligações e manutenção adequada.

«Ao mesmo tempo, pode guardar algo em casa ou no trabalho. Mas muitas vezes é mais caro e menos conveniente», acrescentou.

Segundo ele, muitos designers, editores de vídeo, produtores e artistas já estão a ser substituídos pela inteligência artificial. Em certo nível, precisam de recorrer a aplicações de IA especializadas, que o hardware doméstico não consegue suportar.

«À medida que os requisitos dos LLMs crescem exponencialmente, só é possível manter modelos pequenos em telemóveis ou em casa. Versões profissionais de grande escala requerem outro nível de escala, potência e velocidade, que os centros de dados na nuvem oferecem», explicou Petrov.

Bitcoin na linha da frente novamente

Todo o setor de TI depende de componentes, mas para a indústria de blockchain, a escassez de microchips representa uma ameaça real à descentralização e à redistribuição de poder.

«O aumento dos preços da memória é consequência de decisões de empresas comerciais. Os nós da blockchain não são os únicos afetados; todos os dispositivos com memória DDR5 — smartphones, PCs, tudo — estão a subir de preço. Isto obriga as blockchains a tornarem-se mais inteligentes e eficientes, procurando diferentes caminhos e soluções», afirma o cofundador da Hyperfusion.

Ele destacou o paradoxo da situação atual, em que as redes PoS enfrentam dificuldades:

«Proof-of-Stake reduziu o consumo de energia na mineração, mas transferiu a carga do eletricidade para a memória e discos para empresas e utilizadores. Com componentes a ficarem de 3 a 5 vezes mais caros, as cadeias PoS estão numa ‘tempestade perfeita’ da realidade».

Nos blockchains como Ethereum e Solana, funciona o princípio — «fácil de criar, mas extremamente caro de verificar». Com muitas nodos na rede e provas que ocupam de sete a nove passos, o limiar de entrada para validadores PoS é muitas vezes mais baixo para implementação, mas mais caro em custos operacionais.

Requisitos técnicos para operadores de nó Solana. Fonte: Solana Labs. Segundo Petrov, no Ethereum, cada nó deve manter acesso rápido a toda a base de dados de contas, contratos e saldos. São dezenas de milhões de objetos, que se atualizam constantemente. Para uma operação rápida, é necessária RAM de alta velocidade e SSD NVMe, agrupados em RAID.

Os nós devem processar cada bloco. Em redes de alta frequência (Solana — 400 ms, Ethereum — 12 s), é preciso um enorme recurso para verificar assinaturas e executar transações. Para nós completos de arquivo, as exigências são ainda maiores: uma nó de arquivo do Ethereum requer 128 GB de RAM e pelo menos 12 TB de SSD.

A redução da rentabilidade dos validadores, devido ao aumento dos custos dos componentes, cria um novo risco de centralização da blockchain. Em janeiro, o número diário de nós ativos na Solana caiu para 800 — o valor mais baixo desde 2021. Com o declínio do suporte a pequenos operadores, torna-se cada vez mais difícil cobrir custos de votação e infraestrutura, se não tiverem uma participação delegada suficiente.

Na altura, o índice Nakamoto da rede caiu para 19 (em 2023 era 33).

A Fundação Ethereum já discute iniciativas para reduzir a barreira de entrada de infraestrutura. Em maio de 2025, Vitalik Buterin propôs a atualização EIP-4444, que reduziria significativamente os requisitos de armazenamento. A ideia é que os nós guardem apenas o histórico de transações dos últimos 36 dias, mantendo o estado atual da rede e a estrutura Merkle. Assim, é possível diminuir o volume de armazenamento sem prejudicar a verificação do estado atual do blockchain.

Nessa nova realidade de “cortina de silício”, o Bitcoin mantém-se como a “blockchain do povo”.

«No Bitcoin, não há verificação de estado, apenas UTXOs, que podem ser facilmente cacheados. A fase de mineração PoW exige fazendas ASIC, enormes capacidades energéticas, mas a validação permanece extremamente leve. Verificar o resultado em PoW é simples e rápido, essa é a sua beleza. Os passos num nó validador: obter os dados do bloco, verificar o hash, uma ou duas operações de hash, comparar a meta/dificuldade, e está feito — sim ou não», explicou Petrov.

Por essas razões, um nó completo do Bitcoin pode funcionar até num servidor leve ou num computador de secretária, e por vezes até num Raspberry Pi novo com 4 a 8 GB de RAM. O impacto da escassez de memória nos nós PoW é mínimo. Os SSDs estão a subir de preço, mas volumes até 1 TB ainda estão acessíveis, acrescentou o especialista.

E o que vem a seguir?

Petrov acredita que a era do hardware pessoal ainda não acabou. Existem apenas diferentes abordagens e soluções para tarefas específicas:

«Gosto da citação “Cloud is someone else’s computer” — “A nuvem é apenas o computador de outra pessoa na rede”».

A indústria procura rapidamente soluções para a crise de microchips, desenvolvendo novas tecnologias:

  • memória magnetorresistiva MRAM (Magnetoresistive RAM), que é bastante não volátil. É cerca de 1000 vezes mais rápida que SSD e mais fiável que a memória convencional. Para 2026, começa a substituir a memória em sistemas críticos (automóveis, espaço);
  • CXL 3.1 (Compute Express Link). Permite que servidores partilhem a sua memória RAM através da rede. Uma solução para centros de dados, embora aumente a dependência do utilizador na nuvem.

A crise atual não é a primeira na história, mas é a mais estrutural. Antes, os chips de memória enfrentaram desafios semelhantes:

    1. Os EUA impuseram à Japão um acordo que estabelecia um teto de preços para chips de memória. Isso levou a um aumento de três vezes nos preços do DRAM em um ano. Fabricantes americanos de PCs (Commodore, Apple) quase faliram, e a Intel saiu do mercado de memória, focando-se em processadores;
    1. Inundações na Tailândia. Fábricas da Western Digital, que produziam 40% dos HDDs mundiais, foram inundadas. Os preços dispararam 190% e não voltaram ao normal durante dois anos.

O crescimento exponencial da IA impede uma previsão exata do comportamento futuro do mercado. A previsão de novas capacidades de produção até 2028 poderá aliviar a crise, se o ritmo de desenvolvimento se mantiver.

Se os agentes de IA se tornarem a base da economia, a procura por chips crescerá mais rápido que a sua produção. Assim, possuir um PC potente poderá tornar-se um hobby elitista, tão raro quanto possuir uma raça de cavalos de coleção. Independentemente do que o futuro nos reserva, troque a pasta térmica atempadamente.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Fixar

Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)