Rideau de silicium - ForkLog : cryptomonnaies, IA, singularité, avenir

чипы памяти# La paroi de silicium

Cartes graphiques, mémoire vive, SSD — et après ?

L’ère de l’abondance numérique, où n’importe quel passionné pouvait assembler chez lui un serveur capable de rivaliser avec les capacités d’une petite entreprise, touche à sa fin. La possession de matériel informatique avancé devient de plus en plus une marque d’élite face à la hausse des prix des puces mémoire et à l’allongement des files d’attente pour les précommandes.

Dans ce nouveau article, ForkLog explique pourquoi les cartes graphiques sont devenues une ressource pour l’industrie de l’IA, pourquoi Nvidia ne privilégie plus les gamers, et pourquoi les freelances designers doivent louer de la puissance dans des centres de données cloud. Mais la question principale à laquelle nous avons tenté de répondre : comment la pénurie de puces affectera la décentralisation de la blockchain, où SSD et DRAM jouent souvent un rôle clé.

Féodalisme technologique ou difficultés temporaires

Récemment, d’après les déclarations des leaders de l’industrie de l’IA et des fabricants de microcircuits mémoire, il semble que l’époque de la possession d’un PC personnel puissant touche à sa fin.

On discute activement dans l’espace médiatique de la déclaration de Jeff Bezos, fondateur d’Amazon, en 2024, qui comparait l’utilisation d’un PC à un générateur électrique à l’époque de l’alimentation électrique centralisée. Une partie de la communauté le considère comme un prophète dans la situation actuelle.

Les modèles récents de « matériel » deviennent la principale ressource de calcul pour l’entraînement et la maintenance des grands modèles de langage (LLM). L’IA vide les stocks de microcircuits HBM, dont la puissance appartenait auparavant au segment des SSD et de la mémoire vive. En conséquence, la hausse des prix des composants pourrait faire perdre cette année tout un segment d’appareils économiques.

Début février, les analystes de TrendForce ont revu à la hausse leurs prévisions concernant le prix des puces. Ils anticipent une augmentation de 90 à 95 % des contrats pour la mémoire DRAM grand public dès le premier trimestre 2026, en raison du boom dans le secteur de l’IA. La prévision précédente était de 55 à 60 %.

De plus, l’entraînement des LLM nécessite des volumes colossaux de données. Le secteur des entreprises a acheté des stocks de SSD de 2 To et plus, avec une haute endurance d’écriture. Les fabricants de puces en silicium, dont le service à l’industrie de l’IA génère des revenus plus élevés, prévoient une réorganisation de leurs capacités.

Fin 2025, Micron Technology, leader dans la fabrication de microcircuits mémoire — anciennement un des plus actifs défenseurs du segment desktop — a annoncé la fermeture de sa gamme de produits grand public Crucial. La production sera arrêtée au deuxième trimestre 2026, après près de 30 ans d’existence de la marque.

Micron prévoit également d’augmenter la production de microcircuits HBM. La société a investi 9,6 milliards de dollars dans la construction de nouvelles capacités à Hiroshima (Japon).

Le 12 février, Samsung Electronics a annoncé le début de la livraison de puces HBM4 de pointe à des clients non précisés. La société tente ainsi de réduire son retard face à ses concurrents dans le domaine des composants critiques pour les accélérateurs IA Nvidia, notamment SK Hynix.

Le plus grand fabricant mondial de microcircuits se trouve dans une position difficile : il est le principal fournisseur de mémoire pour Nvidia, tout en étant leader dans le segment des smartphones et de l’électronique grand public. Il est crucial pour l’entreprise de maintenir des contrats à forte marge dans l’IA, sans affaiblir sa position dans la fabrication de gadgets.

En septembre dernier, la direction de Samsung Semiconductor a tenté de rééquilibrer la situation. La société a confirmé que ses lignes de production de mémoire pour cartes graphiques haut de gamme — GDDR7 — peuvent fournir à la fois aux gamers, aux créateurs de contenu et aux stations de travail professionnelles.

Ces microcircuits équipent le flagship de la gamme gaming Nvidia — GeForce RTX 5090. Présentée en janvier 2025, cette carte reste la leader incontestée, et le prix annoncé l’année dernière de 1999 dollars n’a plus rien à voir avec la réalité actuelle. Au moment de la rédaction, les offres oscillent entre 4000 et 5000 dollars.

Source : Nvidia. Le marché hautement adaptable de la Chine exploite comme d’habitude ses opportunités. Selon Nikkei Asia, les principaux fabricants chinois de mémoire CXMT et YMTC envisagent d’étendre considérablement leurs capacités.

En 2027, ils prévoient de lancer des usines à Shanghai et Wuhan, en concentrant leur production principalement sur la DRAM et le NAND, plutôt que sur l’HBM, comme le font les leaders du marché.

L’ancien CIO/CTO de Bitfury et cofondateur d’Hyperfusion, Alex Petrov, estime qu’il n’y a pas d’intérêt à espérer une baisse des prix, il vaut mieux réallouer les dépenses.

« Il ne faut pas attendre, il faut vivre ici et maintenant. Si vous avez besoin de matériel pour travailler, miner, un nœud — achetez-le dès maintenant, en acceptant des prix élevés, et privilégiez ce qui peut être temporairement évité. La demande différée pourrait être énorme et imprévisible d’ici 2028, il faut espérer sur les anciennes DDR3/4 et la sortie de nouvelles DDR6 », a partagé l’expert dans un commentaire à ForkLog.

Pourquoi les cartes graphiques ?

Pourquoi les cartes graphiques, qui permettaient en 2000 de jouer à Quake III Arena, et en 2015 à Fallout 4, ont-elles d’abord été détournées par le minage PoW, puis absorbées par l’industrie de l’IA ? La réponse réside dans la spécificité des accélérateurs graphiques, qu’il est plus simple d’expliquer en les comparant au processeur central (CPU).

Le CPU est un génie capable de résoudre tout type de tâches programmatiques : écrire des poèmes, calculer des impôts, gérer un système d’exploitation. Mais ses actions s’effectuent de manière séquentielle sur chaque cœur.

À l’inverse, le GPU est une usine avec des milliers de travailleurs simples. Chacun est moins intelligent qu’un génie, mais ils peuvent agir simultanément.

Pour rendre une image dans un jeu, il faut calculer la couleur de millions de pixels. Cela équivaut au même nombre d’opérations mathématiques par seconde. La puce graphique a été conçue pour le calcul parallèle.

Une situation similaire se produit lors du minage PoW avec des cartes graphiques. Le minage est une sorte de loterie où l’appareil doit, des milliards de fois par seconde, deviner un nombre aléatoire pour trouver le bon hash. Le GPU était parfaitement adapté à cette tâche, ce qui a conduit à la première vague de pénurie jusqu’au passage d’Ethereum au PoS en 2022.

Les processeurs graphiques sont devenus une véritable trouvaille pour l’industrie de l’IA. Les LLM modernes comme ChatGPT ou Gemini sont essentiellement de gigantesques tableaux de nombres (matrices). Leur entraînement consiste en une multiplication infinie de ces matrices pour ajuster les « poids » (les connexions entre neurones).

Il s’est avéré que la mathématique qui crée les reflets sur l’eau dans Cyberpunk 2077 est la même algèbre linéaire qui sous-tend l’apprentissage des réseaux neuronaux. Mais l’IA nécessite non seulement une puissance de calcul importante, mais aussi une vitesse colossale de transfert de données. La mémoire vidéo classique ne suffit pas — elle a été remplacée par la coûteuse et rare HBM, que tous les géants technologiques cherchent à s’arracher aujourd’hui.

Nvidia a compris le bon trend à temps et, depuis l’architecture Volta, a commencé à ajouter dans ses cartes graphiques des « cœurs tensoriels ». Ils peuvent multiplier simultanément des matrices, spécifiquement conçues pour les tâches d’IA.

GPU à l’heure et perte du offline

Dans la situation actuelle, les producteurs de contenu, vidéastes, designers, gamers, programmeurs, architectes IA et tous ceux dont le travail dépend fortement du matériel, devront faire un choix dans les deux prochaines années. Favoriser la location de puissance en ligne ou payer beaucoup plus cher pour une mise à niveau de leur PC.

Face à la pénurie et aux files d’attente pour certains composants, la demande pour l’abonnement se renforce, poussant les centres de données cloud à devenir plus orientés client. Certaines entreprises proposent un accès flexible aux calculs et aux GPU en location, comme Lambda Labs, Vast.ai, Hyperfusion, LeaderGPU, Hostkey et d’autres.

Le service RunPod propose d’utiliser le flagship en pénurie RTX 5090 pour 0,89 dollars/heure.

Source : Runpod. La plateforme Shadow offre un bureau à distance sans limite pour lancer jeux ou logiciels professionnels pour ingénieurs et designers. Des services similaires comme GeForce Now ou Xbox Cloud ne donnent pas cette liberté, mais ont un prix différent.

Source : Shadow. Déjà aujourd’hui, avec une connexion stable, une smart TV domestique peut devenir une station de travail puissante, il suffit de commander le matériel nécessaire. Cela ouvre pour beaucoup des possibilités auparavant inaccessibles, mais la responsabilité de la qualité et de la stabilité revient désormais aux opérateurs de data centers, qui peuvent privilégier des clients plus importants ou appliquer des sanctions.

Petrov a souligné que les centres de données garantissent une disponibilité 24/7, une alimentation de secours, une redondance des connexions et une maintenance de qualité.

« En même temps, vous pouvez tout à fait stocker certains fichiers chez vous ou au travail. C’est juste souvent plus cher et moins pratique », a-t-il ajouté.

Selon lui, de nombreux designers, monteurs vidéo, producteurs et artistes sont déjà remplacés par l’intelligence artificielle. À un certain niveau, ils doivent recourir à des applications IA spécialisées, que le « matériel domestique » ne peut pas gérer.

« Alors que la demande pour les LLM croît de façon exponentielle, on ne peut garder que de petites versions sur un téléphone ou chez soi. Les versions professionnelles de grande taille nécessitent une autre échelle, des capacités et des vitesses que fournissent justement les centres de données cloud », a expliqué Petrov.

Bitcoin toujours en tête

Tout le secteur IT dépend des composants, mais pour l’industrie de la blockchain, la pénurie de microcircuits représente une menace réelle pour la décentralisation et la redistribution des forces.

« La hausse des prix de la mémoire résulte des décisions de certaines entreprises commerciales. Les nœuds de la blockchain ne sont pas les seules victimes : tous les appareils avec la nouvelle mémoire DDR5 — smartphones, PC, tout — voient leur prix augmenter. Cela pousse aussi les blockchains à devenir plus intelligentes et économes, en cherchant différentes voies et solutions », estime le cofondateur d’Hyperfusion.

Il souligne le paradoxe de la situation actuelle, où les réseaux PoS ont du mal :

« Proof-of-Stake a réduit la consommation d’énergie du minage, mais a transféré la charge de l’électricité vers la mémoire et les disques pour les entreprises et les utilisateurs. Dans un contexte où les composants ont été multipliés par 3 à 5, les chaînes PoS se trouvent dans une « tempête parfaite » de la réalité ».

Dans des blockchains comme Ethereum et Solana, le principe est : « facile à créer, mais extrêmement coûteux à vérifier ». Étant donné le grand nombre de nœuds dans le réseau, et le fait que la preuve nécessite sept à neuf étapes, le seuil d’entrée pour les validateurs PoS est souvent plus bas pour le déploiement, mais plus coûteux en termes d’exploitation.

Exigences techniques pour les détenteurs de nœud Solana. Source : Solana Labs. Selon Petrov, dans Ethereum, chaque nœud doit garder rapidement accessible toute la base de données des comptes, contrats et soldes. Cela représente des dizaines de millions d’objets, constamment mis à jour. Pour fonctionner efficacement, il faut une RAM à haute vitesse et un SSD NVMe en RAID.

Les nœuds doivent traiter chaque bloc. Dans des réseaux à haute fréquence (Solana — 400 ms, Ethereum — 12 s), la vérification de la signature et l’exécution des transactions nécessitent d’énormes ressources. Pour les nœuds complets archivistes, les exigences sont encore plus élevées : dans Ethereum, une archive nécessite 128 Go de RAM et au moins 12 To de SSD.

La baisse de rentabilité des validateurs due à la hausse des coûts des composants crée un nouveau risque de centralisation de la blockchain. En janvier, le nombre quotidien de nœuds actifs sur Solana est tombé à 800 — le plus bas depuis 2021. Avec la réduction du soutien aux petits propriétaires de nœuds, il devient de plus en plus difficile de couvrir les coûts de vote et d’infrastructure si la part déléguée est insuffisante.

Au moment de la rédaction, le coefficient Nakamoto du réseau est descendu à 19 (contre 33 en 2023).

La Fondation Ethereum discute déjà d’initiatives pour réduire le seuil d’entrée. En mai 2025, Vitalik Buterin a proposé la mise à jour EIP-4444, qui pourrait réduire considérablement les exigences en espace disque. Il est prévu que les nœuds ne conservent l’historique des transactions que sur 36 jours, tout en maintenant l’état actuel du réseau et la structure Merkle. Cette approche permettrait de réduire la taille de stockage sans compromettre la vérification de l’état actuel de la blockchain.

Dans cette nouvelle réalité du « paravent de silicium », le bitcoin reste la « blockchain du peuple ».

« Dans le bitcoin, il n’y a pas de vérification d’état, seulement UTXO, qui peuvent être facilement mis en cache. La création de PoW nécessite des fermes ASIC, d’énormes capacités énergétiques, mais la validation reste ultra-légère. La vérification du résultat en PoW est extrêmement simple et rapide, c’est sa beauté. Les étapes sur un nœud validateur : obtenir les données du bloc, vérifier son hash, une ou deux opérations de hachage, comparer la cible/complexité, et c’est tout — oui/non »*, a expliqué Petrov.

Pour ces raisons, un nœud complet de bitcoin peut fonctionner même sur un serveur léger ou un PC de bureau, et parfois même sur de nouveaux Raspberry Pi avec 4 à 8 Go de RAM. L’impact de la pénurie de mémoire sur les nœuds PoW est minimal. La hausse des prix des SSD est notable, mais des volumes jusqu’à 1 To restent accessibles, a ajouté le spécialiste.

Et après ?

Petrov pense que l’ère du matériel personnel n’est pas terminée. Il existe simplement différentes approches et solutions pour des tâches spécifiques :

« J’aime citer : “Cloud is someone else’s computer” — “Le cloud, c’est simplement l’ordinateur de quelqu’un d’autre dans le réseau” ».

L’industrie cherche rapidement des solutions à la crise des microcircuits en développant de nouvelles technologies :

  • mémoire résistive magnétique MRAM (Magnetoresistive RAM), suffisamment non volatile. Elle est environ 1000 fois plus rapide que le SSD et plus fiable que la mémoire classique. D’ici 2026, elle commencera à remplacer la mémoire dans les systèmes critiques (automobile, espace) ;
  • CXL 3.1 (Compute Express Link). Permet aux serveurs de « partager » leur mémoire vive via le réseau. C’est une solution pour les centres de données, mais elle accroît la dépendance à l’égard du cloud.

La crise actuelle n’est pas la première de l’histoire, mais la plus structurée. Déjà, en 1986, les États-Unis ont imposé à le Japon un accord fixant un « plafond de prix » sur les puces mémoire. Cela a entraîné une hausse du prix de la DRAM par un facteur de trois en un an. Les fabricants américains de PC (Commodore, Apple) ont failli faire faillite, et Intel a quitté le marché de la mémoire pour se concentrer sur les processeurs.

En 2011, une inondation en Thaïlande a submergé les usines Western Digital, qui produisaient 40 % des HDD mondiaux. Les prix ont explosé de 190 % et ne sont pas revenus à la normale pendant deux ans.

La croissance exponentielle de l’IA ne permet pas d’évaluer précisément l’avenir du marché. La mise en service de nouvelles capacités d’ici 2028 pourrait atténuer la crise si le rythme actuel de développement est maintenu.

Si les agents IA deviennent la base de l’économie, la demande en puces augmentera plus vite que leur production. Dans ce scénario, posséder un PC puissant deviendra un hobby aussi élitiste que la possession d’un cheval de collection. Quoi qu’il nous réserve, pensez à changer la pâte thermique à temps.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler

Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)