Thời đại của sự phong phú kỹ thuật số, khi bất kỳ người đam mê nào cũng có thể tự lắp đặt máy chủ tại nhà đủ sức cạnh tranh với công suất của một công ty nhỏ, đang dần khép lại. Việc sở hữu phần cứng tiên tiến của riêng mình ngày càng mang nét đặc quyền trước bối cảnh giá chip nhớ tăng cao và hàng chờ đặt hàng trước kéo dài.
Trong bài viết mới của ForkLog, chúng tôi phân tích tại sao card đồ họa trở thành nguồn lực cho ngành AI, Nvidia không còn thích game thủ nữa, còn các freelancer thiết kế phải thuê sức mạnh từ các trung tâm dữ liệu đám mây. Nhưng câu hỏi chính chúng tôi muốn trả lời là: tình trạng thiếu chip sẽ ảnh hưởng thế nào đến sự phân cấp của blockchain, nơi SSD và DRAM thường đóng vai trò then chốt.
Chủ nghĩa kỹ thuật feudal hay khó khăn tạm thời
Gần đây, theo các phát biểu của các lãnh đạo ngành AI và các nhà sản xuất chip nhớ, có cảm giác rằng thời kỳ sở hữu máy tính cá nhân mạnh mẽ (PC) đang dần kết thúc.
Trong các cuộc thảo luận, người ta nhắc đến bài phát biểu của Jeff Bezos, sáng lập Amazon, năm 2024, khi ông so sánh việc sử dụng PC với việc dùng máy phát điện trong thời kỳ cung cấp điện trung tâm qua ổ cắm. Một số cộng đồng coi ông như nhà tiên tri trong tình hình hiện tại.
Các mẫu phần cứng mới nhất trở thành nguồn lực chính để huấn luyện và duy trì các mô hình ngôn ngữ lớn (LLM). AI đang làm cạn kiệt kho hàng của các nhà sản xuất chip HBM, vốn trước đây chủ yếu phục vụ cho phân khúc SSD và RAM. Kết quả là, giá linh kiện tăng cao có thể khiến thị trường mất đi một phân khúc thiết bị giá rẻ trong năm nay.
Đầu tháng 2, các nhà nghiên cứu của TrendForce nâng dự báo về giá chip. Họ dự đoán hợp đồng mua bộ nhớ DRAM cho người dùng sẽ tăng 90–95% trong quý I năm 2026, do bùng nổ trong lĩnh vực AI. Dự báo trước đó là 55–60%.
Thêm vào đó, huấn luyện các mô hình LLM đòi hỏi lượng dữ liệu khổng lồ. Ngành doanh nghiệp đã mua hết các kho SSD dung lượng từ 2TB trở lên, có khả năng ghi cao. Các nhà sản xuất chip silicon, thu lợi nhiều hơn từ dịch vụ AI, đang lên kế hoạch tái cơ cấu năng lực sản xuất.
Cuối năm 2025, Micron Technology — trước đây là một trong những nhà ủng hộ tích cực duy trì phân khúc desktop — tuyên bố đóng dòng sản phẩm tiêu dùng Crucial. Việc sản xuất sẽ dừng vào quý II năm 2026 sau gần 30 năm tồn tại thương hiệu.
Micron cũng dự định tăng sản lượng chip HBM. Công ty đã đầu tư 9,6 tỷ USD xây dựng các nhà máy mới tại Hiroshima, Nhật Bản.
Ngày 12 tháng 2, Samsung Electronics thông báo bắt đầu cung cấp các chip HBM4 cao cấp cho khách hàng chưa được tiết lộ danh tính. Như vậy, hãng cố gắng rút ngắn khoảng cách với các đối thủ trong lĩnh vực linh kiện quan trọng cho các bộ tăng tốc AI của Nvidia, bao gồm SK Hynix.
Nhà sản xuất chip lớn nhất thế giới đang trong tình thế khó khăn: họ là nhà cung cấp bộ nhớ chính cho Nvidia, đồng thời dẫn đầu trong lĩnh vực điện thoại thông minh và điện tử tiêu dùng. Công ty cần giữ các hợp đồng sinh lợi cao trong lĩnh vực AI mà không làm suy yếu vị thế trong sản xuất thiết bị.
Tháng 9 năm ngoái, ban lãnh đạo Samsung Semiconductor cố gắng cân bằng tình hình. Họ xác nhận rằng các dây chuyền sản xuất bộ nhớ GDDR7 dành cho card đồ họa cao cấp có thể phục vụ cả game thủ, nhà sáng tạo nội dung và các trạm làm việc chuyên nghiệp.
Các chip này được dùng trong dòng flagship của Nvidia — GeForce RTX 5090. Ra mắt từ tháng 1 năm 2025, card đồ họa này vẫn giữ vị trí dẫn đầu, còn giá bán công bố một năm trước là 1999 USD, hiện nay không còn phù hợp với thực tế. Tại thời điểm viết bài, các đề nghị trên thị trường dao động từ 4000 đến 5000 USD.
Nguồn: Nvidia. Thị trường Trung Quốc cao cấp như thường lệ tận dụng mọi cơ hội. Theo Nikkei Asia, các nhà sản xuất bộ nhớ lớn của Trung Quốc là CXMT và YMTC đang có kế hoạch mở rộng quy mô đáng kể.
Năm 2027, họ dự định xây dựng các nhà máy tại Thượng Hải và Uông Bí, chủ yếu tập trung vào sản xuất DRAM và NAND, chứ không phải HBM như các nhà dẫn đầu thị trường.
Cựu CIO/CTO của Bitfury Group và đồng sáng lập Hyperfusion, Alex Petrov, cho rằng không có lý do gì để hy vọng giá sẽ giảm, thay vào đó nên phân bổ lại chi phí.
“Không nên chờ đợi, chúng ta sống trong hiện tại. Nếu cần phần cứng để làm việc, khai thác, nút mạng — tốt nhất là mua ngay, chấp nhận giá cao, và dành ra những thứ có thể tạm thời bỏ qua. Nhu cầu bị trì hoãn đến năm 2028 có thể rất lớn và khó đoán, còn chờ đợi DDR3/4 cũ hoặc DDR6 mới ra mắt”, — chuyên gia chia sẻ trong bình luận của ForkLog.
Tại sao lại là card đồ họa?
Tại sao card đồ họa, từng giúp chơi Quake III Arena năm 2000, rồi Fallout 4 năm 2015, ban đầu bị PoW-đào coin chiếm lĩnh, sau đó lại bị ngành AI thâu tóm? Câu trả lời nằm ở đặc thù của các bộ tăng tốc đồ họa, dễ hiểu hơn khi so sánh với CPU.
CPU là thiên tài, có thể giải quyết mọi loại nhiệm vụ phần mềm: viết thơ, tính thuế, điều hành hệ điều hành. Nhưng các tác vụ được thực hiện tuần tự trên từng lõi.
Ngược lại, GPU là một nhà máy với hàng nghìn công nhân đơn giản. Mỗi người trong số họ kém thông minh hơn thiên tài, nhưng có thể làm việc cùng lúc.
Để vẽ một khung hình trong game, cần tính toán màu của hàng triệu pixel. Điều này tương đương với hàng triệu phép toán giống nhau mỗi giây. Chip đồ họa sinh ra để thực hiện các tính toán song song.
Tình huống tương tự xảy ra trong khai thác PoW trên card đồ họa. Đào coin là một dạng xổ số, nơi thiết bị phải thử hàng tỷ lần mỗi giây để tìm ra hash đúng. GPU phù hợp hoàn hảo cho mục đích này, dẫn đến làn sóng thiếu hụt đầu tiên trước khi Ethereum chuyển sang PoS vào năm 2022.
Các bộ xử lý đồ họa trở thành phát hiện thực sự cho ngành AI. Các LLM hiện đại như ChatGPT hay Gemini, về bản chất, là các bảng số khổng lồ (ma trận). Việc huấn luyện chúng là nhân lên vô tận các ma trận này để tìm ra các “trọng số” (kết nối giữa các neuron).
Hóa ra, toán học tạo ra các phản chiếu trên nước trong Cyberpunk 2077 chính là đại số tuyến tính, nền tảng của việc huấn luyện mạng neural. Nhưng AI đòi hỏi không chỉ sức mạnh tính toán, mà còn tốc độ truyền dữ liệu cực cao. Bộ nhớ đồ họa thông thường không đủ, thay vào đó là HBM đắt tiền và khan hiếm, hiện đang là mục tiêu cạnh tranh của các ông lớn công nghệ.
Nvidia đã kịp thời nhận ra xu hướng này và từ kiến trúc Volta trở đi, họ bắt đầu tích hợp “tế bào tensor” vào card đồ họa. Chúng có khả năng nhân ma trận cùng lúc, tối ưu cho các nhiệm vụ AI.
GPU theo giờ và mất kết nối offline
Trong bối cảnh hiện tại, ít nhất trong hai năm tới, các nhà sáng tạo nội dung, nhà quay phim, nhà thiết kế, game thủ, lập trình viên, kiến trúc sư AI và tất cả những ai phụ thuộc vào phần cứng mạnh mẽ sẽ phải lựa chọn: thuê sức mạnh đám mây hay nâng cấp PC với chi phí cao hơn nhiều.
Do thiếu linh kiện và hàng chờ dài, nhu cầu thuê dịch vụ đám mây ngày càng tăng, khiến các trung tâm dữ liệu đám mây trở nên thân thiện hơn với khách hàng. Có các công ty cung cấp dịch vụ linh hoạt cho thuê GPU và tính toán, như Lambda Labs, Vast.ai, Hyperfusion, LeaderGPU, Hostkey và nhiều hơn nữa.
Dịch vụ RunPod cho phép thuê card flagship RTX 5090 với giá 0,89 USD/giờ.
Nguồn: Runpod. Nền tảng Shadow cung cấp máy tính từ xa không giới hạn việc chạy game hay phần mềm chuyên dụng cho kỹ sư, nhà thiết kế. Các dịch vụ tương tự như GeForce Now hay Xbox Cloud không mang lại tự do đó, nhưng giá cả cũng khác biệt.
Nguồn: Shadow. Ngay cả khi kết nối ổn định, TV thông minh tại nhà cũng có thể biến thành trạm làm việc mạnh mẽ chỉ cần đặt mua phần cứng phù hợp. Điều này mở ra nhiều khả năng trước đây không thể, nhưng toàn bộ trách nhiệm về chất lượng và hoạt động liên tục sẽ thuộc về các trung tâm dữ liệu, nơi có thể ưu tiên khách hàng quan trọng hơn và thực thi các lệnh cấm theo lệnh trừng phạt.
Petrov nhấn mạnh rằng các trung tâm dữ liệu đảm bảo khả năng truy cập 24/7, có nguồn dự phòng, kết nối dự phòng và dịch vụ bảo trì đúng tiêu chuẩn.
“Bạn vẫn có thể lưu trữ một số thứ tại nhà hoặc nơi làm việc. Nhưng thường thì sẽ đắt hơn và ít tiện lợi hơn”, — ông bổ sung.
Theo ông, nhiều nhà thiết kế, biên tập video, nhà sản xuất, họa sĩ đã bị trí tuệ nhân tạo thay thế. Ở một mức độ nào đó, họ phải dựa vào các ứng dụng AI chuyên dụng, mà phần cứng tại nhà không thể đáp ứng nổi.
“Trong khi yêu cầu của các LLM tăng theo cấp số nhân, chỉ có thể giữ các mô hình nhỏ trong điện thoại hoặc tại nhà. Các phiên bản chuyên sâu, lớn hơn đòi hỏi quy mô, công suất và tốc độ khác, chính là những gì các trung tâm dữ liệu đám mây cung cấp”, — Petrov giải thích.
Bitcoin lại dẫn đầu
Toàn bộ ngành công nghệ thông tin phụ thuộc vào linh kiện, nhưng đối với ngành blockchain, thiếu chip có thể gây ra mối đe dọa thực sự về sự phân cấp và phân phối lại quyền lực.
“Giá bộ nhớ tăng là hậu quả của các quyết định của các công ty thương mại riêng lẻ. Các nút của blockchain — không phải là những thiết bị duy nhất bị ảnh hưởng, tất cả các thiết bị có bộ nhớ DDR5 mới như điện thoại, PC đều tăng giá. Điều này buộc các blockchain phải trở nên thông minh và tiết kiệm hơn, tìm kiếm các phương án và giải pháp khác nhau”, — đồng sáng lập Hyperfusion nhận định.
Ông cũng chỉ ra nghịch lý của tình hình hiện tại, trong đó các mạng PoS gặp khó khăn:
“Proof-of-Stake đã giảm tiêu thụ năng lượng của khai thác, nhưng lại chuyển tải gánh nặng từ điện năng sang bộ nhớ và ổ đĩa cho doanh nghiệp và người dùng. Trong bối cảnh linh kiện tăng giá gấp 3–5 lần, các chuỗi PoS đang rơi vào ‘bão hoàn hảo’ của thực tế”.
Trong các blockchain như Ethereum và Solana, nguyên tắc là “dễ tạo ra, nhưng cực kỳ đắt để xác minh”. Với nhiều nút mạng và bằng chứng mất 7–9 bước, rào cản gia nhập mạng PoS thường thấp hơn để triển khai, nhưng chi phí vận hành lại cao hơn.
Yêu cầu kỹ thuật cho các nút của Solana. Nguồn: Solana Labs. Theo Petrov, trong Ethereum, mỗi nút phải giữ sẵn toàn bộ cơ sở dữ liệu về tài khoản, hợp đồng và số dư. Đó là hàng chục triệu đối tượng liên tục được cập nhật. Để hoạt động nhanh, cần RAM tốc độ cao và SSD NVMe, kết hợp thành mảng RAID.
Các nút phải xử lý từng khối. Trong các mạng có tần suất cao (Solana — 400 ms, Ethereum — 12 s), việc xác minh chữ ký và thực hiện giao dịch đòi hỏi nguồn lực lớn. Các nút lưu trữ toàn bộ dữ liệu (full archive node) yêu cầu cao hơn nhiều: Ethereum archive node cần 128GB RAM và từ 12TB SSD trở lên.
Việc giảm lợi nhuận của các validator do giá linh kiện tăng tạo ra rủi ro mới về tập trung trong blockchain. Tháng 1, số lượng nút hoạt động hàng ngày của Solana giảm xuống còn 800, mức thấp nhất kể từ năm 2021. Khi hỗ trợ các chủ sở hữu nút nhỏ giảm, việc trang trải chi phí bỏ phiếu và hạ tầng càng trở nên khó khăn nếu họ không có phần chia sẻ ủy thác đủ lớn.
Tại thời điểm viết, hệ số Nakamoto của mạng đã giảm xuống còn 19 (năm 2023 là 33).
Ethereum Foundation đã bắt đầu thảo luận về các sáng kiến giảm ngưỡng đầu vào hạ tầng. Tháng 5 năm 2025, Vitalik Buterin đề xuất cập nhật EIP-4444, giúp giảm đáng kể yêu cầu về dung lượng lưu trữ. Dự kiến, các nút sẽ chỉ lưu trữ lịch sử giao dịch trong 36 ngày gần nhất, trong khi vẫn duy trì trạng thái hiện tại của mạng và cấu trúc cây Merkle. Phương pháp này giúp giảm dung lượng lưu trữ mà không ảnh hưởng đến khả năng xác minh trạng thái hiện tại của blockchain.
Trong bối cảnh mới của “tấm màn silicon”, Bitcoin vẫn giữ vị trí “chuột chũi của dân chúng”.
“Trong Bitcoin, không có kiểm tra trạng thái, chỉ có UTXO, dễ dàng lưu trữ cache. Quá trình khai thác PoW đòi hỏi các trại ASIC, công suất năng lượng lớn, nhưng việc xác minh kết quả lại cực kỳ nhẹ nhàng. Việc kiểm tra kết quả trong PoW cực kỳ đơn giản và nhanh chóng, đó là điểm đẹp của nó. Các bước trên nút validator: lấy dữ liệu khối, kiểm tra hash, một hoặc hai phép toán hash, so sánh mục tiêu/độ khó, rõ ràng — có/không”, — Petrov giải thích.
Do đó, nút đầy đủ của Bitcoin có thể hoạt động ngay cả trên máy chủ nhẹ hoặc máy tính để bàn, thậm chí trên các Raspberry Pi mới với 4–8 GB RAM. Ảnh hưởng của thiếu bộ nhớ đối với các nút PoW là rất nhỏ. SSD giá tăng, nhưng dung lượng tới 1TB vẫn còn khả dụng, chuyên gia bổ sung.
Tiếp theo là gì?
Petrov cho rằng, thời kỳ của phần cứng cá nhân chưa kết thúc. Có nhiều cách tiếp cận và giải pháp phù hợp cho các nhiệm vụ khác nhau:
“Tôi thích câu ‘Cloud is someone else’s computer’ — ‘Đám mây là máy tính của người khác’”.
Ngành công nghiệp đang vội vã tìm lối thoát khỏi khủng hoảng chip, phát triển các công nghệ mới:
bộ nhớ MRAM (Magnetoresistive RAM) không mất dữ liệu khi tắt nguồn, nhanh gấp khoảng 1000 lần SSD và đáng tin cậy hơn. Đến năm 2026, sẽ bắt đầu thay thế bộ nhớ trong các hệ thống quan trọng (ô tô, vũ trụ);
CXL 3.1 (Compute Express Link). Cho phép các máy chủ “chia sẻ” bộ nhớ RAM qua mạng. Đây là giải pháp cho các trung tâm dữ liệu, nhưng làm tăng sự phụ thuộc của người dùng vào đám mây.
Khủng hoảng hiện tại không phải lần đầu, nhưng là nghiêm trọng nhất trong lịch sử. Trước đó, các chip nhớ từng đối mặt với các thử thách tương tự:
Mỹ áp đặt thỏa thuận với Nhật Bản về “giới hạn giá” chip nhớ. Điều này khiến giá DRAM tăng gấp 3 trong một năm. Các nhà sản xuất PC Mỹ (Commodore, Apple) gần như phá sản, còn Intel rút khỏi thị trường bộ nhớ, tập trung vào CPU;
Lũ lụt tại Thái Lan. Các nhà máy của Western Digital, chiếm 40% HDD toàn cầu, bị ngập lụt. Giá tăng 190% và không trở lại bình thường trong hai năm.
Sự tăng trưởng theo cấp số nhân của AI khiến khó dự đoán chính xác xu hướng thị trường trong tương lai. Việc mở rộng công suất dự kiến đến năm 2028 sẽ giúp giảm bớt khủng hoảng nếu duy trì tốc độ phát triển hiện tại.
Nếu các agent AI trở thành nền tảng của nền kinh tế, nhu cầu chip sẽ tăng nhanh hơn khả năng sản xuất. Trong kịch bản đó, sở hữu PC mạnh mẽ sẽ trở thành một sở thích đặc quyền như sở hữu một con ngựa sưu tầm. Dù tương lai có ra sao, hãy thay keo tản nhiệt đúng hạn.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Màn chắn bằng silicon - ForkLog: tiền điện tử, AI, siêu đặc, tương lai
Card đồ họa, bộ nhớ RAM, SSD — còn gì nữa?
Thời đại của sự phong phú kỹ thuật số, khi bất kỳ người đam mê nào cũng có thể tự lắp đặt máy chủ tại nhà đủ sức cạnh tranh với công suất của một công ty nhỏ, đang dần khép lại. Việc sở hữu phần cứng tiên tiến của riêng mình ngày càng mang nét đặc quyền trước bối cảnh giá chip nhớ tăng cao và hàng chờ đặt hàng trước kéo dài.
Trong bài viết mới của ForkLog, chúng tôi phân tích tại sao card đồ họa trở thành nguồn lực cho ngành AI, Nvidia không còn thích game thủ nữa, còn các freelancer thiết kế phải thuê sức mạnh từ các trung tâm dữ liệu đám mây. Nhưng câu hỏi chính chúng tôi muốn trả lời là: tình trạng thiếu chip sẽ ảnh hưởng thế nào đến sự phân cấp của blockchain, nơi SSD và DRAM thường đóng vai trò then chốt.
Chủ nghĩa kỹ thuật feudal hay khó khăn tạm thời
Gần đây, theo các phát biểu của các lãnh đạo ngành AI và các nhà sản xuất chip nhớ, có cảm giác rằng thời kỳ sở hữu máy tính cá nhân mạnh mẽ (PC) đang dần kết thúc.
Trong các cuộc thảo luận, người ta nhắc đến bài phát biểu của Jeff Bezos, sáng lập Amazon, năm 2024, khi ông so sánh việc sử dụng PC với việc dùng máy phát điện trong thời kỳ cung cấp điện trung tâm qua ổ cắm. Một số cộng đồng coi ông như nhà tiên tri trong tình hình hiện tại.
Các mẫu phần cứng mới nhất trở thành nguồn lực chính để huấn luyện và duy trì các mô hình ngôn ngữ lớn (LLM). AI đang làm cạn kiệt kho hàng của các nhà sản xuất chip HBM, vốn trước đây chủ yếu phục vụ cho phân khúc SSD và RAM. Kết quả là, giá linh kiện tăng cao có thể khiến thị trường mất đi một phân khúc thiết bị giá rẻ trong năm nay.
Đầu tháng 2, các nhà nghiên cứu của TrendForce nâng dự báo về giá chip. Họ dự đoán hợp đồng mua bộ nhớ DRAM cho người dùng sẽ tăng 90–95% trong quý I năm 2026, do bùng nổ trong lĩnh vực AI. Dự báo trước đó là 55–60%.
Thêm vào đó, huấn luyện các mô hình LLM đòi hỏi lượng dữ liệu khổng lồ. Ngành doanh nghiệp đã mua hết các kho SSD dung lượng từ 2TB trở lên, có khả năng ghi cao. Các nhà sản xuất chip silicon, thu lợi nhiều hơn từ dịch vụ AI, đang lên kế hoạch tái cơ cấu năng lực sản xuất.
Cuối năm 2025, Micron Technology — trước đây là một trong những nhà ủng hộ tích cực duy trì phân khúc desktop — tuyên bố đóng dòng sản phẩm tiêu dùng Crucial. Việc sản xuất sẽ dừng vào quý II năm 2026 sau gần 30 năm tồn tại thương hiệu.
Micron cũng dự định tăng sản lượng chip HBM. Công ty đã đầu tư 9,6 tỷ USD xây dựng các nhà máy mới tại Hiroshima, Nhật Bản.
Ngày 12 tháng 2, Samsung Electronics thông báo bắt đầu cung cấp các chip HBM4 cao cấp cho khách hàng chưa được tiết lộ danh tính. Như vậy, hãng cố gắng rút ngắn khoảng cách với các đối thủ trong lĩnh vực linh kiện quan trọng cho các bộ tăng tốc AI của Nvidia, bao gồm SK Hynix.
Nhà sản xuất chip lớn nhất thế giới đang trong tình thế khó khăn: họ là nhà cung cấp bộ nhớ chính cho Nvidia, đồng thời dẫn đầu trong lĩnh vực điện thoại thông minh và điện tử tiêu dùng. Công ty cần giữ các hợp đồng sinh lợi cao trong lĩnh vực AI mà không làm suy yếu vị thế trong sản xuất thiết bị.
Tháng 9 năm ngoái, ban lãnh đạo Samsung Semiconductor cố gắng cân bằng tình hình. Họ xác nhận rằng các dây chuyền sản xuất bộ nhớ GDDR7 dành cho card đồ họa cao cấp có thể phục vụ cả game thủ, nhà sáng tạo nội dung và các trạm làm việc chuyên nghiệp.
Các chip này được dùng trong dòng flagship của Nvidia — GeForce RTX 5090. Ra mắt từ tháng 1 năm 2025, card đồ họa này vẫn giữ vị trí dẫn đầu, còn giá bán công bố một năm trước là 1999 USD, hiện nay không còn phù hợp với thực tế. Tại thời điểm viết bài, các đề nghị trên thị trường dao động từ 4000 đến 5000 USD.
Năm 2027, họ dự định xây dựng các nhà máy tại Thượng Hải và Uông Bí, chủ yếu tập trung vào sản xuất DRAM và NAND, chứ không phải HBM như các nhà dẫn đầu thị trường.
Cựu CIO/CTO của Bitfury Group và đồng sáng lập Hyperfusion, Alex Petrov, cho rằng không có lý do gì để hy vọng giá sẽ giảm, thay vào đó nên phân bổ lại chi phí.
Tại sao lại là card đồ họa?
Tại sao card đồ họa, từng giúp chơi Quake III Arena năm 2000, rồi Fallout 4 năm 2015, ban đầu bị PoW-đào coin chiếm lĩnh, sau đó lại bị ngành AI thâu tóm? Câu trả lời nằm ở đặc thù của các bộ tăng tốc đồ họa, dễ hiểu hơn khi so sánh với CPU.
CPU là thiên tài, có thể giải quyết mọi loại nhiệm vụ phần mềm: viết thơ, tính thuế, điều hành hệ điều hành. Nhưng các tác vụ được thực hiện tuần tự trên từng lõi.
Ngược lại, GPU là một nhà máy với hàng nghìn công nhân đơn giản. Mỗi người trong số họ kém thông minh hơn thiên tài, nhưng có thể làm việc cùng lúc.
Để vẽ một khung hình trong game, cần tính toán màu của hàng triệu pixel. Điều này tương đương với hàng triệu phép toán giống nhau mỗi giây. Chip đồ họa sinh ra để thực hiện các tính toán song song.
Tình huống tương tự xảy ra trong khai thác PoW trên card đồ họa. Đào coin là một dạng xổ số, nơi thiết bị phải thử hàng tỷ lần mỗi giây để tìm ra hash đúng. GPU phù hợp hoàn hảo cho mục đích này, dẫn đến làn sóng thiếu hụt đầu tiên trước khi Ethereum chuyển sang PoS vào năm 2022.
Các bộ xử lý đồ họa trở thành phát hiện thực sự cho ngành AI. Các LLM hiện đại như ChatGPT hay Gemini, về bản chất, là các bảng số khổng lồ (ma trận). Việc huấn luyện chúng là nhân lên vô tận các ma trận này để tìm ra các “trọng số” (kết nối giữa các neuron).
Hóa ra, toán học tạo ra các phản chiếu trên nước trong Cyberpunk 2077 chính là đại số tuyến tính, nền tảng của việc huấn luyện mạng neural. Nhưng AI đòi hỏi không chỉ sức mạnh tính toán, mà còn tốc độ truyền dữ liệu cực cao. Bộ nhớ đồ họa thông thường không đủ, thay vào đó là HBM đắt tiền và khan hiếm, hiện đang là mục tiêu cạnh tranh của các ông lớn công nghệ.
Nvidia đã kịp thời nhận ra xu hướng này và từ kiến trúc Volta trở đi, họ bắt đầu tích hợp “tế bào tensor” vào card đồ họa. Chúng có khả năng nhân ma trận cùng lúc, tối ưu cho các nhiệm vụ AI.
GPU theo giờ và mất kết nối offline
Trong bối cảnh hiện tại, ít nhất trong hai năm tới, các nhà sáng tạo nội dung, nhà quay phim, nhà thiết kế, game thủ, lập trình viên, kiến trúc sư AI và tất cả những ai phụ thuộc vào phần cứng mạnh mẽ sẽ phải lựa chọn: thuê sức mạnh đám mây hay nâng cấp PC với chi phí cao hơn nhiều.
Do thiếu linh kiện và hàng chờ dài, nhu cầu thuê dịch vụ đám mây ngày càng tăng, khiến các trung tâm dữ liệu đám mây trở nên thân thiện hơn với khách hàng. Có các công ty cung cấp dịch vụ linh hoạt cho thuê GPU và tính toán, như Lambda Labs, Vast.ai, Hyperfusion, LeaderGPU, Hostkey và nhiều hơn nữa.
Dịch vụ RunPod cho phép thuê card flagship RTX 5090 với giá 0,89 USD/giờ.
Petrov nhấn mạnh rằng các trung tâm dữ liệu đảm bảo khả năng truy cập 24/7, có nguồn dự phòng, kết nối dự phòng và dịch vụ bảo trì đúng tiêu chuẩn.
Theo ông, nhiều nhà thiết kế, biên tập video, nhà sản xuất, họa sĩ đã bị trí tuệ nhân tạo thay thế. Ở một mức độ nào đó, họ phải dựa vào các ứng dụng AI chuyên dụng, mà phần cứng tại nhà không thể đáp ứng nổi.
Bitcoin lại dẫn đầu
Toàn bộ ngành công nghệ thông tin phụ thuộc vào linh kiện, nhưng đối với ngành blockchain, thiếu chip có thể gây ra mối đe dọa thực sự về sự phân cấp và phân phối lại quyền lực.
Ông cũng chỉ ra nghịch lý của tình hình hiện tại, trong đó các mạng PoS gặp khó khăn:
Trong các blockchain như Ethereum và Solana, nguyên tắc là “dễ tạo ra, nhưng cực kỳ đắt để xác minh”. Với nhiều nút mạng và bằng chứng mất 7–9 bước, rào cản gia nhập mạng PoS thường thấp hơn để triển khai, nhưng chi phí vận hành lại cao hơn.
Các nút phải xử lý từng khối. Trong các mạng có tần suất cao (Solana — 400 ms, Ethereum — 12 s), việc xác minh chữ ký và thực hiện giao dịch đòi hỏi nguồn lực lớn. Các nút lưu trữ toàn bộ dữ liệu (full archive node) yêu cầu cao hơn nhiều: Ethereum archive node cần 128GB RAM và từ 12TB SSD trở lên.
Việc giảm lợi nhuận của các validator do giá linh kiện tăng tạo ra rủi ro mới về tập trung trong blockchain. Tháng 1, số lượng nút hoạt động hàng ngày của Solana giảm xuống còn 800, mức thấp nhất kể từ năm 2021. Khi hỗ trợ các chủ sở hữu nút nhỏ giảm, việc trang trải chi phí bỏ phiếu và hạ tầng càng trở nên khó khăn nếu họ không có phần chia sẻ ủy thác đủ lớn.
Tại thời điểm viết, hệ số Nakamoto của mạng đã giảm xuống còn 19 (năm 2023 là 33).
Ethereum Foundation đã bắt đầu thảo luận về các sáng kiến giảm ngưỡng đầu vào hạ tầng. Tháng 5 năm 2025, Vitalik Buterin đề xuất cập nhật EIP-4444, giúp giảm đáng kể yêu cầu về dung lượng lưu trữ. Dự kiến, các nút sẽ chỉ lưu trữ lịch sử giao dịch trong 36 ngày gần nhất, trong khi vẫn duy trì trạng thái hiện tại của mạng và cấu trúc cây Merkle. Phương pháp này giúp giảm dung lượng lưu trữ mà không ảnh hưởng đến khả năng xác minh trạng thái hiện tại của blockchain.
Trong bối cảnh mới của “tấm màn silicon”, Bitcoin vẫn giữ vị trí “chuột chũi của dân chúng”.
Do đó, nút đầy đủ của Bitcoin có thể hoạt động ngay cả trên máy chủ nhẹ hoặc máy tính để bàn, thậm chí trên các Raspberry Pi mới với 4–8 GB RAM. Ảnh hưởng của thiếu bộ nhớ đối với các nút PoW là rất nhỏ. SSD giá tăng, nhưng dung lượng tới 1TB vẫn còn khả dụng, chuyên gia bổ sung.
Tiếp theo là gì?
Petrov cho rằng, thời kỳ của phần cứng cá nhân chưa kết thúc. Có nhiều cách tiếp cận và giải pháp phù hợp cho các nhiệm vụ khác nhau:
Ngành công nghiệp đang vội vã tìm lối thoát khỏi khủng hoảng chip, phát triển các công nghệ mới:
Khủng hoảng hiện tại không phải lần đầu, nhưng là nghiêm trọng nhất trong lịch sử. Trước đó, các chip nhớ từng đối mặt với các thử thách tương tự:
Sự tăng trưởng theo cấp số nhân của AI khiến khó dự đoán chính xác xu hướng thị trường trong tương lai. Việc mở rộng công suất dự kiến đến năm 2028 sẽ giúp giảm bớt khủng hoảng nếu duy trì tốc độ phát triển hiện tại.
Nếu các agent AI trở thành nền tảng của nền kinh tế, nhu cầu chip sẽ tăng nhanh hơn khả năng sản xuất. Trong kịch bản đó, sở hữu PC mạnh mẽ sẽ trở thành một sở thích đặc quyền như sở hữu một con ngựa sưu tầm. Dù tương lai có ra sao, hãy thay keo tản nhiệt đúng hạn.