Google Ironwood TPU: Hiệu năng gấp 10 lần + Bốn đối tác cùng đối đầu Nvidia

ChainNewsAbmedia

Theo các báo cáo chuyên sâu của Bloomberg và thông báo chính thức từ Google, Google đã chính thức mở rộng danh mục chip AI do tự phát triển vào ngày 22 tháng 4: Ironwood (thế hệ TPU thứ bảy) chuyên cho suy luận được cung cấp đầy đủ trên Google Cloud, đồng thời khởi động hợp tác thiết kế thế hệ tiếp theo với bốn đối tác Broadcom, MediaTek, Marvell, Intel. Mục tiêu là dùng chuỗi cung ứng chip tùy chỉnh để thách thức vị trí thống trị của Nvidia trên thị trường năng lực tính toán AI.

Ironwood: Thế hệ TPU thứ bảy, lần đầu tiên được thiết kế riêng cho suy luận

Ironwood là sản phẩm thế hệ thứ bảy trong dòng TPU của Google và cũng là chip chuyên dụng cho suy luận đầu tiên theo chiến lược “tách nhánh huấn luyện và suy luận”. Các thông số mà Google công bố: hiệu năng đỉnh trên mỗi chip đạt gấp 10 lần TPU v5p, trang bị bộ nhớ 192GB HBM3E, băng thông bộ nhớ đạt 7,2 TB/s, một superpod có thể mở rộng lên tới 9.216 chip Ironwood làm mát bằng chất lỏng, tổng khối lượng tính toán FP8 đạt 42,5 exaflops.

Google cho biết chính thức rằng Ironwood đã “mở hoàn toàn cho khách hàng sử dụng Google Cloud”, và lượng hàng dự kiến xuất xưởng trong năm nay sẽ đạt “quy mô hàng triệu chip”. Anthropic đã cam kết sử dụng tối đa 1 triệu chip Ironwood TPU, còn Meta thì ký “hợp đồng nhiều năm trị giá hàng chục tỷ USD” để sử dụng TPU thông qua Google Cloud.

Phân công bốn đối tác: huấn luyện thuộc Broadcom, suy luận thuộc MediaTek

Chuỗi cung ứng chip thế hệ tiếp theo của Google được phân công rõ ràng như sau:

Đối tác Mã hiệu Vai trò Điểm nhấn Broadcom Sunfish Huấn luyện chuyên dụng Kế thừa quan hệ hợp tác TPU hiện có, dẫn dắt các nút huấn luyện quy mô lớn MediaTek (聯發科) Zebrafish Suy luận chuyên dụng Khẳng định chi phí thấp hơn phương án của Broadcom 20–30% Marvell Đang đàm phán Đơn vị xử lý bộ nhớ (MPU) + thêm TPU suy luận Tối ưu cho HBM và inference Intel Chưa công bố Tham gia thiết kế Tăng cường phân tán chuỗi cung ứng

Đây là lần đầu tiên trong ngành AI xuất hiện mô hình “bốn đối tác song song, phân công rõ ràng giữa huấn luyện và suy luận”. Google tránh sự phụ thuộc cấu trúc vào một nhà cung cấp duy nhất của Nvidia bằng cách phân tán rủi ro IP và đàm phán giá cạnh tranh. Lộ trình mở rộng đến cuối năm 2027 với TPU v8, được sản xuất trên quy trình 2nm của TSMC.

Ý nghĩa chiến lược: Thách thức Nvidia không phải bằng một chip duy nhất, mà bằng chuỗi cung ứng

Trong ba năm qua, thị trường chip AI gần như do Nvidia độc quyền, với hệ sinh thái phần mềm CUDA và hai lớp “hào lũy” từ các chip H100/GB200. Chiến lược của Ironwood của Google và nhóm bốn đối tác không nhằm mục tiêu “vượt trội một điểm đơn lẻ về thông số”, mà là sao chép logic “nền tảng được tiêu chuẩn hóa + mua sắm đa khách hàng” mà Nvidia đã áp dụng trong ngành—để TPU không chỉ phục vụ cho Google, mà còn trở thành một lựa chọn năng lực tính toán thương mại có thể dùng chung cho các công ty AI lớn như Anthropic, Meta.

Ý nghĩa của việc Anthropic cam kết 1 triệu chip TPU đặc biệt quan trọng: đây là cam kết năng lực tính toán lớn nhất ngoài Nvidia của một công ty AI đơn lẻ. Nó bổ sung lẫn nhau với cam kết 5GW/100 tỷ AWS mà Anthropic đạt được cùng Amazon—một bên gắn với AWS Trainium, một bên gắn với Google TPU. Với chiến lược “hai chip tùy chỉnh”, Anthropic giảm sự phụ thuộc vào Nvidia. Meta cũng là lần đầu công khai đưa TPU vào các khối lượng công việc huấn luyện/suy luận AI của chính mình, tạo ra một tín hiệu khác.

Phản ứng thị trường và liên kết với ngành

Trước khi tiết lộ lần này, MediaTek đã từng được xem như “người hưởng lợi từ chip tùy chỉnh của Google”. Việc lộ mã hiệu Zebrafish là lần đầu tiên đưa MediaTek trực tiếp vào danh sách đối tác thiết kế chip suy luận của Google. Đây là bước mở rộng theo tuyến truyện về “liên minh ngoài Nvidia” gần đây, gồm AMD × GlobalFoundries quang tử silicon và Marvell × Google MPU.

Nvidia ở cùng thời điểm vẫn có GB200 và nền tảng Rubin thế hệ tiếp theo để chống đỡ, nhưng tổ hợp năng lực tính toán phía khách hàng đang chuyển từ “toàn bộ Nvidia” sang mô hình ba trục song song “Nvidia + TPU + AWS Trainium”. Điều này cũng đồng nghĩa với việc năng lực sản xuất 2nm của TSMC sẽ đứng trước tình trạng Google, Nvidia, Apple và Amazon—bốn khách hàng lớn—đều đang xếp hàng, và sức mạnh đàm phán giá với nhà máy gia công bán dẫn tiếp tục tăng lên.

Bài viết “Google Ironwood TPU: Hiệu năng gấp 10 lần + bốn đối tác chống lại Nvidia” lần đầu tiên xuất hiện trên 鏈新聞 ABMedia.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Krutrim chuyển sang dịch vụ đám mây AI vào ngày 5/5, đăng bài lợi nhuận đầu tiên khi doanh thu FY26 đạt 31,6 triệu USD

Theo Press Trust of India, công ty AI của Ấn Độ Krutrim đã tái định vị mình thành nhà cung cấp dịch vụ AI cloud trong nước vào ngày 5 tháng 5, tạm dừng các nỗ lực thiết kế chip và chuyển hướng vốn cũng như nhân lực sang hạ tầng điện toán đám mây. Công ty báo cáo doanh thu trong năm tài khóa FY26 khoảng 3 tỷ rupee (31,6 triệu USD

GateNews35phút trước

Haun Ventures Đóng Quỹ 1 Tỷ USD vào ngày 5 tháng 5, Nhắm Tới Các Startup Crypto và AI

Theo Cointelegraph, Haun Ventures đã hoàn tất việc huy động 1 tỷ USD cho một quỹ mới vào ngày 5/5, với số vốn được phân bổ đồng đều giữa các khoản đầu tư giai đoạn đầu và giai đoạn sau. Quỹ sẽ tập trung vào các startup trong lĩnh vực crypto, trí tuệ nhân tạo và các lĩnh vực thay thế

GateNews1giờ trước

Anthropic và các khoản đầu tư của OpenAI dẫn đầu với hơn 1,1 tỷ USD vào giao dịch tiền mã hóa bán lẻ từ khi bắt đầu năm 2026

Theo Bloomberg, các nhà đầu tư lẻ đã đổ vào khoảng 1,13 tỷ USD để giao dịch đòn bẩy trên các phái sinh của công ty AI tư nhân kể từ đầu năm 2026. Các nền tảng tiền điện tử Ventuals và PreStocks cho phép giao dịch 24 giờ trên các công ty như Anthropic, OpenAI và SpaceX mà không cấp quyền trực tiếp cho

GateNews1giờ trước

Cựu lãnh đạo Qualcomm Alex Katouzian gia nhập Intel với vai trò Giám đốc điều hành cấp cao (EVP) về Điện toán khách hàng và AI vật lý

Theo Intel, vào ngày 5 tháng 5, Alex Katouzian gia nhập công ty với vai trò phó chủ tịch điều hành và tổng giám đốc của bộ phận Client Computing và Physical AI. Trước đó, Katouzian từng giữ vai trò phó chủ tịch điều hành và tổng giám đốc mảng di động, máy tính và XR của Qualcomm. Intel cũng

GateNews1giờ trước

AI Overview của Google cung cấp hàng chục triệu câu trả lời sai mỗi giờ; Gemini 3 đạt độ chính xác 91%

Theo The New York Times, tính năng AI Overview của Google có tỷ lệ chính xác 91% khi dùng Gemini 3, nghĩa là nó đưa ra hàng chục triệu câu trả lời sai mỗi giờ. Dựa trên việc Google xử lý hơn 5 nghìn tỷ lượt tìm kiếm hằng năm, điều này tương đương với hàng trăm nghìn thông tin không chính xác

GateNews1giờ trước

Anthropic chuẩn bị trợ lý chủ động Orbit tích hợp sáu công cụ, bao gồm GitHub và Figma

Theo các phát hiện trong mã được Beating theo dõi, Anthropic đang chuẩn bị một tính năng trợ lý chủ động mới có tên Orbit, kết nối với Gmail, Slack, GitHub, Calendar, Drive và Figma. Tính năng này sử dụng cơ chế tham gia tự nguyện và tạo các bản tin ngắn được cá nhân hóa từ các công cụ làm việc được kết nối trong khi

GateNews2giờ trước
Bình luận
0/400
Không có bình luận