黄仁勋在2026年CES上推出重达2.5吨的Vera Rubin平台,决心征服物理AI

CES 2026 刚刚见证了人工智能行业的历史性转折,英伟达CEO黄仁勋带来了一台重达2.5吨的“神奇机器”。与以往专注于消费级显卡的年份不同,这次黄仁勋完全转向企业计算系统,公布了 Vera Rubin 平台——这是英伟达GPU发展史上的一次飞跃。

在48小时内,黄仁勋出席了三场大型活动:NVIDIA Live、与西门子合作的AI技术研讨会,以及联想的TechWorld。这一连串的亮相并非偶然——它反映了英伟达构建面向实际应用的AI生态系统的整体战略。

Vera Rubin:英伟达芯片架构的飞跃

以著名天文学家命名的 Vera Rubin 平台,代表着根本性的创新。这是英伟达历史上首次推出一代不仅仅是改进,而是重新设计全部六类芯片的产品,目前已进入量产阶段。

变革的原因十分明确:摩尔定律已放缓。传统方法已无法跟上AI模型每年10倍的增长速度。黄仁勋和英伟达选择了“极限协同设计”——在所有层面同步创新。

这六款芯片包括:

  • Vera CPU:88核奥林巴斯定制核心,系统内存1.5TB(是Grace一代的3倍),支持176线程,NVLink C2C带宽1.8TB/s
  • Rubin GPU:推理性能达50 PFLOPS(是Blackwell的5倍),集成第三代Transformer引擎
  • ConnectX-9:可编程的800 Gb/s以太网RDMA网络
  • BlueField-4 DPU:配备64核Grace CPU的专用处理器,搭载150TB的上下文存储
  • NVLink-6 Switch:连接72个GPU,形成统一的集群
  • Spectrum-6:512通道光学技术,每通道200Gbps

性能远超预期

Vera Rubin NVL72系统带来的数字令人震惊。在推理任务中,计算能力达3.6 EFLOPS,是Blackwell的5倍。在训练方面,性能达2.5 EFLOPS,提升了3.5倍。

LPDDR5X内存容量高达54TB(是上一代的3倍),而HBM4内存带宽达1.6 PB/s,提升2.8倍。最令人印象深刻的是,尽管性能提升了数倍,晶体管数量仅增加1.7倍,达到220万亿个。

从成本角度来看,Vera Rubin同样展现出强大实力。训练一个参数量达百亿亿级的模型,只需Blackwell系统的四分之一,生成一个Token的成本也只有十分之一。在能效方面,吞吐率(每瓦每美元完成的AI Token数)提升了10倍——对于价值500亿美元的千兆数据中心,这意味着收入翻倍。

Spectrum-X网络技术:“免费”价值50亿美元

黄仁勋精确计算:Spectrum-X,专为AI生成任务设计的端到端以太网平台,能将吞吐率提升25%,相当于为千兆数据中心节省了50亿美元的成本。他自信地表示:“这个网络系统几乎是免费的。”

这项技术采用台积电的COOP工艺,结合硅光技术,使GPU和BlueField-4即使连接数万设备,也能像单一存储一样高效运作。

解决“长尾问题”的上下文存储

AI行业面临的一个重大挑战是KV缓存(key-value缓存),即“任务记忆”。当对话变长、模型变大时,HBM存储会变得过载。

Vera Rubin通过在每个服务器节点部署BlueField-4解决了这一问题。每个节点配备4个BlueField-4,每个都带有150TB的上下文存储,为每个GPU提供16TB容量,且不影响数据传输速度(仍保持200Gbps)。

安全性增强

Vera Rubin支持Confidential Computing——所有数据在传输、存储和计算过程中都被加密,包括PCIe、NVLink和CPU-GPU通信。企业可以放心部署模型,无需担心数据泄露。

开源与代理:未来趋势

黄仁勋强调开源软件的重要性,特别提到DeepSeek V1——首个开源推理系统,令全球震惊。在他的幻灯片中,Kimi k2和DeepSeek V3.2被列为行业第一和第二。

虽然目前的开源模型比最先进的模型落后6个月,但每6个月就会出现新模型。这种快速迭代正是创业公司、巨头和研究者不愿错过的原因——甚至包括英伟达。

英伟达构建了涵盖生命科学、物理AI、代理模型、机器人和自动驾驶的开源生态系统,还开发了如La Proteina(蛋白质合成)和OpenFold 3等先进模型,以及价值数十亿美元的DGX Cloud超级计算平台。

物理AI:征服现实世界

如果大型语言模型解决了“数字世界”的问题,那么黄仁勋的下一步野心显然是征服“物理世界”。

他提出了“三级计算”架构:训练计算(由GPU构建)、推理计算(部署在机器人或汽车边缘的微型脑)、模拟计算(Omniverse和Cosmos)。

Alpamayo:具备推理能力的自动驾驶系统

基于此架构,黄仁勋正式宣布了Alpamayo——全球首个具有真正推理能力的自动驾驶模型。

不同于传统的自动驾驶,Alpamayo不仅仅执行硬编码指令。当遇到前所未见的复杂交通场景时,它能像人类司机一样推理:“它会告诉你接下来会做什么,为什么会做出这个决定。”

搭载Alpamayo技术的梅赛德斯-奔驰CLA将在2026年第一季度在美国正式亮相,随后推向欧洲和亚洲市场。这款车被NCAP评为全球最安全的汽车,得益于英伟达独特的“双重安全堆叠”设计——当AI模型不够自信时,系统会切换到传统安全模式。

机器人战略:从Boston Dynamics到工厂

所有机器人都将配备Jetson迷你计算机,在Omniverse的Isaac Simulator中进行训练。英伟达正将这一技术融入工业生态系统,如Synopsys、Cadence、Siemens。

黄仁勋邀请了人形机器人、来自Boston Dynamics和Agility的四足机器人,以及迪士尼的可爱机器人登台,但他强调最核心的观点:“最大的机器人其实是工厂。”

未来,芯片设计、系统设计、工厂仿真——都将由物理AI加速。黄仁勋甚至对机器人团队说:“你们将在电脑中设计、制造,甚至在电脑中测试和验证,然后再面对重力。”

黄仁勋的整体战略

在关于AI泡沫的争论中,黄仁勋似乎需要证明AI到底能做什么。除了公布 Vera Rubin 平台的强大,他还大量投资应用和软件。

从过去为虚拟世界制造芯片,到现在英伟达直接展示并专注于Physical AI——自动驾驶、 humanoid robots——迈向真实世界。正如黄仁勋所说:“只有在战场上,武器才能持续销售。”

CES 2026 证明了,有黄仁勋在,英伟达不仅仅是在卖芯片——他们在构建物理AI的未来。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论