CES 2026 刚刚见证了人工智能行业的历史性转折,英伟达CEO黄仁勋带来了一台重达2.5吨的“神奇机器”。与以往专注于消费级显卡的年份不同,这次黄仁勋完全转向企业计算系统,公布了 Vera Rubin 平台——这是英伟达GPU发展史上的一次飞跃。在48小时内,黄仁勋出席了三场大型活动:NVIDIA Live、与西门子合作的AI技术研讨会,以及联想的TechWorld。这一连串的亮相并非偶然——它反映了英伟达构建面向实际应用的AI生态系统的整体战略。## Vera Rubin:英伟达芯片架构的飞跃以著名天文学家命名的 Vera Rubin 平台,代表着根本性的创新。这是英伟达历史上首次推出一代不仅仅是改进,而是重新设计全部六类芯片的产品,目前已进入量产阶段。变革的原因十分明确:摩尔定律已放缓。传统方法已无法跟上AI模型每年10倍的增长速度。黄仁勋和英伟达选择了“极限协同设计”——在所有层面同步创新。这六款芯片包括:- **Vera CPU**:88核奥林巴斯定制核心,系统内存1.5TB(是Grace一代的3倍),支持176线程,NVLink C2C带宽1.8TB/s- **Rubin GPU**:推理性能达50 PFLOPS(是Blackwell的5倍),集成第三代Transformer引擎- **ConnectX-9**:可编程的800 Gb/s以太网RDMA网络- **BlueField-4 DPU**:配备64核Grace CPU的专用处理器,搭载150TB的上下文存储- **NVLink-6 Switch**:连接72个GPU,形成统一的集群- **Spectrum-6**:512通道光学技术,每通道200Gbps## 性能远超预期Vera Rubin NVL72系统带来的数字令人震惊。在推理任务中,计算能力达3.6 EFLOPS,是Blackwell的5倍。在训练方面,性能达2.5 EFLOPS,提升了3.5倍。LPDDR5X内存容量高达54TB(是上一代的3倍),而HBM4内存带宽达1.6 PB/s,提升2.8倍。最令人印象深刻的是,尽管性能提升了数倍,晶体管数量仅增加1.7倍,达到220万亿个。从成本角度来看,Vera Rubin同样展现出强大实力。训练一个参数量达百亿亿级的模型,只需Blackwell系统的四分之一,生成一个Token的成本也只有十分之一。在能效方面,吞吐率(每瓦每美元完成的AI Token数)提升了10倍——对于价值500亿美元的千兆数据中心,这意味着收入翻倍。## Spectrum-X网络技术:“免费”价值50亿美元黄仁勋精确计算:Spectrum-X,专为AI生成任务设计的端到端以太网平台,能将吞吐率提升25%,相当于为千兆数据中心节省了50亿美元的成本。他自信地表示:“这个网络系统几乎是免费的。”这项技术采用台积电的COOP工艺,结合硅光技术,使GPU和BlueField-4即使连接数万设备,也能像单一存储一样高效运作。## 解决“长尾问题”的上下文存储AI行业面临的一个重大挑战是KV缓存(key-value缓存),即“任务记忆”。当对话变长、模型变大时,HBM存储会变得过载。Vera Rubin通过在每个服务器节点部署BlueField-4解决了这一问题。每个节点配备4个BlueField-4,每个都带有150TB的上下文存储,为每个GPU提供16TB容量,且不影响数据传输速度(仍保持200Gbps)。## 安全性增强Vera Rubin支持Confidential Computing——所有数据在传输、存储和计算过程中都被加密,包括PCIe、NVLink和CPU-GPU通信。企业可以放心部署模型,无需担心数据泄露。## 开源与代理:未来趋势黄仁勋强调开源软件的重要性,特别提到DeepSeek V1——首个开源推理系统,令全球震惊。在他的幻灯片中,Kimi k2和DeepSeek V3.2被列为行业第一和第二。虽然目前的开源模型比最先进的模型落后6个月,但每6个月就会出现新模型。这种快速迭代正是创业公司、巨头和研究者不愿错过的原因——甚至包括英伟达。英伟达构建了涵盖生命科学、物理AI、代理模型、机器人和自动驾驶的开源生态系统,还开发了如La Proteina(蛋白质合成)和OpenFold 3等先进模型,以及价值数十亿美元的DGX Cloud超级计算平台。## 物理AI:征服现实世界如果大型语言模型解决了“数字世界”的问题,那么黄仁勋的下一步野心显然是征服“物理世界”。他提出了“三级计算”架构:训练计算(由GPU构建)、推理计算(部署在机器人或汽车边缘的微型脑)、模拟计算(Omniverse和Cosmos)。## Alpamayo:具备推理能力的自动驾驶系统基于此架构,黄仁勋正式宣布了Alpamayo——全球首个具有真正推理能力的自动驾驶模型。不同于传统的自动驾驶,Alpamayo不仅仅执行硬编码指令。当遇到前所未见的复杂交通场景时,它能像人类司机一样推理:“它会告诉你接下来会做什么,为什么会做出这个决定。”搭载Alpamayo技术的梅赛德斯-奔驰CLA将在2026年第一季度在美国正式亮相,随后推向欧洲和亚洲市场。这款车被NCAP评为全球最安全的汽车,得益于英伟达独特的“双重安全堆叠”设计——当AI模型不够自信时,系统会切换到传统安全模式。## 机器人战略:从Boston Dynamics到工厂所有机器人都将配备Jetson迷你计算机,在Omniverse的Isaac Simulator中进行训练。英伟达正将这一技术融入工业生态系统,如Synopsys、Cadence、Siemens。黄仁勋邀请了人形机器人、来自Boston Dynamics和Agility的四足机器人,以及迪士尼的可爱机器人登台,但他强调最核心的观点:“最大的机器人其实是工厂。”未来,芯片设计、系统设计、工厂仿真——都将由物理AI加速。黄仁勋甚至对机器人团队说:“你们将在电脑中设计、制造,甚至在电脑中测试和验证,然后再面对重力。”## 黄仁勋的整体战略在关于AI泡沫的争论中,黄仁勋似乎需要证明AI到底能做什么。除了公布 Vera Rubin 平台的强大,他还大量投资应用和软件。从过去为虚拟世界制造芯片,到现在英伟达直接展示并专注于Physical AI——自动驾驶、 humanoid robots——迈向真实世界。正如黄仁勋所说:“只有在战场上,武器才能持续销售。”CES 2026 证明了,有黄仁勋在,英伟达不仅仅是在卖芯片——他们在构建物理AI的未来。
黄仁勋在2026年CES上推出重达2.5吨的Vera Rubin平台,决心征服物理AI
CES 2026 刚刚见证了人工智能行业的历史性转折,英伟达CEO黄仁勋带来了一台重达2.5吨的“神奇机器”。与以往专注于消费级显卡的年份不同,这次黄仁勋完全转向企业计算系统,公布了 Vera Rubin 平台——这是英伟达GPU发展史上的一次飞跃。
在48小时内,黄仁勋出席了三场大型活动:NVIDIA Live、与西门子合作的AI技术研讨会,以及联想的TechWorld。这一连串的亮相并非偶然——它反映了英伟达构建面向实际应用的AI生态系统的整体战略。
Vera Rubin:英伟达芯片架构的飞跃
以著名天文学家命名的 Vera Rubin 平台,代表着根本性的创新。这是英伟达历史上首次推出一代不仅仅是改进,而是重新设计全部六类芯片的产品,目前已进入量产阶段。
变革的原因十分明确:摩尔定律已放缓。传统方法已无法跟上AI模型每年10倍的增长速度。黄仁勋和英伟达选择了“极限协同设计”——在所有层面同步创新。
这六款芯片包括:
性能远超预期
Vera Rubin NVL72系统带来的数字令人震惊。在推理任务中,计算能力达3.6 EFLOPS,是Blackwell的5倍。在训练方面,性能达2.5 EFLOPS,提升了3.5倍。
LPDDR5X内存容量高达54TB(是上一代的3倍),而HBM4内存带宽达1.6 PB/s,提升2.8倍。最令人印象深刻的是,尽管性能提升了数倍,晶体管数量仅增加1.7倍,达到220万亿个。
从成本角度来看,Vera Rubin同样展现出强大实力。训练一个参数量达百亿亿级的模型,只需Blackwell系统的四分之一,生成一个Token的成本也只有十分之一。在能效方面,吞吐率(每瓦每美元完成的AI Token数)提升了10倍——对于价值500亿美元的千兆数据中心,这意味着收入翻倍。
Spectrum-X网络技术:“免费”价值50亿美元
黄仁勋精确计算:Spectrum-X,专为AI生成任务设计的端到端以太网平台,能将吞吐率提升25%,相当于为千兆数据中心节省了50亿美元的成本。他自信地表示:“这个网络系统几乎是免费的。”
这项技术采用台积电的COOP工艺,结合硅光技术,使GPU和BlueField-4即使连接数万设备,也能像单一存储一样高效运作。
解决“长尾问题”的上下文存储
AI行业面临的一个重大挑战是KV缓存(key-value缓存),即“任务记忆”。当对话变长、模型变大时,HBM存储会变得过载。
Vera Rubin通过在每个服务器节点部署BlueField-4解决了这一问题。每个节点配备4个BlueField-4,每个都带有150TB的上下文存储,为每个GPU提供16TB容量,且不影响数据传输速度(仍保持200Gbps)。
安全性增强
Vera Rubin支持Confidential Computing——所有数据在传输、存储和计算过程中都被加密,包括PCIe、NVLink和CPU-GPU通信。企业可以放心部署模型,无需担心数据泄露。
开源与代理:未来趋势
黄仁勋强调开源软件的重要性,特别提到DeepSeek V1——首个开源推理系统,令全球震惊。在他的幻灯片中,Kimi k2和DeepSeek V3.2被列为行业第一和第二。
虽然目前的开源模型比最先进的模型落后6个月,但每6个月就会出现新模型。这种快速迭代正是创业公司、巨头和研究者不愿错过的原因——甚至包括英伟达。
英伟达构建了涵盖生命科学、物理AI、代理模型、机器人和自动驾驶的开源生态系统,还开发了如La Proteina(蛋白质合成)和OpenFold 3等先进模型,以及价值数十亿美元的DGX Cloud超级计算平台。
物理AI:征服现实世界
如果大型语言模型解决了“数字世界”的问题,那么黄仁勋的下一步野心显然是征服“物理世界”。
他提出了“三级计算”架构:训练计算(由GPU构建)、推理计算(部署在机器人或汽车边缘的微型脑)、模拟计算(Omniverse和Cosmos)。
Alpamayo:具备推理能力的自动驾驶系统
基于此架构,黄仁勋正式宣布了Alpamayo——全球首个具有真正推理能力的自动驾驶模型。
不同于传统的自动驾驶,Alpamayo不仅仅执行硬编码指令。当遇到前所未见的复杂交通场景时,它能像人类司机一样推理:“它会告诉你接下来会做什么,为什么会做出这个决定。”
搭载Alpamayo技术的梅赛德斯-奔驰CLA将在2026年第一季度在美国正式亮相,随后推向欧洲和亚洲市场。这款车被NCAP评为全球最安全的汽车,得益于英伟达独特的“双重安全堆叠”设计——当AI模型不够自信时,系统会切换到传统安全模式。
机器人战略:从Boston Dynamics到工厂
所有机器人都将配备Jetson迷你计算机,在Omniverse的Isaac Simulator中进行训练。英伟达正将这一技术融入工业生态系统,如Synopsys、Cadence、Siemens。
黄仁勋邀请了人形机器人、来自Boston Dynamics和Agility的四足机器人,以及迪士尼的可爱机器人登台,但他强调最核心的观点:“最大的机器人其实是工厂。”
未来,芯片设计、系统设计、工厂仿真——都将由物理AI加速。黄仁勋甚至对机器人团队说:“你们将在电脑中设计、制造,甚至在电脑中测试和验证,然后再面对重力。”
黄仁勋的整体战略
在关于AI泡沫的争论中,黄仁勋似乎需要证明AI到底能做什么。除了公布 Vera Rubin 平台的强大,他还大量投资应用和软件。
从过去为虚拟世界制造芯片,到现在英伟达直接展示并专注于Physical AI——自动驾驶、 humanoid robots——迈向真实世界。正如黄仁勋所说:“只有在战场上,武器才能持续销售。”
CES 2026 证明了,有黄仁勋在,英伟达不仅仅是在卖芯片——他们在构建物理AI的未来。