英伟达Vera Rubin平台：下一代AI工厂基础架构核心

2026-06-02阅读 0热度 0

其他

英伟达在台北Computex大会上宣布一项重大进展：加速量产即将发布的Vera Rubin平台。该平台并非常规迭代——它被定义为下一代人工智能工厂的核心基础设施，英伟达断言，未来几年企业基础设施的格局将由这套架构重新定义。

早在今年3月的GTC开发者大会上，英伟达就首次披露了Vera Rubin。如今宣布系统进入批量生产阶段，意味着距离正式上市只差临门一脚。

Vera Rubin这个名字，取自首位发现暗物质证据的天文学家。但这套平台远非上一代GPU的简单升级——英伟达明确表示，这是一次彻底的架构革新，目标直指“智能体AI”时代。在这个时代中，自主AI智能体能够推理、调用第三方软件工具，甚至代表人类执行复杂的工作负载。

全新架构设计

Vera Rubin平台的核心是英伟达新一代Rubin GPU（Grace Blackwell GPU的继任者），但平台远不止一块GPU。它还包括全新Vera中央处理器、NVLink 6交换机、ConnectX-9 SuperNIC、BlueField-4数据处理单元、Spectrum-6以太网交换机，以及专为万亿参数模型推理打造的Nvidia Groq 3语言处理单元。这些组件整合成一个完全集成的系统，在规模化部署时，智能体AI吞吐量比上一代Grace Blackwell平台高出整整10倍。

英伟达创始人黄仁勋在Computex主题演讲中解释得很直白：智能体AI是一种全新的工作负载，自然需要全新的基础设施。“一个提示词可能触发包含推理、检索、工具使用和响应生成的千步旅程，”他说，“Vera Rubin正是为这一时刻而生——一个能大规模提供智能的AI工厂引擎，具备推动下一次工业革命所需的性能、效率和安全性。”

大规模量产启动

作为英伟达MGX机架级系统的第三代产品，Vera Rubin将以前所未有的规模进行生产——涉及分布在30个国家的350多家供应链合作伙伴。戴尔科技、慧与科技、超微电脑和联想集团都是主力，它们正在制造Vera Rubin服务器，计划今年晚些时候交付给云和企业客户。

Vera Rubin NVL72机架级系统是整个平台的核心。这套液冷系统由72个Rubin GPU和36个Vera CPU组成，通过高速NVLink 6互连实现“突破性效率”。举个例子：训练大型专家混合模型时，所需GPU数量仅为上一代Blackwell芯片的四分之一；而在推理方面，Vera Rubin能提供10倍的吞吐量，每个Token的成本却只有十分之一。

为了支撑大规模AI工厂的部署，英伟达还推出了全球首款基于共封装光学技术的网络交换机——Nvidia Spectrum-X以太网光子学。据说比传统收发器网络能效高5倍，AI正常运行时间高5倍，部署速度快1.3倍。

平台还集成了全新的BlueField 4数据处理单元，软件定义网络速度高达每秒800GB，内置多租户隔离功能，能简化网络操作并提高底层GPU的效率。其中BlueField-4 STX存储机架的设计更巧妙——充当专用的“上下文内存”层，AI智能体可以在大规模多轮交互中保持连贯性。把缓存数据卸载到BlueField-4芯片后，推理吞吐量能提高多达5倍。

机架级安全保障

BlueField-4 STX在保护AI工厂方面也扮演着关键角色。如今越来越多的AI工厂处理敏感且高度监管的数据，这些数据不能暴露给第三方AI系统。为此，Vera Rubin被设计成在机架级实现全栈机密计算——数据在GPU和CPU之间通过高速互连传输时全程加密。

基础安全由一个新的可编程软件层提供，能在整个系统中执行、编排和调整安全策略。这背后是BlueField-4 STX中新的Nvidia DOCA安全创新，在硅层执行策略。据称，DOCA能实现多租户网络隔离、零信任策略执行、运行时威胁检测，以及高达每秒800GB的加密速度。

“智能体AI将企业数据转变为一个实时运行的系统——而这个系统必须在数据移动、上下文存储和智能体行动的地方受到保护，”黄仁勋说，“通过Vera BlueField-4 STX，英伟达及其生态系统正在构建安全设计的存储基础设施，以AI的速度在硅层执行信任。”

智能体工作负载专用处理器

Vera CPU是平台的另一个关键元素。这是一类专门为大规模运行智能体工作负载而设计的新型处理器，相比标准x86芯片，速度和能效都更胜一筹。

作为Grace CPU的继任者，早期基准测试表明，Vera CPU在关键智能体工作负载（如代码编译和数据库处理）中表现极其出色。这些类型的工作负载将成为大多数AI工厂的核心业务，为更高的吞吐量和更高效的单个AI智能体铺平道路。

“AI智能体将成为计算资源的最大用户，”黄仁勋解释道，“Vera是为这一未来设计的首款CPU——专为以超大规模运行智能体AI而构建，具有非凡的性能、效率和可编程性。”

英伟达认为，Vera CPU还将加速AI工厂经济学从“每美元核心数”向“每美元Token数”的转变。它基于一个名为Olympus的新型定制CPU核心，专为Python运行时、沙盒代码执行、编排逻辑和分析管道等任务而设计。Olympus使Vera能处理更多指令、预测应用程序行为，并实时在大量并发环境中移动数据。每个CPU配备88个Olympus核心、空间多线程，以及支持每秒1.2TB带宽的LPDDR5X内存子系统——这确保了智能体在CPU密集型步骤上的等待时间大大减少，从而提升整个AI工厂的效率。

另外，Vera CPU与BlueField-4 STX处理器紧密集成，以受益于其嵌入式硅安全功能。

Vera Rubin平台的最后一个组件是Nvidia DSX——一个架构蓝图，为现代AI工厂提供完整的设计和运营基础。它统一了参考设计、模拟、基础设施软件和生态系统技术，帮助服务器制造商开发针对性能和更低Token成本优化的节能AI系统。采用DSX后，英伟达的合作伙伴（包括戴尔、慧与、联想和超微等）都在加速生产首批Vera Rubin系统。英伟达预计，首批完整系统将在秋季交付给客户。

Q&A

Q1：Vera Rubin平台是什么？它有什么特别之处？

A：Vera Rubin是英伟达推出的新一代AI工厂基础平台，以发现暗物质证据的天文学家命名。它不是简单的GPU升级，而是完整的架构革新，专为智能体AI设计。该平台整合了Rubin GPU、Vera CPU、NVLink 6交换机等多个组件，可提供比上一代高10倍的智能体AI吞吐量，推理成本仅为十分之一。

Q2：Vera Rubin平台什么时候能投入使用？

A：英伟达已宣布Vera Rubin进入批量生产阶段，涉及30个国家的350多家供应链合作伙伴。戴尔、慧与、联想和超微等主要合作伙伴正在制造Vera Rubin服务器，预计首批完整系统将在今年秋季交付给云和企业客户。

Q3：Vera CPU相比传统处理器有什么优势？

A：Vera CPU是专门为大规模运行智能体工作负载设计的新型处理器，相比标准x86芯片具有更高速度和能效。它基于Olympus定制核心，每个CPU配备88个核心，支持每秒1.2TB的内存带宽，在代码编译和数据库处理等智能体核心工作负载中表现出色，能大幅减少AI智能体的等待时间。

英伟达Vera Rubin平台：下一代AI工厂基础架构核心

全新架构设计

大规模量产启动

机架级安全保障

智能体工作负载专用处理器

Q&A

相关阅读

最新教程

最新资讯