0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA Vera Rubin平台开启代理式AI前沿

NVIDIA英伟达 来源:NVIDIA英伟达 2026-03-18 14:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

七款全新芯片全面投产,旨在通过为 AI 各阶段(从预训练、后训练、测试时扩展,到智能体式推理)提供全面优化的可配置 AI 基础设施,扩展全球最大 AI 工厂的规模。

新闻摘要:

NVIDIA Vera Rubin 平台正开启下一个 AI 前沿:

Vera Rubin NVL72 GPU 机架

Vera CPU 机架

NVIDIA Groq 3 LPX 推理加速器机架

NVIDIA BlueField-4 STX 存储机架

NVIDIA Spectrum-6 SPX 以太网机架

加利福尼亚州圣何塞 — GTC — 太平洋时间 2026 年 3 月 16 日— NVIDIA 今日宣布,NVIDIA Vera Rubin 平台正开启代理式 AI 的下一个前沿。目前,该平台搭载的七款新芯片现已全面投产,旨在扩展全球最大 AI 工厂的规模。

该平台集成了 NVIDIA Vera CPU、NVIDIA Rubin GPU、NVIDIA NVLink™ 6 交换机、NVIDIA ConnectX®-9 SuperNIC、NVIDIA BlueField®-4 DPU 和 NVIDIA Spectrum™-6 以太网交换机,以及新纳入的 NVIDIA Groq 3 LPU。这些芯片设计为协同运作,构成一台强大的 AI 超级计算机,可为 AI 的各个阶段提供动力——从大规模预训练、后训练、测试阶段扩展到实时智能体式推理。

NVIDIA 创始人兼首席执行官黄仁勋表示:“Vera Rubin 是一次划时代的飞跃——七款突破性芯片、五种机架、一台巨型超级计算机——旨在为 AI 的每个阶段提供澎湃动力。代理式 AI 的拐点已经到来,Vera Rubin 正拉开历史上最大规模的基础设施建设序幕。”

“企业和开发者正在使用 Claude 进行日益复杂的推理、智能体工作流以及关键任务的决策,这要求基础设施必须能够跟上步伐。”Anthropic CEO 兼联合创始人 Dario Amodei 表示。“NVIDIA 的 Vera Rubin 平台为我们提供了计算、网络和系统设计,使我们在不断提升客户所依赖的安全性和可靠性的同时,能够持续提供卓越性能。”

OpenAI 首席执行官 Sam Altman 表示:“NVIDIA 的基础设施是让我们不断推动 AI 前沿发展的基石。借助 NVIDIA Vera Rubin,我们将能够以大规模运行更强大的模型和智能体,并为数亿用户提供更快速、更可靠的系统。”

转向 POD 级系统

AI 基础设施正快速演进——从分立芯片和单机服务器,向完全集成的机架级扩展系统、POD 级部署、AI 工厂和主权 AI 发展。这些进步正推动性能实现跨越式增长,并为各个行业各种规模的机构提升成本效益,从初创公司、中型企业,到公共和私营机构和大型企业。同时,这也有助于普及 AI 技术,并提高能效,从而为全球最严苛的工作负载提供动力。

通过跨计算、网络与存储的深度协同设计,并依托由 80 多家 NVIDIA MGX 生态系统合作伙伴组成的全球供应链,NVIDIA Vera Rubin 提供了迄今规模最大的 NVIDIA POD 级平台——这是一款超级计算机,其中多个专为 AI 设计的机架协同运作,构成一个庞大且统一的强大系统。

NVIDIA Vera Rubin NVL72 机架

Vera Rubin NVL72 集成了通过 NVLink 6 互连的 72 个 Rubin GPU 和 36 个 Vera CPU,并配备了 ConnectX-9 SuperNIC 与 BlueField-4 DPU,从而实现了突破性的效率表现。与 NVIDIA Blackwell 平台相比,Vera Rubin NVL72 仅需四分之一数量的 GPU 即可训练大型混合专家模型,每瓦特推理吞吐量最高可提升 10 倍的同时,每 Token 成本仅为原平台的十分之一。

NVL72 专为全球超大规模 AI 工厂设计,通过 NVIDIA Quantum-X800 InfiniBand 和 Spectrum-X 以太网实现无缝扩展,保持大规模 GPU 集群的高利用率,同时缩短训练时间并降低总体拥有成本。

NVIDIA Vera CPU 机架

强化学习和代理式 AI 工作负载依赖大量基于 CPU 的环境,来测试和验证在 GPU 系统上运行的模型所生成的结果。

NVIDIA Vera CPU 机架提供基于 NVIDIA MGX 打造的高密度液冷基础设施,单机架集成 256 个 Vera CPU,以全球领先的单线程性能,提供可扩展且高能效的算力,从而解锁大规模代理式 AI 的潜力。

与 Spectrum-X 以太网集成后,Vera CPU 机架确保 CPU 环境在整个 AI 工厂内保持高度同步。与 GPU 计算机架协同,它们为大规模代理式 AI 与强化学习提供坚实的 CPU 基础——Vera 的性能表现比传统 CPU 效率提升一倍,速度提升了 50%。

NVIDIA Groq 3 LPX 机架

NVIDIA Groq 3 LPX 标志着加速计算领域的一个重要里程碑。专为智能体系统的低延迟和长上下文需求而设计,LPX 与 Vera Rubin 强强联合,汇聚了两款处理器的极致性能,使得每兆瓦的推理吞吐量提升高达 35 倍,并为万亿参数模型带来了多达 10 倍的营收机遇。

大规模部署时,由 LPU 组成的集群能够作为一个巨大的单一逻辑处理器运行,提供快速、确定性的推理加速。LPX 机架搭载 256 个 LPU 处理器,配备 128GB 片上 SRAM 和 640 TB/s 的纵向扩展带宽。与 Vera Rubin NVL72 协同部署时,Rubin GPU 和 LPU 通过协同计算 AI 模型的每一层来生成每一个 Token,从而显著提升解码速度。

为万亿参数模型和百万级 Token 上下文而优化协同设计的 LPX 架构,与 Vera Rubin 强强联合,最大限度地提高了功耗、内存和计算方面的效率。每瓦特吞吐量和 Token 性能的提升,开启了超高端、万亿参数、百万上下文推理的新纪元,为所有 AI 提供商拓展了营收机遇。该架构采用全液冷设计,并基于 MGX 基础设施构建,可无缝集成到下一代 Vera Rubin AI 工厂中,预计将在今年下半年面世。

NVIDIA BlueField-4 STX 存储机架

NVIDIA BlueField-4 STX机架级扩展系统作为 AI 原生存储基础设施,可在整个 POD 中无缝扩展 GPU 内存。STX 由 BlueField-4 提供支持,集成了 NVIDIA Vera CPU 与 NVIDIA ConnectX-9 SuperNIC。该平台提供了高带宽共享层,且优化了存储和检索大语言模型与代理式 AI 工作流产生的海量 KV 缓存数据。

全新推出的 DOCA 软件框架 NVIDIA DOCA Memos™ 可显著提升 BlueField-4 存储性能。通过专用的 KV 缓存存储处理技术,与通用存储架构相比,可将推理吞吐量提升 5 倍,并显著提高能效。最终实现 POD 范围内的上下文共享,从而加快与 AI 智能体的多轮交互速度,提供更具可扩展性的 AI 服务,并提高整体基础设施利用率。

Mistral AI 联合创始人兼首席技术官 Timothée Lacroix 表示:“NVIDIA BlueField-4 STX 机架级扩展上下文记忆存储系统将提供关键的性能提升,使我们能够实现代理式 AI 的指数级扩展。通过提供一个专为 AI 智能体记忆设计的全新存储层,STX 能够确保我们的模型在跨海量数据集进行推理时依然保持连贯性和速度。”

NVIDIA Spectrum-6 SPX 以太网机架

Spectrum-6 SPX 以太网专为加速 AI 工厂“东西向”流量而设计。该机架可灵活配置 Spectrum-X 以太网交换机或 NVIDIA Quantum-X800 InfiniBand 交换机,能够在大规模部署中提供低延迟、高吞吐量的机架间互连。

采用光电一体封装 (CPO) 的 Spectrum-X 以太网硅光技术,相比传统可插拔收发器光学能效最高提升 5 倍,系统可靠性提高 10 倍。

提升可靠性与能效

NVIDIA 携手超过 200 家数据中心基础设施合作伙伴,共同推出了针对 Vera Rubin 的 NVIDIA DSX 平台,其包含 DSX Max-Q,旨在为整个 AI 工厂实现动态供电,从而在固定功率的数据中心内部署的 AI 基础设施数量可增加 30%。此外,全新的 DSX Flex 软件使 AI 工厂转变为电网柔性资产,从而释放 1000 亿瓦的闲置电网容量。

NVIDIA 今日还发布了Vera Rubin DSX AI Factory 参考设计,为协同设计的 AI 基础设施提供蓝图,旨在最大化每瓦特 Token 产出和整体有效吞吐,增强系统可靠性,并缩短首次投产时间。

通过深度集成计算、网络、存储、供电与冷却系统,该架构显著提升了能源效率,确保 AI 工厂在持续、高强度负载下,仍能可靠扩展,实现最大化的正常运行时间。

广泛的生态系统支持

今年下半年,合作伙伴将陆续推出基于 Vera Rubin 的产品,包括领先的云服务提供商 Amazon Web Services、Google Cloud、Microsoft Azure 和 Oracle Cloud Infrastructure,以及 NVIDIA 云合作伙伴 CoreWeave、Crusoe、Lambda、Nebius、Nscale和 Together AI。

思科、戴尔科技、HPE、联想和 Supermicro 等全球系统制造商预计将推出一系列基于 Vera Rubin 产品的服务器,包括Aivres、华硕、Foxconn、技嘉、Inventec、Pegatron、Quanta Cloud Technology (QCT)、Wistron 和 Wiwynn 在内的其他厂商也将提供相关产品。

包括 Anthropic、Meta、Mistral AI 和 OpenAI 在内的 AI 实验室与前沿大模型开发商,计划采用 NVIDIA Vera Rubin 平台训练规模更大、能力更强的模型,并以比以往 GPU 更低的延迟和成本提供长上下文与多模态系统服务。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5682

    浏览量

    110095
  • AI
    AI
    +关注

    关注

    91

    文章

    40939

    浏览量

    302515

原文标题:GTC2026 | NVIDIA Vera Rubin 开启代理式 AI 前沿

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Vera rubin平台即将交付,英伟达800VDC电源方案进展如何?

    电子发烧友网报道(文/梁浩斌)在刚刚结束的‌GTC 2026上,英伟达推出了Vera Rubin POD,这是一套极致的软硬件协同设计的多机架系统组成的集群,也是一台AI超级计算机。   具体来说
    的头像 发表于 03-23 00:44 7683次阅读
    <b class='flag-5'>Vera</b> <b class='flag-5'>rubin</b><b class='flag-5'>平台</b>即将交付,英伟达800VDC电源方案进展如何?

    Jump Trading采用NVIDIA Rubin平台大幅提升研究速度

    Jump Trading 将成为金融服务领域首批采用 NVIDIA Rubin 平台的交易公司之一,以加速由 AI 驱动的资本市场研究和金融建模。
    的头像 发表于 03-25 10:03 291次阅读

    NVIDIA发布Vera Rubin DSX AI Factory参考设计

    NVIDIA 今日宣布推出 NVIDIA Vera Rubin DSX AI Factory 参考设计,这是一份用于构建协同设计的
    的头像 发表于 03-18 14:42 614次阅读

    NVIDIA推出Vera CPU以显著提升系统性能与能效

    NVIDIA 今日发布 NVIDIA Vera CPU,这是全球首款专为代理式 AI 与强化学习时代打造的处理器,其效率是传统机架级 CPU
    的头像 发表于 03-18 14:33 1300次阅读

    英伟达Rubin平台引入微通道冷板技术,100%全液冷设计

    电子发烧友网报道(文/李弯弯)英伟达在近期举办的 CES 2026 展会上,正式推出了其全新的 Vera Rubin 计算平台。作为继 Blackwell 架构之后的又一力作,Rubin
    的头像 发表于 01-19 07:15 1.4w次阅读
    英伟达<b class='flag-5'>Rubin</b><b class='flag-5'>平台</b>引入微通道冷板技术,100%全液冷设计

    生命科学领先企业采用 NVIDIA BioNeMo 平台加速 AI 驱动的药物研发

    Discovery、Basecamp Research、Boltz 及生态系统领先企业,将 NVIDIA BioNeMo、代理式 AI 与物理 AI 相结合,推动科学研究与药物研发规
    的头像 发表于 01-14 11:40 645次阅读
    生命科学领先企业采用 <b class='flag-5'>NVIDIA</b> BioNeMo <b class='flag-5'>平台</b>加速 <b class='flag-5'>AI</b> 驱动的药物研发

    NVIDIA DGX SuperPOD为Rubin平台横向扩展提供蓝图

    NVIDIA DGX Rubin 系统整合了 NVIDIA 在计算、网络和软件领域的最新突破,将推理 token 成本降至 NVIDIA Blackwell
    的头像 发表于 01-14 09:14 805次阅读

    NVIDIA在CES 2026发布新一代Rubin AI平台

    通过跨 NVIDIA Vera CPU、Rubin GPU、NVLink 6 交换机、ConnectX-9 SuperNIC、BlueField-4 DPU 和 Spectrum-6 以太网交换机的极致协同设计,大幅缩短训练时间
    的头像 发表于 01-09 10:23 781次阅读

    Supermicro宣布支持即将推出的NVIDIA Vera Rubin NVL72与HGX Rubin NVL8,并扩大机柜制造产能,提供更佳的液冷AI解决方案

    /边缘领域的全方位IT解决方案供应商,宣布扩大制造产能、强化液冷技术,并与NVIDIA展开合作,推动NVIDIA Vera RubinRubin
    的头像 发表于 01-07 16:49 881次阅读
    Supermicro宣布支持即将推出的<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Vera</b> <b class='flag-5'>Rubin</b> NVL72与HGX <b class='flag-5'>Rubin</b> NVL8,并扩大机柜制造产能,提供更佳的液冷<b class='flag-5'>AI</b>解决方案

    代理式 AI 重构 EDA:从对话助手到虚拟工程师

    电子发烧友网报道(文 / 吴子鹏)代理式 AI(Agentic AI)作为 AI 领域的新兴方向,是一种能够通过自主感知、推理、规划与执行,独立完成复杂多步骤任务的 
    的头像 发表于 08-28 07:54 3383次阅读

    代理式AIAI智能体在不同行业中的实际应用

    代理式 AI 的时代已经到来。如今,代理式 AI 已经驱动应用迈向深度场景融合与规模化落地。这波演进浪潮标志着 AI 能力向自主执行的跃迁。
    的头像 发表于 07-28 14:28 1355次阅读

    NVIDIA全栈加速代理式AI应用落地

    在近期举办的 AWS 中国峰会上,NVIDIA 聚焦于“NVIDIA 全栈加速代理式 AI 应用落地”,深入探讨了代理式
    的头像 发表于 07-14 11:41 1446次阅读

    Blue Lion超级计算机将在NVIDIA Vera Rubin上运行

    德国莱布尼茨超算中心(LRZ)将迎来全新超级计算机 Blue Lion,其算力比该中心现有的 SuperMUC-NG 高性能计算机提升了约 30 倍。这台新的超级计算机将在 NVIDIA Vera Rubin 架构上运行。
    的头像 发表于 06-12 15:39 1338次阅读

    NVIDIA携手微软加速代理式AI发展

    代理式 AI 正在重新定义科学探索,推动各行各业的研究突破和创新发展。NVIDIA 和微软正通过深化合作提供先进的技术,从云到 PC 加速代理式 A
    的头像 发表于 05-27 14:03 1207次阅读

    基于代理式AI建立网络安全防御体系

    NVIDIA AI 安全栈为先进的代理式系统提供信任、控制和管理支持。
    的头像 发表于 05-07 14:29 1305次阅读