0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA Spectrum-X以太网架构全面支持MRC协议

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2026-05-13 15:12 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

MRC (多路径可靠连接) 是一种新的传输协议,率先在 NVIDIA Spectrum-X 以太网硬件上完成验证和优化,现已向业界开放。

在构建全球最强大的 AI 工厂的竞争中,网络必须与 AI 本身的发展宏图相匹配。

NVIDIA Spectrum-X 以太网横向扩展基础设施,作为当今顶尖的 AI 网络技术,稳居这场竞争的最前沿,众多行业领军企业已采用该方案部署,在性能、可靠性和扩展性方面均不甘妥协。

其中包括 OpenAI、Microsoft 和 Oracle。

NVIDIA、微软以及OpenAI等企业共同打造 MRC (多路径可靠连接) 协议 ,一种新的 RDMA 传输协议,进一步夯实行业中的领先地位。MRC 支持单个 RDMA 连接在多个网络路径上分发流量,从而提高吞吐量、负载平衡和可用性,以满足大规模 AI 训练网络的需求。

可以将其理解为用巧妙布局的街道网格系统,取代贯穿城镇的单车道公路,并与实时路况应用相配合,使驾驶员能够自动绕过拥堵路段和封闭道路。

OpenAI 工业计算负责人 Sachin Katti 表示:“在 Blackwell 架构中部署 MRC 非常成功,这得益于与 NVIDIA 的强强合作。MRC 采用端到端方案,帮助我们避免许多典型的网络相关减速和中断,并保持大规模前沿训练运行的效率。”

此外,微软和 NVIDIA 保持长期深度合作,致力于推进下一代 AI 所需的基础设施。微软的 Fairwater以及 Oracle Cloud Infrastructure (OCI) Abilene 数据中心是两个专为训练和部署前沿大语言模型 (LLM) 而打造的超大规模 AI 工厂,它们依托 MRC 满足性能、规模和效率的要求。NVIDIA Spectrum-X 以太网完美契合此类场景,为大规模 AI 模型和应用,提供所需的稳定可靠的网络基础。

率先在生产环境中经过验证,性能在 NVIDIA Spectrum-X 以太网硬件上得到优化,现已通过 Open Compute Project发布为开放规范,MRC 展示了 Spectrum-X 以太网平台的强大能力:专门优化的硬件、深度遥测和智能网络控制协同工作,将新协议 (一套控制数据如何在网络中两个系统之间移动的规则) 从概念转化为超大规模 AI 生产。

MRC 通过在所有可用路径上实现流量负载均衡,大幅提升 GPU 利用率,使每个 GPU 在整个训练过程中获得充足的带宽。即使在拥塞情况下,它也能通过实时动态规避超载路径来维持高带宽传输。

当发生数据丢失时,智能重传技术可实现快速精确的恢复,最大限度地降低对长期运行作业的短暂中断的影响,从而降低 GPU 空闲时间。

管理员还可以对流量路径进行精细的可视性和控制,从而简化运维并加速大规模系统上的故障排除。

在 Spectrum-X 以太网上部署的 MRC,经过优化和设计,助力大规模系统的可靠性。其故障旁路技术可以在几微秒内检测到网络路径故障,并自动通过硬件方式重新路由流量。

这项故障旁路技术对于 AI 训练集群至关重要,因为在这些集群中,数千个 GPU 必须保持同步,即使是短暂的网络中断也会减慢或中断整个训练作业。Spectrum-X 以太网通过硬件级响应速度来防止这种情况,使流量沿着精确的路径在超大规模 AI 网络中流动。

实现十亿瓦级 AI 工厂的另一项关键创新是多平面网络设计,OpenAI 部署 Spectrum-X 以太网并应用 MRC 技术来实现该设计。多平面网络由多个独立的网络或平面组成,每个平面都提供 GPU 之间的独立通信路径且互为备用。

NVIDIA Spectrum-X 多平面功能通过支持跨平面的硬件加速负载均衡来增强这种网络架构,在不牺牲性能的情况下提高了可靠性和可扩展性。这种设计继续保持可预测的低延迟,同时扩展到数十万个 GPU。

借助 Spectrum-X 以太网,客户可以自由选择多样的 RDMA 传输模型。Spectrum-X 以太网自适应 RDMA 和 MRC 传输协议以及其他自定义协议,均可原生运行在NVIDIA ConnectX SuperNIC以及Spectrum-X 以太网交换机组成的网络中,并支持多平面网络设计以实现超大规模扩展。

因此,为当今大型 AI 集群提供支持的 Spectrum-X 以太网硬件和软件基础设施为客户提供了充分的灵活性,使他们能够为自己的工作负载选择合适的传输方式。

MRC 传输协议是一个新的行业典型示例,使用 Spectrum-X 以太网作为灵活可组合的平台,与现代 AI 基础设施的整个领域进行深度集成。

随着 AI 工厂规模的不断扩大,网络需要做的不仅仅是快速传输数据,还需具备智能化、高可靠性且基于开放标准。NVIDIA Spectrum-X 以太网在三方面均表现出色,通过 MRC,持续将先进的 AI 网络推向新高度。

MRC 由 NVIDIA 与 AMD博通英特尔、微软和 OpenAI 合作开发。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 以太网
    +关注

    关注

    41

    文章

    6283

    浏览量

    181867
  • NVIDIA
    +关注

    关注

    14

    文章

    5722

    浏览量

    110251
  • AI
    AI
    +关注

    关注

    91

    文章

    41920

    浏览量

    303004

原文标题:NVIDIA Spectrum-X — 开放的 AI 原生以太网架构 — 全面支持 MRC,为超大规模 AI 设定新标准

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    DPE5500/W5500—SPI 接口以太网协议栈芯片

    )。 DPE5500实现的硬件TCP/IP协议支持TCP,UDP,IPv4,ARP,ICMP和IGMP等协议。DPE5500集成了32K字节缓存用于以太网数据包的收发,最多
    发表于 05-21 17:46

    STM32以太网(ETH)外设在Anybus CompactCom40 Ethernet平台上的快速验证

    工业以太网占比持续攀升,设备常需同时支持工业协议与通用以太网(如后台网页、私有协议)。Anybus CompactCom 40提供RMII接
    的头像 发表于 05-20 16:52 195次阅读
    STM32<b class='flag-5'>以太网</b>(ETH)外设在Anybus CompactCom40 Ethernet平台上的快速验证

    Microchip推出新一代100/1000BASE T1单对以太网PHY 集成MACsec安全、时间敏感网络与功能安全特性

    LAN878x与LAN888x PHY系列为汽车及工业系统提供安全可靠且可扩展的以太网连接 随着汽车与工业领域设计人员广泛采用单对以太网(SPE)与全
    的头像 发表于 05-20 12:00 2828次阅读
    Microchip推出新一代100/1000BASE T1单对<b class='flag-5'>以太网</b>PHY 集成MACsec安全、时间敏感网络与功能安全特性

    物联网架构下温湿度远程监测、数据上传及云平台管理方案

    原标题:以太网温湿度记录仪技术方案 以太网温湿度记录仪突出功能: 1.以太网协议 支持 MODBUS TCP IP
    的头像 发表于 03-25 10:28 269次阅读
    物联<b class='flag-5'>网架构</b>下温湿度远程监测、数据上传及云平台管理方案

    米尔RZ/T2H MPU支持支持多轴实时控制,助力工业以太网

    /IRT),外设功能可通过Cortex®-R52 CPU的低延迟访问控制多达9轴电机。同时支持包括工业以太网在内的多种通信协议,提升设备间的协作能力。 配套开发板 MYD-YT2HX开发板
    发表于 03-20 19:01

    NVIDIA Spectrum-X以太网硅光技术助力AI工厂网络创新

    NVIDIA 将率先为 AI 工厂引入采用光电一体封装 (CPO) 的优化以太网网络,通过 NVIDIA Spectrum-X 以太网硅光
    的头像 发表于 01-14 09:06 982次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Spectrum-X</b><b class='flag-5'>以太网</b>硅光技术助力AI工厂网络创新

    DP83847 DsPHYTER II:单10/100以太网收发器的全面解析

    层,能够支持10BASE - T和100BASE - TX以太网协议,可通过3类(10 Mb/s)或5类非屏蔽双绞线电缆进行数据传输。它设计的初衷是为了方
    的头像 发表于 12-30 16:20 629次阅读

    电能质量在线监测装置支持以太网冗余备份吗?

    :按产品定位分层 产品定位 以太网冗余支持程度 典型配置 代表品牌 / 型号 高端(A 级标准) 全面支持,多链路冗余 4 路以太网(3 主
    的头像 发表于 12-12 16:12 969次阅读
    电能质量在线监测装置<b class='flag-5'>支持</b><b class='flag-5'>以太网</b>冗余备份吗?

    NVIDIA扩大与微软合作推动AI超级工厂建设

    在 Microsoft Ignite 大会上,NVIDIA 扩大与微软的合作,包括在由 NVIDIA Blackwell 平台驱动的全新 Microsoft Fairwater AI 超级工厂中部署新一代 NVIDIA
    的头像 发表于 12-01 09:52 1079次阅读

    新思科技VIP全面支持以太网与UALink协议

    以太网针对横向扩展架构设计,是一种专为AI量身定制的开放、可互操作、高性能协议解决方案,得到了交换机、网络、半导体和系统供应等领域的知名企业及超大规模用户的支持
    的头像 发表于 11-03 16:08 1315次阅读
    新思科技VIP<b class='flag-5'>全面</b><b class='flag-5'>支持</b>超<b class='flag-5'>以太网</b>与UALink<b class='flag-5'>协议</b>

    工业互联网架构是怎么样的

    ,具体解析如下: 一、网络层:连接物理与数字世界的桥梁 网络层是工业互联网的基础,负责实现人、机、物、系统之间的泛在互联与数据高效传输。其核心架构包括: 工业以太网支持实时控制与高带宽传输,如PROFINET、EtherCA
    的头像 发表于 10-18 09:37 928次阅读

    NVIDIA Spectrum-X 以太网交换机助力 Meta 和 Oracle 加速网络性能

    基于 NVIDIA Spectrum-X 以太网交换机的 AI 数据中心网络。 Meta 和 Oracle 正将 Spectrum-X 以太网
    的头像 发表于 10-14 10:26 2173次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Spectrum-X</b> <b class='flag-5'>以太网</b>交换机助力 Meta 和 Oracle 加速网络性能

    NVIDIA在Hot Chips 2025大会展示创新技术

    本周在加利福尼亚州帕洛阿尔托(Palo Alto)举行的 Hot Chips 大会上,NVIDIA 专家详细介绍了 NVIDIA NVLink 和Spectrum-X 以太网技术、Bl
    的头像 发表于 08-27 12:52 2110次阅读

    NVIDIA推出Spectrum-XGS以太网技术

    NVIDIA 今日宣布推出 NVIDIA Spectrum-XGS 以太网。这项跨区域扩展(scale-across)技术可将多个分布式数据中心组合成一个十亿瓦级 AI 超级工厂。
    的头像 发表于 08-27 12:51 1545次阅读

    以太网入门:从零开始,掌握以太网基础知识!

    以太网是一种基于异步载波侦听多路访问/冲突检测(CSMA/CD)协议的通信技术。它支持的有效负载大小为46-1500个八位字节,数据速率可达10Mbps、10
    的头像 发表于 06-09 14:00 4117次阅读
    <b class='flag-5'>以太网</b>入门:从零开始,掌握<b class='flag-5'>以太网</b>基础知识!