0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

通过NVIDIA RTX PRO服务器加速企业工作负载

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2025-06-12 15:31 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

从大语言模型(LLM)到代理式 AI 推理和物理 AI ,随着 AI 工作负载的复杂性和规模不断增加,人们对更快、扩展性更高的计算基础设施的需求空前强烈。满足这些需求就要从基础开始重新思考系统架构。

NVIDIA 正在通过NVIDIA ConnectX-8 SuperNIC升级平台架构。NVIDIA ConnectX-8 SuperNIC 是业内首款在单个设备中集成PCIe6.0 交换机和超高速网络的 SuperNIC。ConnectX-8 专为现代 AI 基础架构设计,可提供更高的吞吐量,同时简化系统设计,并提高能效和成本效益。

为 PCIe6.0 连接的时代做好准备

在基于 PCIe 连接的平台中,尤其是配备 8 个或更多 GPU 的平台,PCIe 交换机对于最大化 GPU 间通信带宽和实现可扩展的 GPU 拓扑至关重要。现有设计依赖于独立的 PCIe 交换机,这通常会增加设计复杂性,并可能会限制性能和效率。

ConnectX-8 通过内置的 PCIe6.0 交换机提供 48 通道的 PCIe6.0 连接解决了这一问题。将 GPU 到 GPU 和 GPU 到 NIC 通信整合到单一高性能设备中,消除了对独立 PCIe 交换机的需求,减少了元器件数量并简化了主板设计,为 AI 基础设施打造了更具成本效益、可扩展的架构。

此外,凭借原生 PCIe6.0 支持,ConnectX-8 可满足新一代 GPU、CPU 和 IO 加速器日益增长的 IO 需求。它使系统架构师能够设计出向前兼容的平台,能够充分享用领先的高吞吐 PCIe6.0 设备的带宽。

通过 NVIDIA RTX PRO 服务器加速企业工作负载

ConnectX-8 SuperNIC 现已全面投产。 在 COMPUTEX 2025 上,ConnectX-8 被发布用于全球各系统合作伙伴的 NVIDIA RTX PRO 服务器中。

图 1 比较了两种服务器架构:采用独立 PCIe 交换机的传统设计,以及采用 NVIDIA ConnectX-8 SuperNIC 集成 PCIe6.0 交换机的 NVIDIA RTX PRO 服务器的 优化配置。

fcddee3a-4533-11f0-b715-92fbcf53809c.png

图 1:传统(左)和与采用 ConnectX-8 SuperNIC 优化(右)服务器设计的比较

在传统设计中,服务器布局包括 2 个 CPU、8 个 GPU 和 5 个 NIC(包括 4 个 NVIDIA ConnectX-7 NIC 和 1 个 NVIDIA BlueField-3 DPU)。这种配置还需要两到四个独立的 PCIe 交换机来实现 GPU 到 GPU 和 GPU 到 NIC 的连接,从而增加复杂性和组件数量。

在优化过的设计中,用 ConnectX-8 SuperNIC 替换掉了专用 PCIe 交换机,将 PCIe6.0 交换和 800 Gb/s 网络集成在了单一网卡设备中。

它使每个 GPU 的网络带宽翻倍,有助于消除 IO 瓶颈,并加快 GPU、NIC 和存储之间的数据移动速度。因此,此 NVIDIA RTX PRO 服务器平台可提供高达 2 倍的 NCCL all-to-all 性能,加速在多 GPU 和多节点工作负载中至关重要的集合通信,并提高 AI 工厂的可扩展性。

在图 1 的基础上,图 2 让我们更深入地了解经过优化设计的服务器架构如何改善三种主要 GPU 通信路径之间的连接:

GPU 到 GPU 通信跨越两个 CPU 插座:在传统设计中,此路径可能会遇到主机 CPU 和内部插座瓶颈问题,根据 CPU 之间链路的利用率不同,可能被限制在 25 GB/s 或更低的速度。相比之下,基于 ConnectX-8 的优化设计可为集群内的所有 GPU 间通信提供高达 每个GPU 50 GB/s 的 IO 带宽,因为 NCCL 直接通过网络转发所有流量。

GPU 到 NIC 通信:在 2:1 的 GPU 到 NIC 配置下,经过优化的架构为每个 GPU 提供 50 GB/s 的带宽,无论 GPU 或主机系统是 PCIe5.0 或 PCIe6.0。

GPU 到 GPU 通信通过同一 PCIe 交换机:相较 PCIe5.0,配备 PCIe6.0 的系统可将带宽提高一倍,从而显著加速同一 PCIe 交换机上的点对点 GPU 传输。

fd17dd0c-4533-11f0-b715-92fbcf53809c.png

图 2:传统(左)和与采用 ConnectX-8 SuperNIC 的优化(右)服务器设计的比较,强调了三种关键的 GPU 通信路径

通过将 PCIe 交换直接集成到 SuperNIC 中,ConnectX-8 还简化了主板设计、改善了气流并增强了可维护性。这将打造一个更紧凑、更节能、更经济高效的平台。在 NVIDIA 参考设计的支持下,这项创新可帮助系统厂商更快地扩展其系统,并提高性能及降低 TCO。

基于 PCIe 总线的 AI 基础架构的未来

NVIDIA ConnectX-8 正在重新定义基于 PCIe 总线的系统的可能性。通过将 PCIe6.0 交换机和高性能 SuperNIC 集成到单一集成设备中,ConnectX-8 可简化服务器设计,减少组件数量,并解锁现代 AI 工作负载所需的高带宽通信路径。从而打造更简单、更节能的平台,同时降低总体拥有成本(TCO)并实现出色的性能可扩展性。

此外,ConnectX-8 SuperNIC 还可在基于多 GPU 的平台中实现增强的机密计算能力。

在 COMPUTEX 2025 上,领先的数据中心合作伙伴展示了由内置 NVIDIA ConnectX-8 SuperNIC 的 NVIDIA RTX PRO 服务器所加速的先进 AI 平台架构。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109076
  • 总线
    +关注

    关注

    10

    文章

    3014

    浏览量

    91299
  • AI
    AI
    +关注

    关注

    89

    文章

    38090

    浏览量

    296502
  • PCIe
    +关注

    关注

    16

    文章

    1420

    浏览量

    87541

原文标题:NVIDIA ConnectX-8 SuperNIC 通过 PCIe6.0 总线升级 AI 平台架构

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA RTX PRO 2000 Blackwell GPU性能测试

    越来越多的应用正在使用 AI 加速,而无论工作站的大小或形态如何,都有越来越多的用户需要 AI 性能。NVIDIA RTX PRO 2000
    的头像 发表于 11-28 09:39 3592次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>RTX</b> <b class='flag-5'>PRO</b> 2000 Blackwell GPU性能测试

    基于NVIDIA GPU的加速服务 为AI、机器学习和AI工作负载提速

    2019年8月26日 ——NVIDIA和VMware今日宣布将为VMware Cloud on AWS推出基于NVIDIA GPU的加速服务,为AI、机器学习和数据分析
    发表于 08-30 09:36 1660次阅读

    nVidia许可服务器存在问题

    客户在其环境中拥有nVidia Licensing服务器(vSphere Enterprise Plus和Horizo​​n 7)。许可证文件在nVidia企业门户中生成,并且许可证
    发表于 09-20 11:41

    华秋第八届硬创大赛携手NVIDIA初创加速计划,赋能企业发展

    中心、上海创智空间等各大国家级科技企业孵化及大型产业园区;05 华秋增值服务媒体推广矩阵:通过500万+电子发烧友社区平台提供优质流量及曝光量,参赛
    发表于 07-11 11:28

    负载均衡服务器有哪些

    负载均衡服务器是进行负载分配的服务器通过负载均衡服务器
    发表于 12-21 10:02 1359次阅读
    <b class='flag-5'>负载</b>均衡<b class='flag-5'>服务器</b>有哪些

    RTX刀片服务器实现云渲染密度、效率及可扩展性的飞跃

    NVIDIA RTX服务器包括全面优化的软件堆栈,可用于Optix RTX渲染、游戏、VR和AR、以及专业可视化应用程序。如今NVIDIA
    的头像 发表于 03-22 15:28 4751次阅读

    NVIDIA虚拟工作站新版本可支持RTX服务器

    Teradici首席执行官David Smith表示:“NVIDIA RTX服务器为设计人员和内容创作者提供了强大的虚拟工作站体验。通过Qu
    的头像 发表于 04-03 12:34 3646次阅读

    NVIDIA宣布一套用于构建GPU加速ARM服务器的参考设计

    在最新的超级计算大会上,NVIDIA创始人兼CEO黄仁勋宣布了一套用于构建GPU加速ARM服务器的参考设计,从而大大扩展GPU加速对于超级计算机的支持。
    的头像 发表于 11-20 15:30 3255次阅读

    NVIDIA公布通过NVIDIA认证系统测试的全球首批加速服务器 企业 AI 使用量倍增

    芯东西1月27日报道,刚刚,NVIDIA公布通过NVIDIA认证系统测试的全球首批加速服务器,它们是目前业内唯一
    的头像 发表于 01-27 16:25 2391次阅读

    NVIDIA Grace超级芯片为HPC及AI工作负载提速

    NVIDIA于今日宣布,多家全球领先的计算机制造商正在采用全新NVIDIA Grace™超级芯片打造新一代服务器,为超大规模时代的AI和HPC工作
    的头像 发表于 05-31 19:28 3051次阅读
    <b class='flag-5'>NVIDIA</b> Grace超级芯片为HPC及AI<b class='flag-5'>工作</b><b class='flag-5'>负载</b>提速

    使用NVIDIA Triton推理服务器加速AI预测

    这家云计算巨头的计算机视觉和数据科学服务使用 NVIDIA Triton 推理服务器加速 AI 预测。
    的头像 发表于 02-29 14:04 1326次阅读

    NVIDIA Blackwell RTX PRO 提供工作站和服务器两种规格,助力设计师、开发者、数据科学家和创作人员构建代理式

    月 18 日 —— NVIDIA 今日发布了 NVIDIA RTX PRO™ Blackwell 系列工作站和
    发表于 03-19 09:50 544次阅读
    <b class='flag-5'>NVIDIA</b> Blackwell <b class='flag-5'>RTX</b> <b class='flag-5'>PRO</b> 提供<b class='flag-5'>工作</b>站和<b class='flag-5'>服务器</b>两种规格,助力设计师、开发者、数据科学家和创作人员构建代理式

    NVIDIA加速的Apache Spark助力企业节省大量成本

    随着 NVIDIA 推出 Aether 项目,通过采用 NVIDIA 加速的 Apache Spark 企业得以自动
    的头像 发表于 03-25 15:09 894次阅读
    <b class='flag-5'>NVIDIA</b><b class='flag-5'>加速</b>的Apache Spark助力<b class='flag-5'>企业</b>节省大量成本

    NVIDIA RTX AI加速FLUX.1 Kontext现已开放下载

    NVIDIA RTXNVIDIA TensorRT 现已加速 Black Forest Labs 的最新图像生成和编辑模型;此外,Gemma 3n 现可借助
    的头像 发表于 07-16 09:16 1856次阅读

    NVIDIA RTX PRO 4500 Blackwell GPU测试分析

    今天我们带来全新 NVIDIA Blackwell 架构 GPU —— NVIDIA RTX PRO 4500 Blackwell 的测试,对比上一代产品
    的头像 发表于 08-28 11:02 2868次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>RTX</b> <b class='flag-5'>PRO</b> 4500 Blackwell GPU测试分析