0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

简单认识NVIDIA网络平台

NVIDIA英伟达 来源:NVIDIA英伟达 2024-09-09 09:22 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA 带来知乎精彩问答甄选系列,将为您精选知乎上有关 NVIDIA 产品的精彩问答。

本期将为您带来更多 NVIDIA 网络平台的介绍。

以下两个知乎甄选问答将为您带来更多关于 NVIDIA Spectrum-X800 平台和 NVIDIA Quantum-X800 平台的信息!

Q:NVIDIA Spectrum-X800 平台是什么,能否详细介绍一下?

A:

NVIDIA Spectrum-X800 平台是业界第一代 800Gb/s 的以太网网络平台,包括了 NVIDIA Spectrum SN5600 800Gb/s 以太网交换机和 NVIDIA BlueField-3 SuperNIC,为多租户生成式 AI 云和大型企业级用户提供了各种至关重要的先进功能。其核心结构是交换机 + SuperNIC(超级网卡)+ LinkX + DOCA 软件开发包 + NCCL 集合通信库。

大模型的发展推动了 AI 云的爆发性增长,由于资金、经验、时间、能耗等因素的影响,很多 AI 用户选择通过云的方式解决算力问题。如何快速构建 AI 云,在云上提供高性能的算力资源,保障多用户上云和运行业务的安全性,避免多用户运行多任务时的互相干扰导致业务性能降低,是当前 AI 云提供商首要考虑的问题。NVIDIA Spectrum-X800 通过优化网络性能,加快 AI 工作负载的处理、分析和执行速度,进而缩短 AI 解决方案的开发、部署和上市时间。Spectrum-X800 专为多租户环境打造,实现了每个租户的 AI 工作负载的性能隔离,使业务性能能够持续保持在最佳状态,提升客户满意度和服务质量。

NVIDIA Spectrum-X800 平台的出现是生成式 AI 云发展的必然趋势,AI 云的出现彻底颠覆了数据中心对于网络的需求。传统的数据中心运行的任务多,但是单任务的算力需求不大,任务的耦合性不强,网络的性能对于业务的影响不大。但是大模型的出现,替代了大量的传统任务,All In AI 成为了很多云服务商和数据中心的追求目标,数据中心成为了运行少量的 AI 任务,但是每个 AI 任务的计算量都相当大,且每个计算单元之间的耦合性很强,网络决定了数据中心的性能。Spectrum-X800 平台是基于 NCCL 的全面 RoCE 端到端优化平台,涵盖了对于 AI 训练至关重要的动态路由(AR - Adaptive Routing)、可编程拥塞控制等技术和业务性能隔离技术等,可以充分发挥网络的通信效率,摆脱了以太网难扩展的桎梏,保障了云上任务的性能和安全性。

Q:大神们介绍下 NVIDIA Quantum-X800 平台?

A:

NVIDIA Quantum-X800 平台是业界第一代 800Gb/s 的端到端高性能网络平台,包括了 NVIDIA Quantum Q3400 交换机和 NVIDIA ConnectX-8 SuperNIC,它的出现,树立了 AI 专用基础设施极致性能的新标杆。其核心结构是:交换机 + SuperNIC(超级网卡)+ PCIe 交换机 + LinkX + 网络计算引擎 + NCCL 集合通信库。

大模型的发展推动着算力的不断提升,同时降低算力功耗的需求也已经变得更为苛刻。如何在提升计算性能同时,又能降低能源的消耗,更高性能的 GPU 和网络是构建新型 AI 基础设施的关键。NVIDIA Quantum-X800 平台是专为 NVIDIA Blackwell 架构产品的 Scale Out 而量身打造,为超过万亿参数级的 GPU 计算和 AI 基础设施进行了全面的优化,相比上一代计算平台实现了性能的大幅提升,同时在同等算力的前提下又实现了功耗的大幅降低。

Quantum-X800 是 Quantum-2 平台的下一代产品,在 Quantum-2 平台的基础之上,进一步提升了端口的速度、交换机端口的密度、网络计算的能力、以及在软件上和业界流行的通信框架上进行了更深层优化,单交换机可支持 144 个 800GB/s 端口,实现了 FP8 的网络计算,SuperNIC 内置 PCIe6.0 交换机,可直连 GPU 和 CPU,摆脱了 GPU 和网络之间的通信需要依赖于 CPU 或者 PCIe 交换机总线带宽的限制,大幅提升了 AI、数据处理和高性能计算的性能。

Quantum Q3400 平台可以支持 14.4TFlops 的网络计算能力(SHARPv4),是上一代交换机的 9 倍,可以卸载 GPU 和 CPU 的计算类集合通信;Connect-X800 SuperNIC 可以通过内置 PCIe6.0 交换机直接与最新的 Blackwell 架构产品互连,提供 800Gb/s 的单端口网络通信带宽,仅用两层网络交换就可以支持 10,368 卡的 800Gb/s/GPU 互连或者 13,824 卡的 400Gb/s/GPU 互连,三层网络可以支持超过 70 万张卡的 800Gb/s/GPU 互连。

NVIDIA Quantum-X800 平台实现了单端口性能的加倍,交换容量的 5 倍提升,网络计算能力的 9 倍提升,为大模型训练和生成式 AI 提供超强的性能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 以太网
    +关注

    关注

    41

    文章

    6291

    浏览量

    181923
  • NVIDIA
    +关注

    关注

    14

    文章

    5725

    浏览量

    110288
  • 网络平台
    +关注

    关注

    0

    文章

    20

    浏览量

    8233

原文标题:NVIDIA 知乎精彩问答甄选 | 探索 NVIDIA 网络平台

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    简单认识Vector CANape Kernel软件平台

    作为Vector历史最悠久的核心软件平台之一(你知道另外一个吗?),CANape在测量与标定领域有近30年的使用历史,已经成为集测量、标定、诊断、刷写、自动化离线分析与报告为一体的综合性工具。
    的头像 发表于 04-23 11:37 406次阅读
    <b class='flag-5'>简单</b><b class='flag-5'>认识</b>Vector CANape Kernel软件<b class='flag-5'>平台</b>

    NVIDIA cuDF和cuVS获全球领先数据平台采用

    企业每年产生数百 ZB (Zettabyte) 的数据,并在争相将这些信息转化为洞察。NVIDIA cuDF 和 cuVS 作为基于 NVIDIA CUDA-X 构建的加速数据库,正在被各行业的数据平台所应用,带来至高 5 倍性
    的头像 发表于 03-19 15:46 589次阅读

    NVIDIA携手合作伙伴基于AI-RAN平台构建未来AI原生无线网络

    实地试验、新的性能基准测试、日益增长的运营商采纳率,以及合作伙伴基于 NVIDIA 平台构建的创新成果,共同印证了行业正加速迈向 AI 原生 5G 与 6G 网络
    的头像 发表于 03-09 16:36 1152次阅读

    NVIDIA DRIVE AV软件平台与Halos架构助力梅赛德斯奔驰CLA车型获得最高安全评分

    NVIDIA DRIVE AV 软件平台NVIDIA Halos 架构助力 CLA 车型获得最高安全评分(top safety rating)。
    的头像 发表于 02-02 09:28 2466次阅读

    NVIDIA DGX SuperPOD为Rubin平台横向扩展提供蓝图

    NVIDIA DGX Rubin 系统整合了 NVIDIA 在计算、网络和软件领域的最新突破,将推理 token 成本降至 NVIDIA Blackwell
    的头像 发表于 01-14 09:14 1001次阅读

    NVIDIA Spectrum-X以太网硅光技术助力AI工厂网络创新

    NVIDIA 将率先为 AI 工厂引入采用光电一体封装 (CPO) 的优化以太网网络,通过 NVIDIA Spectrum-X 以太网硅光技术,为 NVIDIA Rubin
    的头像 发表于 01-14 09:06 992次阅读
    <b class='flag-5'>NVIDIA</b> Spectrum-X以太网硅光技术助力AI工厂<b class='flag-5'>网络</b>创新

    超擎数智为您深度解析NVIDIA Quantum-X800 InfiniBand平台

    NVIDIA
    专精特新
    发布于 :2026年01月08日 19:47:03

    NVIDIA Omniverse基于Container的部署推流方案

    为了让客户能够高效安装和部署 NVIDIA Omniverse 及 NVIDIA Isaac 平台NVIDIA 现已推出简单便捷的容器化部
    的头像 发表于 12-17 10:17 1075次阅读
    <b class='flag-5'>NVIDIA</b> Omniverse基于Container的部署推流方案

    NVIDIA DGX Spark平台上对NVIDIA ConnectX-7 200G网卡配置教程

    NVIDIA DGX Spark 平台上对 NVIDIA ConnectX-7 200G 网卡进行配置时,会遇到“4 个逻辑端口”现象。理解背后的真相是后续所有配置的基础。本文将从此现象入手,逐步解析其原理,并提供从基础配置
    的头像 发表于 11-21 09:19 6384次阅读
    在<b class='flag-5'>NVIDIA</b> DGX Spark<b class='flag-5'>平台</b>上对<b class='flag-5'>NVIDIA</b> ConnectX-7 200G网卡配置教程

    NVIDIA宣布开源Aerial软件

    NVIDIA 开源其 Aerial 软件,并将 NVIDIA Sionna 研究套件和 Aerial 测试平台引入 NVIDIA DGX Spark
    的头像 发表于 11-03 15:14 1313次阅读

    NVIDIA与Uber合作推进全球L4级自动驾驶移动出行网络

    NVIDIA 宣布与 Uber 达成合作,将共同扩展全球 L4 级自动驾驶移动出行网络。合作将依托 Uber 新一代无人驾驶出租车和自动配送车队,采用全新 NVIDIA DRIVE AGX Hyperion 10 辅助驾驶开发
    的头像 发表于 11-03 14:33 1600次阅读

    NVIDIA AI网络闪耀2025云栖大会

    2025 云栖大会于 9 月 24 日至 9 月 26 日举办,NVIDIA 作为大会巅峰合作伙伴参与 2025 云栖大会。本文将带您回顾 NVIDIA AI 网络在本届云栖大会上的精彩内容。
    的头像 发表于 10-13 11:19 1491次阅读

    利用NVIDIA DPU重塑网络安全格局

    在第三届 NVIDIA DPU 黑客松竞赛中,我们见证了开发者与 NVIDIA 网络技术的深度碰撞。在 23 支参赛队伍中,有 5 支队伍脱颖而出,展现了在 AI 网络、存储和安全等领
    的头像 发表于 08-20 14:31 1704次阅读

    使用外部文件导入NVIDIA Air构建网络拓扑的优势

    NVIDIA Air 具有仿真从小型网络到整个数据中心的任何网络的独特能力。在开始配置、路由或管理之前,请先考虑拓扑。
    的头像 发表于 07-09 16:32 1276次阅读

    NVIDIA技术助力欧洲厂商推出机器人系统与平台

    基于 NVIDIA 安全的全栈机器人开发平台,Agile Robots、Humanoid、Neura Robotics、Universal Robots、Vorwerk 和 Wandelbots 等公司推出 NVIDIA 加速的
    的头像 发表于 06-16 13:54 1913次阅读