0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

简单认识NVIDIA网络平台

NVIDIA英伟达 来源:NVIDIA英伟达 2024-09-09 09:22 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA 带来知乎精彩问答甄选系列,将为您精选知乎上有关 NVIDIA 产品的精彩问答。

本期将为您带来更多 NVIDIA 网络平台的介绍。

以下两个知乎甄选问答将为您带来更多关于 NVIDIA Spectrum-X800 平台和 NVIDIA Quantum-X800 平台的信息!

Q:NVIDIA Spectrum-X800 平台是什么,能否详细介绍一下?

A:

NVIDIA Spectrum-X800 平台是业界第一代 800Gb/s 的以太网网络平台,包括了 NVIDIA Spectrum SN5600 800Gb/s 以太网交换机和 NVIDIA BlueField-3 SuperNIC,为多租户生成式 AI 云和大型企业级用户提供了各种至关重要的先进功能。其核心结构是交换机 + SuperNIC(超级网卡)+ LinkX + DOCA 软件开发包 + NCCL 集合通信库。

大模型的发展推动了 AI 云的爆发性增长,由于资金、经验、时间、能耗等因素的影响,很多 AI 用户选择通过云的方式解决算力问题。如何快速构建 AI 云,在云上提供高性能的算力资源,保障多用户上云和运行业务的安全性,避免多用户运行多任务时的互相干扰导致业务性能降低,是当前 AI 云提供商首要考虑的问题。NVIDIA Spectrum-X800 通过优化网络性能,加快 AI 工作负载的处理、分析和执行速度,进而缩短 AI 解决方案的开发、部署和上市时间。Spectrum-X800 专为多租户环境打造,实现了每个租户的 AI 工作负载的性能隔离,使业务性能能够持续保持在最佳状态,提升客户满意度和服务质量。

NVIDIA Spectrum-X800 平台的出现是生成式 AI 云发展的必然趋势,AI 云的出现彻底颠覆了数据中心对于网络的需求。传统的数据中心运行的任务多,但是单任务的算力需求不大,任务的耦合性不强,网络的性能对于业务的影响不大。但是大模型的出现,替代了大量的传统任务,All In AI 成为了很多云服务商和数据中心的追求目标,数据中心成为了运行少量的 AI 任务,但是每个 AI 任务的计算量都相当大,且每个计算单元之间的耦合性很强,网络决定了数据中心的性能。Spectrum-X800 平台是基于 NCCL 的全面 RoCE 端到端优化平台,涵盖了对于 AI 训练至关重要的动态路由(AR - Adaptive Routing)、可编程拥塞控制等技术和业务性能隔离技术等,可以充分发挥网络的通信效率,摆脱了以太网难扩展的桎梏,保障了云上任务的性能和安全性。

Q:大神们介绍下 NVIDIA Quantum-X800 平台?

A:

NVIDIA Quantum-X800 平台是业界第一代 800Gb/s 的端到端高性能网络平台,包括了 NVIDIA Quantum Q3400 交换机和 NVIDIA ConnectX-8 SuperNIC,它的出现,树立了 AI 专用基础设施极致性能的新标杆。其核心结构是:交换机 + SuperNIC(超级网卡)+ PCIe 交换机 + LinkX + 网络计算引擎 + NCCL 集合通信库。

大模型的发展推动着算力的不断提升,同时降低算力功耗的需求也已经变得更为苛刻。如何在提升计算性能同时,又能降低能源的消耗,更高性能的 GPU 和网络是构建新型 AI 基础设施的关键。NVIDIA Quantum-X800 平台是专为 NVIDIA Blackwell 架构产品的 Scale Out 而量身打造,为超过万亿参数级的 GPU 计算和 AI 基础设施进行了全面的优化,相比上一代计算平台实现了性能的大幅提升,同时在同等算力的前提下又实现了功耗的大幅降低。

Quantum-X800 是 Quantum-2 平台的下一代产品,在 Quantum-2 平台的基础之上,进一步提升了端口的速度、交换机端口的密度、网络计算的能力、以及在软件上和业界流行的通信框架上进行了更深层优化,单交换机可支持 144 个 800GB/s 端口,实现了 FP8 的网络计算,SuperNIC 内置 PCIe6.0 交换机,可直连 GPU 和 CPU,摆脱了 GPU 和网络之间的通信需要依赖于 CPU 或者 PCIe 交换机总线带宽的限制,大幅提升了 AI、数据处理和高性能计算的性能。

Quantum Q3400 平台可以支持 14.4TFlops 的网络计算能力(SHARPv4),是上一代交换机的 9 倍,可以卸载 GPU 和 CPU 的计算类集合通信;Connect-X800 SuperNIC 可以通过内置 PCIe6.0 交换机直接与最新的 Blackwell 架构产品互连,提供 800Gb/s 的单端口网络通信带宽,仅用两层网络交换就可以支持 10,368 卡的 800Gb/s/GPU 互连或者 13,824 卡的 400Gb/s/GPU 互连,三层网络可以支持超过 70 万张卡的 800Gb/s/GPU 互连。

NVIDIA Quantum-X800 平台实现了单端口性能的加倍,交换容量的 5 倍提升,网络计算能力的 9 倍提升,为大模型训练和生成式 AI 提供超强的性能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 以太网
    +关注

    关注

    41

    文章

    5923

    浏览量

    179537
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109095
  • 网络平台
    +关注

    关注

    0

    文章

    20

    浏览量

    8205

原文标题:NVIDIA 知乎精彩问答甄选 | 探索 NVIDIA 网络平台

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA与Uber合作推进全球L4级自动驾驶移动出行网络

    NVIDIA 宣布与 Uber 达成合作,将共同扩展全球 L4 级自动驾驶移动出行网络。合作将依托 Uber 新一代无人驾驶出租车和自动配送车队,采用全新 NVIDIA DRIVE AGX Hyperion 10 辅助驾驶开发
    的头像 发表于 11-03 14:33 1043次阅读

    NVIDIA AI网络闪耀2025云栖大会

    2025 云栖大会于 9 月 24 日至 9 月 26 日举办,NVIDIA 作为大会巅峰合作伙伴参与 2025 云栖大会。本文将带您回顾 NVIDIA AI 网络在本届云栖大会上的精彩内容。
    的头像 发表于 10-13 11:19 800次阅读

    利用NVIDIA DPU重塑网络安全格局

    在第三届 NVIDIA DPU 黑客松竞赛中,我们见证了开发者与 NVIDIA 网络技术的深度碰撞。在 23 支参赛队伍中,有 5 支队伍脱颖而出,展现了在 AI 网络、存储和安全等领
    的头像 发表于 08-20 14:31 1024次阅读

    使用外部文件导入NVIDIA Air构建网络拓扑的优势

    NVIDIA Air 具有仿真从小型网络到整个数据中心的任何网络的独特能力。在开始配置、路由或管理之前,请先考虑拓扑。
    的头像 发表于 07-09 16:32 786次阅读

    NVIDIA技术助力欧洲厂商推出机器人系统与平台

    基于 NVIDIA 安全的全栈机器人开发平台,Agile Robots、Humanoid、Neura Robotics、Universal Robots、Vorwerk 和 Wandelbots 等公司推出 NVIDIA 加速的
    的头像 发表于 06-16 13:54 1172次阅读

    NVIDIA实现神经网络渲染技术的突破性增强功能

    近日,NVIDIA 宣布了 NVIDIA RTX 神经网络渲染技术的突破性增强功能。NVIDIA 与微软合作,将在 4 月的 Microsoft DirectX 预览版中增加神经
    的头像 发表于 04-07 11:33 870次阅读

    NVIDIA推出全新硅光网络交换机

    NVIDIA 今天推出了 NVIDIA Spectrum-X 和 NVIDIA Quantum-X 硅光网络交换机,使 AI 工厂能够跨区域连接数百万 GPU ,同时大幅降低能耗和运营
    的头像 发表于 03-20 14:52 824次阅读

    NVIDIA网络安全AI平台助力保护关键基础设施

    平台集成了 NVIDIA BlueField 和 Morpheus,并为 Armis、Check Point Software Technologies、CrowdStrike、Deloitte 和 WWT 的下一代网络防御提
    的头像 发表于 02-19 10:22 926次阅读

    使用NVIDIA推理平台提高AI推理性能

    NVIDIA推理平台提高了 AI 推理性能,为零售、电信等行业节省了数百万美元。
    的头像 发表于 02-08 09:59 1318次阅读
    使用<b class='flag-5'>NVIDIA</b>推理<b class='flag-5'>平台</b>提高AI推理性能

    NVIDIA DRIVE Hyperion平台达成安全与认证里程碑

    NVIDIA近日宣布,其自动驾驶汽车平台NVIDIA DRIVE AGX™ Hyperion已成功通过了两家业内权威认证机构——TÜV SÜD和TÜV Rheinland的汽车功能安全与网络
    的头像 发表于 01-13 10:51 734次阅读

    交通运输领先企业率先采用NVIDIA Cosmos平台

    支撑自动驾驶汽车开发有三个关键计算平台NVIDIA DGX 平台用于在数据中心训练基于 AI 的堆栈;运行在NVIDIA OVX 平台上的
    的头像 发表于 01-09 16:02 900次阅读

    NVIDIA发布Cosmos™平台,助力物理AI系统发展

    NVIDIA近日宣布推出全新的NVIDIA Cosmos™平台,该平台专为自动驾驶汽车(AV)和机器人等物理AI系统而设计,旨在推动这些领域的快速发展。 Cosmos
    的头像 发表于 01-08 15:36 895次阅读

    NVIDIA DRIVE Hyperion平台通过汽车功能安全和网络安全认证

    NVIDIA 宣布自动驾驶汽车平台NVIDIA DRIVE AGX Hyperion已通过两家业内权威的汽车功能安全和网络安全认证评估机构——TÜV SÜD 和 TÜV Rheinla
    的头像 发表于 01-08 10:43 1026次阅读

    NVIDIA Cosmos世界基础模型平台发布

    NVIDIA 宣布推出NVIDIA Cosmos,该平台由先进的生成式世界基础模型、高级 tokenizer、护栏和加速视频处理管线组成,将推动自动驾驶汽车(AV)和机器人等物理 AI 系统的发展。
    的头像 发表于 01-08 10:39 1031次阅读

    u-blox深化与NVIDIA Jetson和NVIDIA DRIVE Hyperion平台合作

    近日,作为提供定位和无线通信技术及服务的全球领先供应商u-blox(SIX:UBXN)宣布,作为在工业和汽车市场高精度定位领域的战略增长计划的关键一环,u-blox公司现已加强对NVIDIA Jetson和NVIDIA DRIVE Hyperion
    的头像 发表于 12-09 14:08 919次阅读