0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA LinkX 助力IB网络高速稳定与可靠传输

维维为 来源:维维为 作者:维维为 2022-07-27 17:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

InfiniBand(直译为“无限带宽”技术,缩写为IB)是一个用于高性能计算的计算机网络通信标准,是世界领先的超级计算机的互连首选。基于NVIDIA InfiniBand的端到端网络可实现极低的延迟,以及高数据吞吐量和传输速率。

InfiniBand网络主要用于高性能计算(HPC)场景,通过高速的InfiniBand技术,将业务负载由单机运行转化为基于多机协作的高性能计算集群。采用了InfiniBand网络技术,使得高性能集群的性能得以进一步地释放和优化。

作为未来算力的基本单元,高性能的数据中心也越来越多地采用InfiniBand网络方案,尤其是在超算中心中应用最为广泛。

本文中出现的与NVIDIA产品相关的图片或视频(完整或部分)的版权均归NVIDIA Corporation所有。

01

NVIDIA Quantum-2 InfiniBand平台:400Gb/s NDR InfiniBand网络互连

NVIDIA所提供的InfiniBand系列产品主要包括网卡、DPU、交换机以及LinkX线缆和光模块,速率从100Gb/s EDR到200Gb/s HDR再到最新的400Gb/s NDR。NVIDIA最新发布的Quantum-2 InfiniBand平台继续创造高性能网络的更高纪录,包括NVIDIA Quantum-2交换机、ConnectX-7网卡、BlueField-3 DPU、LinkX线缆和光模块,一同构成了面向新一代高性能计算、人工智能机器学习、大数据、云计算、Web 3.0和存储平台的完整400Gb/s NDR InfiniBand网络互连基础设施。

pYYBAGLhCE2ABPwRAABuvnat6YY902.jpg

NDR InfiniBand凭借其最高的数据吞吐量、极低的延迟和智能的网络计算加速引擎,可为要求最苛刻的计算和数据应用提供世界领先的性能和可扩展性。

NVIDIA Quantum-2 InfiniBand平台不但能够实现GPU Direct RDMAAI业务至关重要的技术。其中BlueField-3 DPU增加了DPA 引擎(Data-Path Accelerator)来对特定流量进行编程和加速。ConnectX-7 VPI系列IB网卡对各种通信模型基于网络的计算进行了专门优化,提高了All reduce 和 All-to-All等通信时的通信效率。凭借单端口每秒400Gbps的高吞吐量,NVIDIA Quantum-2 InfiniBand将端口速率提高一倍,网络物理端口数量增加1.5倍。Quantum-2平台的系统容量提升至上代产品的5倍,支持的数据中心的规模提升了6.5倍,而数据中心网络的能耗则降低了36%。

NVIDIA Quantum-2的盒式交换机,芯片采用7nm工艺,包含570亿个晶体管,配有64个400Gbps端口,通过Split线缆以提供多达128个200Gbps端口。交换机的双向总吞吐量为51.2Tb/s,具有超过每秒665亿数据包的标志性包转发能力。同时,Quantum-2平台提供不同端口数的模块化交换机系统,可以支持多达2048个,系统容量超出上一代5倍。基于NVIDIA Quantum-2交换机ASIC的盒式交换机和模块化交换机系统提供了全面的InfiniBand交换互连接解决方案,支持各种InfiniBand网络拓扑,包括Fat Tree、DragonFly+、多维 Torus等。

NVIDIA Quantum-2平台在主机端提供两个网络选项,ConnectX-7网卡和BlueField-3 DPU。ConnectX-7基于7nm工艺,包含80亿个晶体管,其数据传输速率是上一代的两倍,通过RDMA、GPU Direct Storage、GPU Direct RDMA和网络计算加速应用,充分发挥网络的能力。BlueField-3采用7nm工艺,包含220亿个晶体管,提供16个64位ARM CPU,基于数据IO的业务部署,提供加速、卸载和隔离的能力,优化了数据中心基础设施的架构。

为了打造完整的端到端400Gb/s InfiniBand 基础架构,NVIDIA Quantum-2还提供了LinkX解决方案,为用户提供一系列不同类型的400Gb/s DAC线缆(高速铜缆)、AOC线缆(有源光缆)以及光模块产品,以构建复杂的基础设施,可以为选择的拓扑结构提供最大的灵活性,针对不同的连接场景,提供全套的线缆模块方案。

pYYBAGLhCFqAShe4AAK7g1Hzql4213.png

NVIDIA LinkX拥有完善的产品体系,可提供不同的方案组合(光模块、DAC/AOC直连以及分支高速线缆),速率包括EDR(100G)、HDR(200G)和NDR(400G),外形尺寸涵盖QSFP28、QSFP56以及OSFP。

LinkX产品在NVIDIA“端到端”网络系统中发挥了最佳的效果和独特的功能,除了满足InfiniBand贸易协会 (IBTA) 标准外,LinkX产品在出厂之前完成了100% 真实业务测试,确保线缆模块的品质,从底层支持InfiniBand网络实现高性能。NVIDIA LinkX产品的低误码率、低延时、低功耗和高可靠性等特点可以与NVIDIA交换机和网卡产品完美适配,在具有严格要求的超级计算机和超大规模系统中提供了最优的传输效率。

02

构建InfiniBand网络出现的常见问题

目前市面上有部分客户在构建InfiniBand网络时使用了第三方的光模块、高速线缆等连接件产品,然而却在实际应用中出现了大量的问题,主要表现为:

1、网络链路不稳定:出现链路震荡现象

2、传输延时高:在推理、训练等业务负载下,大大延长训练周期

3、功耗高:产品发热异常,严重时甚至可能损坏设备

4、产品质量良莠不齐:经常出现大批量无法使用的情况

纳多德NADDOD——作为NVIDIA网络产品Elite Partner (精英级别合作伙伴),致力于为客户提供高品质高性能光网络解决方案,在为客户搭建高性能网络方案的过程中,收到不少因使用第三方InfiniBand连接件而出现售后问题的反馈,导致用户网络延迟甚至中断,额外增加了客户处理售后问题所花费的时间成本。

结合大量真实案例中出现的情况,纳多德NADDOD建议在InfiniBand网络中使用的连接件(DAC/AOC线缆、光模块),一定要选用NVIDIA LinkX原厂线缆,以最大程度地保证连接件与设备之间的适配性,以及保障网络的稳定传输与高可靠性。

审核编辑 黄昊宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109091
  • InfiniBand
    +关注

    关注

    1

    文章

    31

    浏览量

    9534
  • 英伟达
    +关注

    关注

    23

    文章

    4040

    浏览量

    97669
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    信维高频陶瓷电阻,助力高速信号稳定传输

    信维高频陶瓷电阻通过低寄生参数、优异温度稳定性及抗环境干扰能力,为高速信号稳定传输提供关键支撑,具体表现如下 : 一、低寄生参数设计,减少信号失真 寄生电感控制 :信维高频陶瓷电阻采用
    的头像 发表于 12-05 16:35 415次阅读
    信维高频陶瓷电阻,<b class='flag-5'>助力</b><b class='flag-5'>高速</b>信号<b class='flag-5'>稳定</b><b class='flag-5'>传输</b>

    恩智浦高速SerDes技术助力汽车网络高效安全数据传输

    随着汽车变得更加智能、更安全且由软件定义,对高速数据传输的需求达到了前所未有的高度。
    的头像 发表于 11-18 15:00 621次阅读

    力芯微逻辑类IC电平转换系列芯片助力网络传输

    数字化时代,网络传输作为信息传递的核心手段,其稳定性和高效性至关重要。而电平转换芯片作为网络传输中的关键组件,能够确保不同电压域电路模块之间
    的头像 发表于 11-11 15:39 866次阅读
    力芯微逻辑类IC电平转换系列芯片<b class='flag-5'>助力</b><b class='flag-5'>网络</b><b class='flag-5'>传输</b>

    极细同轴线束在Jetson摄像头高速传输中的结构与设计要点

    需要高可靠性的应用场景;在高速视觉系统中,合理采用极细同轴线束方案,可以让系统运行更稳定、布线更灵活,是工程师实现高性能影像传输的理想选择。
    的头像 发表于 10-29 19:22 224次阅读
    极细同轴线束在Jetson摄像头<b class='flag-5'>高速</b><b class='flag-5'>传输</b>中的结构与设计要点

    极细同轴线束如何助力 MIPI 高速信号实现低损高稳传输

    极细同轴线束凭借其高频传输能力、优良的屏蔽特性和紧凑结构,成为 MIPI 高速信号传输中的核心互连方案;在未来的高分辨率图像、AI 视觉与自动驾驶系统中,这类线束将持续发挥重要作用,为高速
    的头像 发表于 10-22 18:25 386次阅读
    极细同轴线束如何<b class='flag-5'>助力</b> MIPI <b class='flag-5'>高速</b>信号实现低损高稳<b class='flag-5'>传输</b>?

    极细同轴线束如何解决AI设备的高速信号传输难题?

    极细同轴线束凭借精准阻抗、高屏蔽性、柔性和稳定性,成为AI设备高速信号传输的理想方案。它能有效解决信号失真、干扰与空间受限等难题,助力AI设备实现高性能和高
    的头像 发表于 09-11 14:30 1181次阅读
    极细同轴线束如何解决AI设备的<b class='flag-5'>高速</b>信号<b class='flag-5'>传输</b>难题?

    借助NVIDIA技术加速半导体芯片制造

    NVIDIA Blackwell GPU、NVIDIA Grace CPU、高速 NVIDIA NVLink 网络架构和交换机,以及诸如
    的头像 发表于 05-27 13:59 883次阅读

    广州邮科通信电源系统:赋能现代通信网络稳定动力

    在当今快速发展的信息时代,通信网络作为信息传输的基石,其稳定性和可靠性至关重要。广州邮科,作为通信电源领域的佼佼者,其通信电源系统凭借卓越的性能和
    的头像 发表于 05-19 15:48 405次阅读

    NVIDIA助力解决量子计算领域重大挑战

    NVIDIA 加速量子研究中心提供了强大的工具,助力解决量子计算领域的重大挑战。
    的头像 发表于 03-27 09:17 997次阅读

    山泽HDMI 2.1:稳定可靠的高性能传输解决方案

    在追求极致视听体验的今天,山泽HDMI 2.1线缆为您提供了稳定可靠的高性能传输解决方案。无论是家庭影院、游戏娱乐还是专业应用,山泽HDMI 2.1都是您的理想选择。 卓越性能 山泽HDMI 2.1
    的头像 发表于 03-25 17:58 535次阅读

    PoE交换机如何助力智慧城市基础设施建设?

    组成部分。PoE交换机可为无线接入点(AP)供电,确保居民和游客能够获得稳定高速的互联网连接。这一网络连接不仅支持公共服务,还能助力旅游业和商业发展。 飞速(FS)PoE交换机:
    发表于 03-25 10:20

    支持PCIe5.0,杰和科技B760主板IB5-8131亮点都在这

    的自助服务。依托IB5-8131主板上的PCIe5.0x16扩展槽,可实现自助服务终端高速图形处理和数据传输的需求,获得流畅的交互体验。IB5-8131采用LGA17
    的头像 发表于 02-05 17:56 2557次阅读
    支持PCIe5.0,杰和科技B760主板<b class='flag-5'>IB</b>5-8131亮点都在这

    MX2412H高速复用器芯片的应用EUVIS

    ,提高系统整体性能。二、通信与网络设备在通信和网络设备中,MX2412H适合于信号的多路复用和解复用,提高信号的传输效率和稳定性。例如,在光纤通信系统中,MX2412H能够将不同的低速
    发表于 01-16 08:55

    基于 400Gbps 100G-PAM4 OSFP 和 QSFP112 的线缆和光模块之IB网络连接

    NVIDIA LinkX‌是指英伟达提供的一系列网络连接解决方案,主要用于高性能计算(HPC)和数据中心环境。LinkX涵盖了多种产品,包括连接交换机、网卡等设备的线缆和光模块,支持
    的头像 发表于 01-13 17:45 1673次阅读
    基于 400Gbps 100G-PAM4 OSFP 和 QSFP112 的线缆和光模块之<b class='flag-5'>IB</b><b class='flag-5'>网络</b>连接

    RS232接口数据传输稳定

    电子设备之间的数据传输。它具有较高的传输可靠性,能够在复杂的工业环境和远距离通信场景中,确保数据的可靠传输,减少数据丢失和错误的发生。 二、
    的头像 发表于 12-18 17:56 1898次阅读