0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA LinkX 助力IB网络高速稳定与可靠传输

维维为 来源:维维为 作者:维维为 2022-07-27 17:41 次阅读

InfiniBand(直译为“无限带宽”技术,缩写为IB)是一个用于高性能计算的计算机网络通信标准,是世界领先的超级计算机的互连首选。基于NVIDIA InfiniBand的端到端网络可实现极低的延迟,以及高数据吞吐量和传输速率。

InfiniBand网络主要用于高性能计算(HPC)场景,通过高速的InfiniBand技术,将业务负载由单机运行转化为基于多机协作的高性能计算集群。采用了InfiniBand网络技术,使得高性能集群的性能得以进一步地释放和优化。

作为未来算力的基本单元,高性能的数据中心也越来越多地采用InfiniBand网络方案,尤其是在超算中心中应用最为广泛。

本文中出现的与NVIDIA产品相关的图片或视频(完整或部分)的版权均归NVIDIA Corporation所有。

01

NVIDIA Quantum-2 InfiniBand平台:400Gb/s NDR InfiniBand网络互连

NVIDIA所提供的InfiniBand系列产品主要包括网卡、DPU、交换机以及LinkX线缆和光模块,速率从100Gb/s EDR到200Gb/s HDR再到最新的400Gb/s NDR。NVIDIA最新发布的Quantum-2 InfiniBand平台继续创造高性能网络的更高纪录,包括NVIDIA Quantum-2交换机、ConnectX-7网卡、BlueField-3 DPU、LinkX线缆和光模块,一同构成了面向新一代高性能计算、人工智能机器学习、大数据、云计算、Web 3.0和存储平台的完整400Gb/s NDR InfiniBand网络互连基础设施。

pYYBAGLhCE2ABPwRAABuvnat6YY902.jpg

NDR InfiniBand凭借其最高的数据吞吐量、极低的延迟和智能的网络计算加速引擎,可为要求最苛刻的计算和数据应用提供世界领先的性能和可扩展性。

NVIDIA Quantum-2 InfiniBand平台不但能够实现GPU Direct RDMAAI业务至关重要的技术。其中BlueField-3 DPU增加了DPA 引擎(Data-Path Accelerator)来对特定流量进行编程和加速。ConnectX-7 VPI系列IB网卡对各种通信模型基于网络的计算进行了专门优化,提高了All reduce 和 All-to-All等通信时的通信效率。凭借单端口每秒400Gbps的高吞吐量,NVIDIA Quantum-2 InfiniBand将端口速率提高一倍,网络物理端口数量增加1.5倍。Quantum-2平台的系统容量提升至上代产品的5倍,支持的数据中心的规模提升了6.5倍,而数据中心网络的能耗则降低了36%。

NVIDIA Quantum-2的盒式交换机,芯片采用7nm工艺,包含570亿个晶体管,配有64个400Gbps端口,通过Split线缆以提供多达128个200Gbps端口。交换机的双向总吞吐量为51.2Tb/s,具有超过每秒665亿数据包的标志性包转发能力。同时,Quantum-2平台提供不同端口数的模块化交换机系统,可以支持多达2048个,系统容量超出上一代5倍。基于NVIDIA Quantum-2交换机ASIC的盒式交换机和模块化交换机系统提供了全面的InfiniBand交换互连接解决方案,支持各种InfiniBand网络拓扑,包括Fat Tree、DragonFly+、多维 Torus等。

NVIDIA Quantum-2平台在主机端提供两个网络选项,ConnectX-7网卡和BlueField-3 DPU。ConnectX-7基于7nm工艺,包含80亿个晶体管,其数据传输速率是上一代的两倍,通过RDMA、GPU Direct Storage、GPU Direct RDMA和网络计算加速应用,充分发挥网络的能力。BlueField-3采用7nm工艺,包含220亿个晶体管,提供16个64位ARM CPU,基于数据IO的业务部署,提供加速、卸载和隔离的能力,优化了数据中心基础设施的架构。

为了打造完整的端到端400Gb/s InfiniBand 基础架构,NVIDIA Quantum-2还提供了LinkX解决方案,为用户提供一系列不同类型的400Gb/s DAC线缆(高速铜缆)、AOC线缆(有源光缆)以及光模块产品,以构建复杂的基础设施,可以为选择的拓扑结构提供最大的灵活性,针对不同的连接场景,提供全套的线缆模块方案。

pYYBAGLhCFqAShe4AAK7g1Hzql4213.png

NVIDIA LinkX拥有完善的产品体系,可提供不同的方案组合(光模块、DAC/AOC直连以及分支高速线缆),速率包括EDR(100G)、HDR(200G)和NDR(400G),外形尺寸涵盖QSFP28、QSFP56以及OSFP。

LinkX产品在NVIDIA“端到端”网络系统中发挥了最佳的效果和独特的功能,除了满足InfiniBand贸易协会 (IBTA) 标准外,LinkX产品在出厂之前完成了100% 真实业务测试,确保线缆模块的品质,从底层支持InfiniBand网络实现高性能。NVIDIA LinkX产品的低误码率、低延时、低功耗和高可靠性等特点可以与NVIDIA交换机和网卡产品完美适配,在具有严格要求的超级计算机和超大规模系统中提供了最优的传输效率。

02

构建InfiniBand网络出现的常见问题

目前市面上有部分客户在构建InfiniBand网络时使用了第三方的光模块、高速线缆等连接件产品,然而却在实际应用中出现了大量的问题,主要表现为:

1、网络链路不稳定:出现链路震荡现象

2、传输延时高:在推理、训练等业务负载下,大大延长训练周期

3、功耗高:产品发热异常,严重时甚至可能损坏设备

4、产品质量良莠不齐:经常出现大批量无法使用的情况

纳多德NADDOD——作为NVIDIA网络产品Elite Partner (精英级别合作伙伴),致力于为客户提供高品质高性能光网络解决方案,在为客户搭建高性能网络方案的过程中,收到不少因使用第三方InfiniBand连接件而出现售后问题的反馈,导致用户网络延迟甚至中断,额外增加了客户处理售后问题所花费的时间成本。

结合大量真实案例中出现的情况,纳多德NADDOD建议在InfiniBand网络中使用的连接件(DAC/AOC线缆、光模块),一定要选用NVIDIA LinkX原厂线缆,以最大程度地保证连接件与设备之间的适配性,以及保障网络的稳定传输与高可靠性。

审核编辑 黄昊宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4592

    浏览量

    101703
  • InfiniBand
    +关注

    关注

    1

    文章

    25

    浏览量

    9129
  • 英伟达
    +关注

    关注

    22

    文章

    3327

    浏览量

    87761
收藏 人收藏

    评论

    相关推荐

    稳定可靠网络连接解决方案

    工业路由器是专为工业应用设计的网络设备,具备高速数据传输、智能管理等特点,广泛应用于制造业、能源、物流等领域。其高稳定性、高效数据传输、智能
    的头像 发表于 04-07 18:20 854次阅读

    光纤布线如何保证数据可靠传输

    在当今的数字环境中,数据传输是技术进步的命脉,通信网络稳定性和可靠性至关重要。随着对更快、更高效的数据传输的需求不断增长,创新者不断寻求解
    的头像 发表于 04-07 10:34 89次阅读

    介绍一种高性能计算和数据中心网络架构:InfiniBand(IB

    InfiniBand(IB)是一种高性能计算和数据中心网络架构,其设计目标是通过提供低延迟、高带宽以及可扩展性来满足大规模计算和数据传输的需求。让我们深入了解InfiniBand的基本概念。
    的头像 发表于 03-13 17:14 476次阅读

    多业务光端机助力5G网络发展:实现更高速、更稳定的连接

    随着5G技术的快速发展和广泛应用,人们对网络速度和稳定性的要求也越来越高。多业务光端机作为一种高速、高效的光通信设备,正逐渐成为5G网络建设中不可或缺的关键设备,为5G
    的头像 发表于 02-23 14:08 269次阅读

    桂花网蓝牙温度监测方案:实现稳定可靠的无线温度监测

    ,温度数据能够实时传输到远程监控中心或移动设备上,便于用户实时掌握温度情况。三、技术特点 稳定可靠:桂花网的蓝牙网关具备出色的稳定性和可靠
    发表于 01-30 14:25

    数通365案例 | 一次建网,十年无忧,华为SPN助力河南高速建设现代化专用传输网络

    能力、提高客货运输时空可靠性等建设目标,提速智慧高速公路建设。河南高速建设了首个业务隔离、简易运维、灵活联接的高速公路数据传输网,加速智慧高速
    的头像 发表于 12-04 18:40 429次阅读

    万兆单模OSX010000:企业高速网络传输可靠解决方案

    随着信息技术的不断发展,企业对于高速网络传输的需求不断增加。网络设备需要不断更新换代,以满足更高速、更远距离的
    的头像 发表于 12-04 17:10 368次阅读

    插卡路由器设置教程,让家庭网络稳定高速

    插卡路由器设置,让家庭网络稳定高速
    的头像 发表于 11-29 17:17 985次阅读

    工业路由器-助力工业网络升级与发展

    工业路由器作为一种专门为工业环境设计的网络设备,具备更高的抗干扰能力、更稳定的数据传输性能和更广泛的应用场景。它为工业网络的升级和发展提供了有力的支持和保障。未来,随着工业
    的头像 发表于 11-01 17:31 204次阅读

    YXC扬兴科技 MEMS振荡器 YSO691ER高稳定性和可靠助力光端机领域

    YXC扬兴科技推出的Q MEMS振荡器YSO691ER以其高频率稳定性、精准的时钟信号和适应性强的封装尺寸,为光端机产品提供了可靠的时钟支持。无论是在光纤通信还是网络传输领域,YSO6
    的头像 发表于 09-14 15:50 959次阅读
    YXC扬兴科技 MEMS振荡器 YSO691ER高<b class='flag-5'>稳定</b>性和<b class='flag-5'>可靠</b>性<b class='flag-5'>助力</b>光端机领域

    网络解码矩阵:让视频传输更快速,更稳定

    讯维网络解码矩阵是一种专业的视频解码解决方案,通过优化数据传输协议和并行解码技术,可以显著提高视频传输的快速性和稳定性。 首先,讯维网络解码
    的头像 发表于 09-04 11:15 339次阅读
    <b class='flag-5'>网络</b>解码矩阵:让视频<b class='flag-5'>传输</b>更快速,更<b class='flag-5'>稳定</b>!

    DTU凭什么可以为数据提供高效可靠稳定传输

    、居民楼小区所使用的智能电表以及夜晚道路两旁的照明路灯等,它们都采用DTU进行数据采集和传输,为企业提供了高效、可靠稳定的数据传输解决方案。说到DTU,可能还是有
    的头像 发表于 07-19 15:35 350次阅读
    DTU凭什么可以为数据提供高效<b class='flag-5'>可靠</b>的<b class='flag-5'>稳定</b><b class='flag-5'>传输</b>?

    稳定可靠是1各种功能是0,这款DTU是最稳定可靠

    大家就明白了,把DTU设备的稳定可靠比作1,传输速度比作0、功耗比作0、防护比作0....如果将他们进行排列,稳定可靠排在最后那会变成什么?
    的头像 发表于 06-21 15:46 324次阅读
    <b class='flag-5'>稳定</b><b class='flag-5'>可靠</b>是1各种功能是0,这款DTU是最<b class='flag-5'>稳定</b><b class='flag-5'>可靠</b>的

    态路小课堂丨选择正确光模块,让网络高速稳定传输

    光模块作为数据中心中连接服务器与交换机之间的桥梁,是数据中心中必不可少的产品之一。目前,市面上的光模块种类繁多,质量也参差不齐。如若选择不合适的光模块则会导致网络速度慢、不稳定等问题。本文态路通信为您介绍切实可行的技巧,让您在购买前避免一些不必要的烦恼,使得通信
    的头像 发表于 05-31 09:50 362次阅读
    态路小课堂丨选择正确光模块,让<b class='flag-5'>网络</b><b class='flag-5'>高速</b><b class='flag-5'>稳定</b><b class='flag-5'>传输</b>!

    PCB设计中的高速信号传输优化技巧

    在现代电子设计中,高速信号的传输已成为不可避免的需求。高速信号传输的成功与否,直接影响整个电子系统的性能和稳定性。因此,PCB设计中的
    的头像 发表于 05-08 09:48 1206次阅读