0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

RDMA技术场景和参数优化

智能计算芯世界 来源:智能计算芯世界 作者:智能计算芯世界 2022-07-11 11:36 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

RDMA是一种直接内存访问技术,RDMA 通过网络把资料直接传入计算机的存储区,将数据从一个系统快速移动到远程系统存储器中,而不对操作系统造成任何影响,这样就不需要用到多少计算机的处理功能。它消除了外部存储器复制和文本交换操作,因而能解放内存带宽和CPU 周期用于改进应用系统性能。这允许高通量、低延迟的网络通信,尤其适合在大规模并行计算机集群中使用。

常见的 RDMA 实现包括 iWARP、RoCE 与 InfiniBand。其中,InfiniBand 是超级计算机最常用的技术,其可以做到 1ms 的延迟及超过 100Gb 每秒的传输速率。这对于超大规模的计算机集群是必要的。超级计算机、人工智能云计算的数据中心都会受益于 InfiniBand 的卓越效能。世界 TOP500 超级计算机(2017年 6 月排行榜)中 36%使用了 InfiniBand 技术。

Mellanox 提供从 HPC(高性能计算中心)、数据中心、WEB2.0、机器学习、云服务器等解决方案,并专门针对目前火热的人工智能算法进行了架构优化。其客户包括 Facebook、Paypal、NVIDIA、百度、京东、腾讯等。

E级超算已经成为世界各国在超算领域追逐的新目标。目前,由江南计算所、国防科大和中科曙光公司根据不同技术路线研制的三台 E 级原型系统已经完成并分别安装在济南、天津和深圳国家超级计算中心。据 Hyperion Research 公司按照系统验收的时间估算,2021 至 2026 年期间,全球将建成 28~38 台 E 级或接近 E 级的超级计算机,总价值约在 100~150 亿美元。

1afa7050-00c2-11ed-ba43-dac502259ad0.png

在实现上,RDMA 实际上是一种智能网卡与软件架构充分优化的远端内存直接高速访问技术,通过将 RDMA 协议固化于硬件(即网卡)上,以及支持 Zero-copy和 Kernel bypass 这两种途径来达到其高性能的远程直接数据存取的目标。其通信过程使得用户在使用 RDMA 时具备如下优势:

➢ 零拷贝(Zero-copy) - 应用程序能够直接执行数据传输,在不涉及到网络软件栈的情况下。数据能够被直接发送到缓冲区或者能够直接从缓冲区里接收,而不需要被复制到网络层。

➢ 内核旁路(Kernel bypass) - 应用程序可以直接在用户态执行数据传输,不需要在内核态与用户态之间做上下文切换。

➢ 不需要 CPU 干预(No CPU involvement) - 应用程序可以访问远程主机内存而不消耗远程主机中的任何 CPU。远程主机内存能够被读取而不需要远程主机上的进程(或 CPU)参与。远程主机的 CPU 的缓存(cache)不会被访问的内存内容所填充。

➢ 消息基于事务(Message based transactions) - 数据被处理为离散消息而不是流,消除了应用程序将流切割为不同消息/事务的需求。

➢ 支持分散/聚合条目(Scatter/gather entries support) - RDMA 原生态支持分散/聚合。也就是说,读取多个内存缓冲区然后作为一个流发出去或者接收一个流然后写入到多个内存缓冲区里去。

目前,RDMA 技术在超算、AI 训练、存储等多个高性能场景大量部署,已形成广泛应用。但是 RDMA 技术路线也有很多,用户及各家厂商对于 RDMA 技术路线的选择也不尽相同。

在三种主流的 RDMA 技术中,可以划分为两大阵营。一个是 IB 技术, 另一个是支持 RDMA 的以太网技术(RoCE 和 iWARP)。其中,IBTA 主要聚焦 IB 和 RoCE 技术,而 iWARP 则是在 IEEE/IETF 标准化的技术。

在存储领域,支持 RDMA 的技术早就存在,比如SRP(SCSI RDMA Protocol)和iSER(iSCSI Extensions for RDMA)。如今兴起的 NVMe over Fabrics 如果使用的不是 FC 网络的话,本质上就是 NVMeover RDMA。换句话说,NVMe over InfiniBand, NVMe over RoCE 和 NVMe over iWARP 都是 NVMe over RDMA。

1、总线级数据中心网络技术白皮书.pdf

2、RDMA提高数据传输效率.pdf

3、配置 InfiniBand 和 RDMA 网络.pdf

4、华为RDMA.pdf

5、面向AI智能无损数据中心网络.pdf

6、面向分布式 AI智能网卡低延迟Fabric技术.pdf

7、NVMe存储SPDK 加速前后端 IO.pdf

8、基于RDMA多播机制的分布式持久性内存文件系统.pdf

9、云环境下分布式存储性能优化实践.pdf

《RDMA技术合集(上)》

1、智能网卡低延迟Fabric技术.pdf

2、RDMA参数选择.pdf

3、RDMA在数据中心中的应用研究.pdf

4、RDMA系统的挑战.pdf

5、RDMA网络人工智能训练重要硬件

6、RDMA技术白皮书(中文版)

7、RDMA技术调研

8、RDMA在数据中心中的应用研究

1b1870fa-00c2-11ed-ba43-dac502259ad0.png

1b299308-00c2-11ed-ba43-dac502259ad0.png

1b3ac83a-00c2-11ed-ba43-dac502259ad0.png

1b4b858a-00c2-11ed-ba43-dac502259ad0.png

1b6613b4-00c2-11ed-ba43-dac502259ad0.png

1b7aaa72-00c2-11ed-ba43-dac502259ad0.png

1b8e0c98-00c2-11ed-ba43-dac502259ad0.png

1b9da96e-00c2-11ed-ba43-dac502259ad0.png

1bb4e7f0-00c2-11ed-ba43-dac502259ad0.png

1bc7ba88-00c2-11ed-ba43-dac502259ad0.png

1bd7793c-00c2-11ed-ba43-dac502259ad0.png

1bec466e-00c2-11ed-ba43-dac502259ad0.png

1bfa5628-00c2-11ed-ba43-dac502259ad0.png

1c0cbd40-00c2-11ed-ba43-dac502259ad0.png

1c22b8e8-00c2-11ed-ba43-dac502259ad0.png

1c3fdacc-00c2-11ed-ba43-dac502259ad0.png

1c580d40-00c2-11ed-ba43-dac502259ad0.png

1c6e438a-00c2-11ed-ba43-dac502259ad0.png

1c8270c6-00c2-11ed-ba43-dac502259ad0.png

1c9f9688-00c2-11ed-ba43-dac502259ad0.png

1cb32734-00c2-11ed-ba43-dac502259ad0.png

1cbdb906-00c2-11ed-ba43-dac502259ad0.png

1cdaf070-00c2-11ed-ba43-dac502259ad0.png

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储器
    +关注

    关注

    39

    文章

    7715

    浏览量

    170896
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136250
  • RDMA
    +关注

    关注

    0

    文章

    86

    浏览量

    9561

原文标题:RDMA技术场景和参数优化

文章出处:【微信号:AI_Architect,微信公众号:智能计算芯世界】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    RDMA设计4:技术需求分析2

    专注高性能存储与传输,希望对初学者有用。注意这里只是抛砖引玉,切莫认为参考这就可以完成商用IP设计。若有NVME或RDMA 产品及项目需求,请看B站视频后联系。 根据IP适用性技术需求分析,总结
    发表于 11-24 09:09

    RDMA设计3:技术需求分析1

    在FPGA上部署RDMA IP,一般用于高速射频信号数据采集工作。它既要满足对于通用大数据的实时高速传输要求,也需要满足对于多路信号的数据整合需求。考虑到数据采集前端数据量大、数据产生速率快、采样
    发表于 11-21 09:02

    RDMA设计2:开发必要性之性能简介

    RDMA 产品及项目需求,请看B站视频后联系。 基于本IP设计,经过优化后得出如下性能指标及资源占用率: 1 性能指标 2 不同包模式下性能 3占用资源
    发表于 11-20 10:57

    RDMA设计1:开发必要性1之设计考虑

    解决 FPGA 系统存储容量不足已成为亟待解决的问题。 远程直接内存访问技术RDMA) 是一种专为远距离网络通信设计的技术, 其通常通过光纤进行设备间连接, 提供高通量、 低延迟、 远距离的零拷⻉网络
    发表于 11-19 14:30

    RDMA over RoCE V2设计1:通用,稳定及高性能!

    # 设计目标: RDMA技术采用无感传输机制,消除传统网络传输中需要CPU介入下的多重数据复制与内核参与环节,实现直接跨主机内存访问的机制。其设计目标为优化分布式环境下的数据传输效率,降低CPU负载
    发表于 08-05 17:53

    RDMA over RoCE V2设计1:通用,稳定及高性能!

    一)设计目标: RDMA技术采用无感传输机制,消除传统网络传输中需要CPU介入下的多重数据复制与内核参与环节,实现直接跨主机内存访问的机制。其设计目标为优化分布式环境下的数据传输效率,降低CPU负载
    发表于 07-15 10:54

    如何优化可编程电源控制环路参数

    环路带宽;若过冲过大(>8%),可增加补偿电阻RCOMP​降低环路增益。 五、高级优化技术:应对复杂场景 非线性补偿 分段补偿:针对不同负载范围(如轻载、重载)设计不同的补偿参数
    发表于 07-02 15:56

    RDMA简介2之A技术优势分析

    随着数据中心对于网络带宽和延迟的要求日益增长,传统的TCP/IP网络已无法满足性能要求,RDMA网络则凭借其高带宽、低延时的特性脱颖而出。相较于传统TCP/IP协议,RDMA具有零拷贝、不需要CPU
    发表于 06-04 11:35

    RDMA简介1之RDMA开发必要性

    总线或高速外设部件互连总线(PCIe)上,二者均为短距离连接总线,会导致数据采集系统的部署位置受限 。远程直接内存访问技术RDMA)是一种专为远距离网络通信设计的技术,其通常通过光纤进行设备间连接
    发表于 06-03 14:38

    取样示波器的技术原理和应用场景

    负责对输入信号进行采样和保持,采样速率决定了示波器的带宽。应用场景 信号处理:取样示波器能够精确地捕捉和分析信号的波形和参数,帮助工程师更好地理解和优化信号处理系统。 通信领域:在通信系统中,取样示波器
    发表于 03-12 14:34

    频域示波器的技术原理和应用场景

    频域示波器,其主要技术原理基于信号的傅里叶变换理论,通过快速傅里叶变换(FFT)算法将时域信号转换为频域信号,从而进行频谱分析。以下是对频域示波器的技术原理和应用场景的详细分析:一、技术
    发表于 03-11 14:37

    一文详解以太网RDMA技术

    在现代计算机网络中,传输效率和低时延是高性能计算、云计算、分布式存储等应用的关键需求。而远程直接内存访问(RDMA,Remote Direct Memory Access)技术因其高效的数据传输特性
    的头像 发表于 03-10 11:09 4487次阅读
    一文详解以太网<b class='flag-5'>RDMA</b><b class='flag-5'>技术</b>

    如何实现开源开放生态下的RDMA网络监控?

    在当今AI、大模型飞速发展的时代,RDMA(Remote Direct Memory Access,远程直接内存访问)网络技术凭借其低延迟、高吞吐量的特性,在数据中心、高性能计算等领域得到了广泛应用
    的头像 发表于 03-03 13:42 981次阅读
    如何实现开源开放生态下的<b class='flag-5'>RDMA</b>网络监控?

    信号源分析仪的技术原理和应用场景

    信号源分析仪是一种综合性的测量仪器,常用于测量晶振、PLL(锁相环)、时钟电路、相位噪声等参数。以下是关于信号源分析仪的技术原理和应用场景的详细介绍:一、技术原理 相参接收机
    发表于 02-26 15:25

    敏捷合成器的技术原理和应用场景

    助于提高波形的纯度和稳定性。 相位噪声优化技术:通过优化合成器的内部结构和电路布局,降低相位噪声,提高信号的频谱纯度。这对于需要高精度和高稳定性的应用场景至关重要。 应用
    发表于 02-20 15:25