0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

RDMA over RoCE V2设计1:为什么要设计它?

高速传输与存储 来源:高速传输与存储 作者:高速传输与存储 2025-07-15 10:58 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

设计目标:
RDMA技术采用无感传输机制,消除传统网络传输中需要CPU介入下的多重数据复制与内核参与环节,实现直接跨主机内存访问的机制。其设计目标为优化分布式环境下的数据传输效率,降低CPU负载。
RoCEv2基于标准网络的以太网、网络层和传输层(UDP)协议,这可以使得RoCEv2的网络流量可以经过传统的网络路由器路由。之前RDMA简介1~8有对相关资料介绍,这里强调的是:它是目前性价比最高的RDMA实现方式,虽然IB模式在一些高校应用较多,但因为它的专有特性,价格较贵,难广泛用于产品中。

设计思考
基于PC-PC或GPU-GPU之间RDMA设计已有较多厂商投入,虽然有的大厂投入几年后折羽而归,但不影响PC领域成熟应用产品的推广。这里主要讨论在FPGA上设计RDMA over RoCE V2,虽然已有xilinx的ernic应用,但是性价比以及国产化需求还是有其发展空间。这里讨论设计需要着重考虑地方:
1)通用性
一般项目中的数据采集前端基于 FPGA 进行开发。第一,各数据采集前端使用的 FPGA型号各不相同,需要实现的设计能够工作在多种不同型号 FPGA 上;第二,为了降低设计部署成本,需要实现的设计能够在脱离 CPU 控制下独立运行和控制传输;第三,一些厂商不愿意采用私有化协议,主要是考虑其被迫被捆绑,私有协议也就意味着难以与其他系统兼容,一旦存在功能或性能设计不足,只能前功尽弃。考虑到以上三点需求,设计时建议采用纯逻辑电路实现。
2)高性能
数据采集前端得到的数据,数据块大小不固定、数据速率也不尽相同。同时对于数据传输的需求也并不相同,存在一对一、一对多、多对多等多种传输情况。面对大量离散数据时,需要增加 RDMA 队列数量及深度,同时灵活调整数据包大小来保证传输性能,而面对大量连续数据请求时,则可通过减少队列数量的方式来降低功耗。
同时,在面对一对多或多对多传输需求时,则要求设计能够正确地处理网络拥塞情况并正确地进行流量控制。因此,需要实现完备的队列管理及拥塞处理功能,在满足性能要求的同时适应不同的应用环境。具体要求为使用 QSFP28 及以上光纤接口,在传输不小于 256 MB 的连续数据时,数据传输速率不小于 90 Gbps。在传输包大小为 4KB 时,延迟不高于 10 μs、包吞吐量不小于 1000 kpps。这里也只是简要指标分析,上面这些指标在PC-FPGA之间实现较容易,在FPGA-FPGA之间还是有一些挑战。这也反映竞争环境下适者生存,最后生存的不大可能是大多数。虽然我们设计的IP性能(包括我们A, FPGA-FPGA)早已超越这些指标,相信其他厂家也能满足。
3)易集成、用户操作简便
实现的 RDMA 协议栈和控制逻辑,应能够简易地集成到应用生产环境中,并提供简易的用户操作方式来实现数据传输控制及队列控制。因此,设计需要使用标准化接口,同时尽可能地降低资源占用率,并具备 DMA 数据传输功能。
4)稳定性
这里强调的是,如果只是预研项目,就不大需要考虑稳定性,其特有的功能和性能才是项目需要重点解决的。但是作为商用IP,就需要考虑其稳定性,不能出现上次可以,这次就工作不正常,或者性能下降明显情况。

它涉及到‌几个因素:
1)高速接口的匹配性‌:RDMA数传通道一般采用AXI总线,它需确保IP核与FPGA的如AXI4-Stream/AXI4-Lite等兼容性,避免因协议不匹配导致传输错误; ‌
2)‌时序优化:一般它需要跨时钟域设计,因此对时钟同步、信号路径规划和资源分配等关键因素需要重点考虑;
3)‌存储资源分配‌:合理设计FIFO深度,(一般采用2的整数次幂深度设计)和RAM块数量,避免因资源不足导致数据丢失或性能下降。 ‌

这里给出IP读写性能情况:

wKgZO2h1wjqAC2ImAABynuCedFo892.png


B站已给出相关性能的视频,如想进一步了解,请搜索B站用户:专注与守望
链接:https://space.bilibili.com/585132944/dynamic?spm_id_from=333.1365.list.card_title.click

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1655

    文章

    22283

    浏览量

    630286
  • 高速传输
    +关注

    关注

    0

    文章

    38

    浏览量

    9269
  • RDMA
    +关注

    关注

    0

    文章

    85

    浏览量

    9558
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    RDMA设计7:系统控制模块设计

    专注高性能存储与传输,希望对初学者有用。注意这里只是抛砖引玉,切莫认为参考这就可以完成商用IP设计。 系统控制模块负责实现 RoCE v2 高速数据传输系统的功能控制,其构成如图 1所示,包括
    发表于 11-27 08:34

    RDMA设计6:IP架构2

    专注高性能存储与传输,在本博客已给出相关博文已约80篇,希望对初学者有用。注意这里只是抛砖引玉,切莫认为参考这就可以完成商用IP设计。IP结构图融合以太网协议栈是实现 RoCE v2 命令提交和完成
    发表于 11-26 10:24

    RDMA设计5:RoCE V2 IP架构

    上面分析,基于RoCE v2 高速数据传输IP 的高速传输应用整体架构如图 1 所示。 图1 基于RoCE
    发表于 11-25 10:34

    RDMA设计4:技术需求分析2

    得出具体技术指标如表1 所示。 表1 高速数据传输项目技术指标表 基于以上性能指标,基于 FPGA 的 RoCE v2 IP具有以下特点: (
    发表于 11-24 09:09

    RDMA设计1:开发必要性1之设计考虑

    ) 易集成、 用户操作简便  全模块化, 各层级可单独使用  标准总线接口  低资源占用 三. RDMA over RoCE V2 IP 简介 如图
    发表于 11-19 14:30

    RDMA over RoCE V2设计1:通用,稳定及高性能!

    几年后折羽而归,但不影响PC领域成熟应用产品的推广。这里主要讨论在FPGA上设计RDMA over RoCE V2,虽然已有xilinx的ernic应用,但是性价比以及国产化需求还是有
    发表于 08-05 17:53

    RDMA over RoCE V2设计2:ip 整体设计考虑

    这里重点讨论PC与FPGA之间采用RDMA RoCE v2 高速数据传输。该IP系统的整体架构如图 1 所示。通过 QSFP28 接口连接
    的头像 发表于 07-16 08:55 484次阅读
    <b class='flag-5'>RDMA</b> <b class='flag-5'>over</b> <b class='flag-5'>RoCE</b> <b class='flag-5'>V2</b>设计<b class='flag-5'>2</b>:ip 整体设计考虑

    RDMA over RoCE V2设计2:ip 整体框架设计考虑

    这里重点讨论PC与FPGA之间采用RDMA RoCE v2 高速数据传输,FPGA与FPGA后面介绍。该IP系统的整体架构如图 1 所示。
    发表于 07-16 08:51

    RDMA over RoCE V2设计1:通用,稳定及高性能!

    几年后折羽而归,但不影响PC领域成熟应用产品的推广。这里主要讨论在FPGA上设计RDMA over RoCE V2,虽然已有xilinx的ernic应用,但是性价比以及国产化需求还是有
    发表于 07-15 10:54

    RDMA简介7之可靠传输

    RoCE v2协议实现可靠传输的技术手段共有三种,分别为:丢包重传机制、流量控制及拥塞管理。接下来将就这三种技术手段进行详细分析。 (1)丢包重传机制 为了简化设计同时降低成本,RoCE
    发表于 06-13 10:01

    RDMA简介5之RoCE V2队列分析

    RDMA Write with immediate)操作不在此范围内)。RoCE v2作为RoCE v2协议通信的重要机制,通常有五种队列
    发表于 06-05 17:28

    RDMA简介4之ROcE V2初析

    RoCE v2原语 (1RDMA READ操作将远端主机内存中的数据读取到本地。具体流程为:本地主机将需要请求数据的地址、长度及对应的远程访问密钥发送给远程主机,远程主机比对密钥通
    发表于 06-05 15:20

    RDMA简介3之四种子协议对比

    计算,从硬件级别保证传输可靠,但成本较为高昂,需要使用专用的IB交换机和IB网卡才可以正常路由。RoCE v1RoCE v2RoCE协议
    发表于 06-04 16:05

    RDMA简介1RDMA开发必要性

    协议(iWARP)等RDMA实现方法,RoCE v2协议具有可通过以太网路由、低成本、无TCP/IP依赖等优势。因此,RoCE v2协议是数
    发表于 06-03 14:38

    加速网络性能:融合以太网 RDMA (RoCE) 的影响

    直接内存访问 (RDMA) (RoCE)。这项突破性技术促进了系统之间的直接数据传输,无需 CPU 干预,从而显着减少延迟并提高整体系统性能。[爱波]一家著名的 FPGA 设计公司处于这一进步的最前沿,通过将 AMD 的 ERNIC IP(以太网
    的头像 发表于 01-25 11:50 1775次阅读
    加速网络性能:融合以太网 <b class='flag-5'>RDMA</b> (<b class='flag-5'>RoCE</b>) 的影响