0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

高性能 RDMA 传输系统:通用性及高性能架构考虑

高速传输与存储 来源:高速传输与存储 作者:高速传输与存储 2025-04-14 16:05 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

1.RDMA 传输系统架构设计目的
随着数据中心对于网络带宽和延迟的要求日益增长,传统的 TCP/IP 网络已无法满足性能要求, RDMA 网络则凭借其高带宽、低延时的特性脱颖而出错误!未找到引用源。相较于传统 TCP/IP 协议, RDMA 具有零拷贝、不需要 CPU 接入、消息基于事务等特点。
该系统架构主要解决适合于FPGA端的RDMA传输。它支持FPGA之间,FPGA与PC之间高速通信。只需一根光纤(当然,PC端需要转接卡,将光纤转入PC端,例如100G的CX455A-ECAT 100Gbe网卡 就可以)。它注重通用性强,性能优越,非私有化协议设计,以便用户后续升级或更换IP。

2. RDMA 协议与传统 TCP/IP 协议在通信过程中的区别
如图 1 所示,左侧部分为传统 TCP/IP 协议的通信过程,首先使操作系统进入内核态,而后传输的数据通过 BUFFER 拷贝进 TCP/IP 协议栈进行组包处理,而后通过网卡(NIC)驱动下发到网卡内的 BUFFER。右侧部分则为 RDMA 协议的通信过程,其将 RDMA 协议部署在融合以太网卡(RNIC)上,在对数据包的组装和拆解过程中,不需要 CPU 及操作系统介入干预,也不需要进行内存拷贝操作。当发送数据包时,直接由应用程序通知网卡要发送的数据在内存中的起始地址及数据长度,而后 RNIC 则读取其已经在内存中注册好的区域数据并依照协议规范进行数据包的组装及传输。

wKgZO2f8wKmAYQeEAADYUyy9Q9A372.png


3.系统架构如图2:

wKgaomZ29p6ANJJiAAKpWGC-Fdw295.png

图2 系统架构图

对IP的简单控制由Microblaze完成,DDR负责读写等数据缓存。该架构也可以换成zynq的arm控制,便于后续NVMe oF开发。
视频可以搜B站 用户名: 专注与守望

4测试

在xilinx开发平台测试,网卡支持100G,选用的是CX455A-ECAT 100Gbe。该IP支持 RoCE V2。实测数据:
SEND71Gbps
READ91 Gbps(PC端给FPGA发包,受PC性能限制多一点)
WRITE 96 Gbps

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1655

    文章

    22287

    浏览量

    630326
  • 内存
    +关注

    关注

    9

    文章

    3173

    浏览量

    76118
  • 传输系统
    +关注

    关注

    0

    文章

    164

    浏览量

    38010
  • RDMA
    +关注

    关注

    0

    文章

    85

    浏览量

    9558
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    基于DSP与FPGA异构架构高性能伺服控制系统设计

    DSP+FPGA架构在伺服控制模块中的应用,成功解决了高性能伺服系统对实时、精度和复杂度的多重需求。通过合理的功能划分,DSP专注于复杂算法和上层控制,FPGA处理高速硬件任务,两者
    的头像 发表于 12-04 15:38 116次阅读
    基于DSP与FPGA异构<b class='flag-5'>架构</b>的<b class='flag-5'>高性能</b>伺服控制<b class='flag-5'>系统</b>设计

    全球前四!京东云云海AI存储跻身IO500高性能存储榜单

    存储技术,云海AI存储不采用 PMEM 硬件,具备更强通用性的同时也实现了更低存储成本。 IO500是全球高性能计算HPC领域最权威、最具影响力的存储系统性能评测标准之一,评测维度涵盖了高性能
    的头像 发表于 11-27 14:51 205次阅读
    全球前四!京东云云海AI存储跻身IO500<b class='flag-5'>高性能</b>存储榜单

    RDMA设计6:IP架构2

    专注高性能存储与传输,在本博客已给出相关博文已约80篇,希望对初学者有用。注意这里只是抛砖引玉,切莫认为参考这就可以完成商用IP设计。IP结构图融合以太网协议栈是实现 RoCE v2 命令提交和完成
    发表于 11-26 10:24

    RDMA设计5:RoCE V2 IP架构

    专注高性能存储与传输,在本博客已给出相关博文已100多篇,希望对初学者有用。注意这里只是抛砖引玉,切莫认为参考这就可以完成商用IP设计。 为便于读者更好的理解IP设计,这里以高速数据传输为背景,根据
    发表于 11-25 10:34

    RDMA设计4:技术需求分析2

    专注高性能存储与传输,希望对初学者有用。注意这里只是抛砖引玉,切莫认为参考这就可以完成商用IP设计。若有NVME或RDMA 产品及项目需求,请看B站视频后联系。 根据IP适用技术需
    发表于 11-24 09:09

    RDMA设计3:技术需求分析1

    设备繁杂等特点,针对现存研究在大批量连续数据及少量零散数据同时存在的复杂数据环境,以及单对多传输、多对多传输的复杂传输要求下难以保证性能的问题,本IP设计时对技术 需求分析如下: (1
    发表于 11-21 09:02

    RDMA设计2:开发必要性能简介

    专注高性能存储与传输,这里分享RDMA设计,之前已介绍RDMA相关知识,在本博客已给出相关博文已100多篇,希望对初学者有用。注意这里只是抛砖引玉,切莫认为参考这就可以完成商用IP设计
    发表于 11-20 10:57

    RDMA设计1:开发必要1之设计考虑

    场景下发挥出最优性能。 二. RDMA over RoCE V2 IP 特点 1) 通用性  采用纯逻辑电路实现, 适合不同 FPGA 型号;  可脱离 CPU 控制下独立运行和控制
    发表于 11-19 14:30

    RDMA over RoCE V2设计1:通用,稳定及高性能

    讨论设计需要着重考虑地方:1)通用性一般项目中的数据采集前端基于 FPGA 进行开发。第一,各数据采集前端使用的 FPGA型号各不相同,需要实现的设计能够工作在多种不同型号 FPGA 上;第二,为了降低
    发表于 08-05 17:53

    知合计算:RISC-V架构创新,阿基米德系列剑指高性能计算

    在2025 RISC-V中国峰会上,知合计算处理器设计总监刘畅就高性能RISC-V处理器架构探索与实践进行了精彩分享。 在以X86和ARM为代表的处理器架构之下,RISC-V在高性能
    的头像 发表于 07-18 14:17 2373次阅读
    知合计算:RISC-V<b class='flag-5'>架构</b>创新,阿基米德系列剑指<b class='flag-5'>高性能</b>计算

    RDMA over RoCE V2设计1:通用,稳定及高性能

    讨论设计需要着重考虑地方: 1)通用性 一般项目中的数据采集前端基于 FPGA 进行开发。 第一,各数据采集前端使用的 FPGA型号各不相同,需要实现的设计能够工作在多种不同型号 FPGA 上; 第二
    发表于 07-15 10:54

    SL3065:高性能40V同步降压DC/DC控制器,替代RT7272B

    系统中发挥关键作用,提升整体系统的可靠和效率。 结论综上所述,SL3065作为一款高性能的40V同步降压DC/DC控制器,在输出电流能力、效率、输入电压范围、输出电压调节以及保护功能
    发表于 06-17 15:50

    RDMA简介1之RDMA开发必要

    为了满足大批量数据的采集、存储与传输需求,越来越多的数据密集型应用如机器学习、雷达、金融风控、航空航天等选择使用现场可编程逻辑门阵列作为数据采集前端硬件来实现高性能的数据采集系统。FPGA凭借其高
    发表于 06-03 14:38

    一文详解以太网RDMA技术

    在现代计算机网络中,传输效率和低时延是高性能计算、云计算、分布式存储等应用的关键需求。而远程直接内存访问(RDMA,Remote Direct Memory Access)技术因其高效的数据
    的头像 发表于 03-10 11:09 4441次阅读
    一文详解以太网<b class='flag-5'>RDMA</b>技术

    鸿蒙原生页面高性能解决方案上线OpenHarmony社区 助力打造高性能原生应用

    高性能鸿蒙原生应用。 Nodepool:优化页面滑动流畅Nodepool旨在解决应用页面滑动卡顿问题。开发中,相似页面因业务和代码差异,组件复用差,引发卡顿、丢帧,影响用户体验。Nodepool通过
    发表于 01-02 18:00