0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

实测2778MB/s,AMP核间通信“快如闪电”,瑞芯微RK3576

Tronlong创龙科技 来源:Tronlong创龙科技 作者:Tronlong创龙科技 2025-12-04 14:14 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在多核异构SoC处理器中,核间数据的传输带宽直接决定了系统整体性能。传统通信方案存在数据“拷贝开销大”、“带宽受限”等瓶颈,高效的核间通信一直是开发者面临的挑战。
今天带大家看看RK3576的AMP核间通信——共享内存方案,具有“零拷贝”、“高带宽”的显著优势,直接解决用户痛点,下面用实测数据说话!

wKgZPGkxJneALBGNAARED26aJmw496.png

▍共享内存方案优势

零拷贝“共享内存方案”能够让不同核心直接访问同一块物理内存,实现了真正的零拷贝传输,大幅降低了数据传输延迟。

数据量大“共享内存方案”的共享内存区域大小,可根据实际需求灵活配置,从几十MB到几百MB都可以,能够满足各种大数据量传输需求。

配合RPMsgMaster Core与Remote Core在完成共享内存的读写操作后,可通过RPMsg通知对方进行数据处理,实现了高效、可靠的核间通信。RK3576处理器A72、A53与M0核间通信中的RPMsg消息包的发送耗时与时延,实测可做到2us,详见下图:

wKgZO2kxJouAcHqvAAQz5X-K9eA587.png

▍实测带宽确实惊人

为了验证共享内存方案的实际性能表现,我们针对“用户内存空间↔共享内存空间”的读写场景,分别测试了DMA、NEON、CPU三种主流内存拷贝方式的读写带宽。

wKgZO2kxJpSAQtC7AAJ9uNiGXy8041.png


可以从上面看到:
DMA方式读写带宽性能最优,实测读带宽高达2778MB/s,写带宽2760MB/s,表现稳定。
NEON和CPU方式在写带宽上表现出色,但读带宽就偏低。这是由于写操作依托“写合并(Write-Combining)”机制,能将多个小写操作合并为单次、大数据传输,减少总线事务切换,因此写带宽表现亮眼。而读操作无法合并,每次读取需等待内存响应,导致读带宽显著偏低。

▍拷贝方式怎么选

DMA、NEON、CPU这3种拷贝方式各有优劣,实际开发中无需盲目追求“最高带宽”,应根据使用场景、资源占用情况进行选择,这才是最优解。DMA:性能王者,CPU零负担当传输数据量大、对带宽要求高时,DMA是最佳选择。它由专用硬件控制器执行数据搬运,不占用CPU资源。NEON:无DMA时的备选,CPU同样零负担一般处理器的DMA控制器资源有限,可能早已被占用。在没有多余DMA控制器时,NEON方式是另一个不错的选择,它是CPU的辅助核,同样不占用CPU资源,利用CPU的单指令多数据流技术,实现并行数据搬运。CPU:实现最简单,但需消耗CPU资源对于小数据量传输,或者在对性能要求不高的简单应用中,标准的CPU拷贝是最直接的选择。它实现简单,不需额外的硬件资源支持,适合轻量级任务。但由于它会占用CPU资源,因此复杂应用时不见得是最适合的方案。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 瑞芯微
    +关注

    关注

    27

    文章

    909

    浏览量

    54753
  • Amp
    Amp
    +关注

    关注

    0

    文章

    103

    浏览量

    48699
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    维护成本直降!RK3576核心板/开发板OTA升级功能详解,触觉智能RK方案商

    触觉智能旗下RK3576核心板/开发板产品方案,已新增支持【OTA升级功能】。下文将为大家带来详细的RK3576OTA升级操作指南。
    的头像 发表于 04-21 10:30 419次阅读
    维护成本直降!<b class='flag-5'>RK3576</b>核心板/开发板OTA升级功能详解,触觉智能<b class='flag-5'>瑞</b><b class='flag-5'>芯</b><b class='flag-5'>微</b><b class='flag-5'>RK</b>方案商

    AI硬件选型必看!RV1126B/RK3562/RK3576/RK3588之NPU性能实测对比

    做边缘计算、AI视觉产品,却在一堆芯片里看花眼?RV1126B、RK3562、RK3576RK
    的头像 发表于 03-14 07:11 957次阅读
    AI硬件选型必看!<b class='flag-5'>瑞</b><b class='flag-5'>芯</b><b class='flag-5'>微</b>RV1126B/<b class='flag-5'>RK</b>3562/<b class='flag-5'>RK3576</b>/<b class='flag-5'>RK</b>3588之NPU性能<b class='flag-5'>实测</b>对比

    RK3576基于Linux平台CUPS架构标准打印机适配实战教程

    RK3576是一款中高端八Arm国产处理器,原厂配套LinuxKernel6.1内核。触觉智能旗下RK3576核心板/开发板、行业主板,率先适配支持开源鸿蒙、
    的头像 发表于 01-16 17:45 869次阅读
    <b class='flag-5'>瑞</b><b class='flag-5'>芯</b><b class='flag-5'>微</b><b class='flag-5'>RK3576</b>基于Linux平台CUPS架构标准打印机适配实战教程

    RK3576开发板OpenGL性能大起底,这数据我真的服了

    RK3576芯片作为一款中高端的八Arm架构嵌入式处理器,集成Mali-G52MC3的GPU。本次OpenGL性能测试,基于触觉智能
    的头像 发表于 01-16 17:20 1926次阅读
    <b class='flag-5'>RK3576</b>开发板OpenGL性能大起底,这数据我真的服了

    RK3588与RK3576技术参数详解

    电子发烧友网报道(文/李弯弯)不久前表示,2025年上半年AIoT市场延续蓬勃发展趋势,因应AI在端侧应用发展需求,公司旗舰产品RK3588、次新产品
    的头像 发表于 09-23 08:20 9487次阅读
    <b class='flag-5'>瑞</b><b class='flag-5'>芯</b><b class='flag-5'>微</b><b class='flag-5'>RK</b>3588与<b class='flag-5'>RK3576</b>技术参数详解

    【作品合集】米尔RK3576开发板测评

    米尔RK3576开发板测评作品合集 产品介绍: RK3576一款面向AI市场推出的高性能处理器,它配备了四
    发表于 09-11 10:19

    RK3576平台FFmpeg硬件编解码移植及性能测试实战攻略 触觉智能RK3576开发板演示

    本文介绍RK3576平台,FFmpeg硬件编解码移植及性能测试方法。演示设备:触觉智能RK3576开发板FFmpeg简介与
    的头像 发表于 09-08 13:58 1710次阅读
    <b class='flag-5'>瑞</b><b class='flag-5'>芯</b><b class='flag-5'>微</b><b class='flag-5'>RK3576</b>平台FFmpeg硬件编解码移植及性能测试实战攻略 触觉智能<b class='flag-5'>RK3576</b>开发板演示

    基于米尔RK3576开发板的Qwen2-VL-3B模型NPU多模态部署评测

    关键词: RK3576、NPU(神经网络处理器)、端侧小语言模型(SLM)、多模态 LLM、边缘 AI 部署、开发板、RKLLM随着大语言模型(LLM)技术的快速迭代,从云端集
    发表于 08-29 18:08

    RK3576RK3576S有什么区别,性能参数配置与型号差异解析

    第二代8nm高性能AIOT平台RK3576家族再添新成员-RK3576S,先说结论:相较主型号的R
    的头像 发表于 08-14 23:57 2907次阅读
    <b class='flag-5'>瑞</b><b class='flag-5'>芯</b><b class='flag-5'>微</b><b class='flag-5'>RK3576</b>与<b class='flag-5'>RK3576S</b>有什么区别,性能参数配置与型号差异解析

    RK这2款旗舰芯片RK3588 PK RK3576,谁是最优选

    在 AI 边缘计算领域,RK3588 和 RK3576 都是备受瞩目的处理器。在中国半导体产业的版图中,
    发表于 07-10 18:24

    全国产! RK3576 ARM 八 2.2GHz 工业开发板—Linux应用开发手册

    创龙科技 TL3576-EVM 是一款基于 RK3576J/RK3576高性能处理器设计的
    的头像 发表于 06-25 16:44 1216次阅读
    全国产!<b class='flag-5'>瑞</b><b class='flag-5'>芯</b><b class='flag-5'>微</b> <b class='flag-5'>RK3576</b> ARM 八<b class='flag-5'>核</b> 2.2GHz 工业开发板—Linux应用开发手册

    全国产! RK3576 ARM 八 2.2GHz 工业开发板—Linux开发环境搭建

    创龙科技 TL3576-EVM 是一款基于 RK3576J/RK3576高性能处理器设计的
    的头像 发表于 06-25 10:17 908次阅读
    全国产!<b class='flag-5'>瑞</b><b class='flag-5'>芯</b><b class='flag-5'>微</b> <b class='flag-5'>RK3576</b> ARM 八<b class='flag-5'>核</b> 2.2GHz 工业开发板—Linux开发环境搭建

    全国产! RK3576 ARM 八 2.2GHz 工业开发板—Linux系统使用手册

    创龙科技 TL3576-EVM 是一款基于 RK3576J/RK3576高性能处理器设计的
    的头像 发表于 06-24 10:50 1367次阅读
    全国产!<b class='flag-5'>瑞</b><b class='flag-5'>芯</b><b class='flag-5'>微</b> <b class='flag-5'>RK3576</b> ARM 八<b class='flag-5'>核</b> 2.2GHz 工业开发板—Linux系统使用手册

    全国产! RK3576 ARM 八 2.2GHz 工业开发板—LVGL应用开发案例

    本文主要基于评估板演示LVGL应用开发案例,适用开发环境如下。创龙科技 TL3576-EVM 是一款基于 RK3576J/
    的头像 发表于 06-23 15:17 1083次阅读
    全国产!<b class='flag-5'>瑞</b><b class='flag-5'>芯</b><b class='flag-5'>微</b> <b class='flag-5'>RK3576</b> ARM 八<b class='flag-5'>核</b> 2.2GHz 工业开发板—LVGL应用开发案例

    Onenet云网关方案应用--基于米尔RK3576开发板

    本文将介绍基于米尔电子MYD-LR3576开发板(米尔基于RK3576开发板)的Onenet云网关应用方案测试。 摘自优秀创作者-小手
    发表于 06-06 16:54