0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Orange Pi 5 Plus实测:RK3588 NPU执行AI应用的效能如何?

香橙派 2023-12-21 17:58 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

OPi 5Plus的SoC为Rockchip RK3588八核(4个Cortex-A76+4个Cortex-A55)架构的64位处理器,主频达 2.4GHz并带有Mali-G610 GPU,除此之外的亮点还包括了一个 6 TOPS算力的NPU,支持TensorFlow、PyTorch等常见框架转换,使其能够作为处理AI影像的边缘装置。开发板上的周边也相当丰富,包含2 Ports 2.5Gb Ethernet、3 Ports HDMI (2out + 1in)、5 Ports USB、M.2 E-Key等高速接口从硬件数据看来相较树莓派而言可说是全面性的碾压,那么实际使用如何,一起往下看看!

wKgZomWEC_yAQFbhAAwg6ou3CQM235.png

怎么玩?

OPi 5 Plus支持多种操作系统,包含 Ubuntu、Debian、Android与官方自研的 Orange Pi OS等, 各位可以自行挑选喜欢的image映像下载后烧录到SD Card启动。笔者这里选择兼容性较好的Ubuntu,同时得利于Open Source的优势,安装的是非官方的Ubuntu 22.04社群版本。烧录完SD Card放入OPi 5 Plus再接上荧幕键盘网络线等,上电后后经过初始化设定即可以看到GNOME的桌面界面以及那只可爱的幸运水母。

就如同树莓派一样,当操作系统安装完成后就能够当作一般个人计算机使用,或是作为多媒体应用,甚至是搭载到移动载具上都行。由于使用的是 Ubuntu系统,软件套件支持性也相当丰富。笔者实际使用 Chromium浏览器开启YouTube 4K串流进行测试,顺畅度可以说是明显比树莓派好上许多,也没有任何影格丢失(frame drop)的现象!

神经网络运算单元 NPU

凭借着 RK3588处理器的强大效能,若使用OPi 5 Plus只是做 CPU运算就稍微可惜了,笔者本篇的最主要目的就是要体验Rockchip的NPU执行AI应用的效能如何。官方在 github上有提供对应RK3588 NPU的Library与范例程序rknpu2, 可以直接在OPi 5 Plus安装并呼叫 NPU执行,以下记录安装过程供各位参考。由于范例程序为C++语言需要进行编译,先执行系统更新并安装必要套件:

wKgaomWEC_aAW-LzAAAPs3xup5Y870.png

从 GitHub下载Repo:

wKgaomWEC_aAJYgXAAANG1xRzFM562.png

范例程序包含 API的使用与mobilenet及YOLOv5,选择YOLOv5范例进行编译:

wKgZomWEC_aAWKpxAAAPz1shSFs445.png

执行范例,带入官方预训练的 YOLOv5模型档 “yolov5s-640-640.rknn” 与推论图片 “bus.jpg”:

wKgZomWEC_aAX6DeAAAScJKovbI314.png

完成后会产生输出档案 “out.jpg”,开启后看到如下图示,主要物件接有被侦测并标记出来:

wKgaomWEC_uAWqcuAAKBJSMQJXg431.png

(OPi5Plus执行 YOLOv5图片推论结果)

若是第一次执行系统可能没有安装 RKNN的runtime library,会出现找不到.so动态连结Library导致执行失败,可以将此档案库提供的library复制到系统路径:

wKgZomWEC_eAQfyhAAAILJL_Smw523.png

YOLOv5实时影像推论

官方的范例并没有提供从 Webcam撷取影像进行推论的范例,但大家可以参考社群上这一篇教学的内容进行实作。准备好一个 UVC Webcam插上OPi 5 Plus的 USB孔,输入指令安装openCV相依套件:

wKgaomWEC_eASA9DAAAONU2Y3EM125.png

移动到 rknpu2 YOLOv5范例的路径:

wKgaomWEC_eACXNVAAANsWaMlOA984.png

下载社群 Maker提供的CMakeList.txt并复制到此目录下;下载社群Maker提供的main.cc并复制到src目录下。再次编译程序码:

wKgZomWEC_eAa6SjAAAJZGdulOY976.png

完成后动到安装路径执行范例程序,输入下方指令执行。指令带入第三个参数 “2” 代表使用/dev/Video2的装置,“1280” 代表影像的宽度,“720” 则代表影像的高度,可以依各位实际的情况调整。

wKgaomWEC_iAewwQAAAdHAwMO8s830.pngwKgaomWEC_uAErYxAAtHmNT7Pc0937.png

实际测试的结果在 1280×720 HD影像下的推论有10 FPS,若是将分辨率改为640×480则可以达到接近20 FPS。但从log看来执行推论的过程约只耗费20ms左右,其余的时间则是耗费在影像的处理与显示上了,效能可说是相当不赖。

模型转换工具 RKNN-Toolkit2

上述的推论范例使用官方预训练的 RKNN模型档,若是想要自行将不同框架的模型转成RKNN在OPi 5 Plus上推论,就必须透过官方提供的 RKNN-Toolkit2这个工具。此工具必须要在x86的PC上执行,作业系统要求为Ubuntu 18.04以上,Python 3.6以上,笔者的测试环境为Ubuntu 22.04,Python 3.10。 第一步也是要安装必要套件:

wKgZomWEC_iAdwkUAAAw5s8eVNs812.png

建立 python虚拟环境:

wKgaomWEC_iAYmayAAATdrawFjQ277.png

下载 RKNN-toolkit2:

wKgZomWEC_iAc-j9AAAZH2pXrXk329.png

安装相依套件:

wKgaomWEC_mAIl9fAAAN77_0k7s390.png

安装 RKNN-Toolkit2 Python模块:

wKgZomWEC_mAU3Z9AAAU6aKbkVI374.png

至此套件已安装完成,在此 toolkit中也有提供一些范例来转换pytorch、TensorFlow、Caffe、ONNX等不同框架的模型,可以进入到各范例中执行模型转换,举例而言要执行TensrFlow的转换范例可以输入以下指令:

wKgZomWEC_mAQEMmAAAS-Frfx0A908.png

这个指令会把目录下的 “ssd_mobilenet_v1_coco_2017_11_17.pb”TensorFlow预训练模型转换成NPU可执行的模型 “ssd_mobilenet_v1_coco.rknn”,并且会读取目录中的 “road.bmp” 档案进行推论测试。完成后即可把RKNN模型传送到Rockchip的单板计算机上执行了。

wKgZomWEC_uACw3DAASMJTS8o_A184.png

OPi 5 Plus执行 Teachable Machine转换后的RKNN模型

除了 RKNN Toolkit2内建的范例外,笔者也成功地把Teachable Machine汇出的TF.lite模型转换为RKNN模型并且在OPi 5 Plus上执行。简易流程如下:

·在 Teachable Machine训练模型,并汇出为TF.lite未量化格式

·将TF.lite模型传送到执行RKNN-toolkit2的Ubuntu PC。路径为 “rknn-toolkit2/examples/tflite/mobilenet_v1/”

·修改 “test.py” 档案,在呼叫 “rknn.config”API增加指定traget_platfrom为”rk3588”,并修改 “rknn_load_rflite”API所指定的model名称为刚刚传入的文件名称,如下图:

wKgaomWEC_qASd6IAAG6xsXgQsI756.png

·执行 python3 test.py转换模型,笔者也同时将test.py测试推论的图档改为训练资料图档,输出结果如下图,可以明确分类出图像。

wKgaomWEC_uASPHKAAdWWjNeRzk982.png

·将 rknn档案复制起来,并传送到OPi 5 Plus

·执行OPi 5 Plus的推论测试,结果如下图,可以正确的分类图片。

wKgZomWEC_qAfHtYAAKUlKdgn5U811.png

如此一来可以轻松地将 Teachable Machine客制化训练的模型放到OPi 5 Plus上执行了!

小结——展望未来想象空间更大

整体而言,Orange Pi 5 Plus适合作为智慧机上盒、智慧显示、NVR等相关应用,具备双GbE网口与多路影像输出输入是其特色。除此之外Rockchip的产品线近期已陆续搭载了NPU,让对应的单板计算机更具备竞争力,除了 CPU核心效能本身就还不错之外,还足以处理轻度物件侦测与影像分类等AI应用。唯独在 NPU工具的使用上还是稍微卡手了一些,Python文件说明也未齐全,这将直接影响Maker玩家投入开发的意愿程度。未来若能提供更人性化、更合宜的NPU开发者工具,再加上处理器本身的优异性能,可能将对边缘运算的市场造成一股破坏性的浪潮。

(以上素材来源于Felix)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Orange
    +关注

    关注

    0

    文章

    86

    浏览量

    20435
  • 开发板
    +关注

    关注

    26

    文章

    6518

    浏览量

    121375
  • NPU
    NPU
    +关注

    关注

    2

    文章

    394

    浏览量

    21434
  • RK3588
    +关注

    关注

    8

    文章

    604

    浏览量

    7707
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    技术分享 | 如何在启扬RK3588开发板上部署小龙虾 OpenClaw ?

    ,是构建轻量化本地AI执行节点的优选框架。启扬RK3588开发板具备6T算力NPU,正是OpenClaw落地边缘智能的理想平台。本文将以启扬RK35
    的头像 发表于 05-14 17:24 851次阅读
    技术分享 | 如何在启扬<b class='flag-5'>RK3588</b>开发板上部署小龙虾 OpenClaw  ?

    OrangePi 5详测:RK3588S NPU推理实测与树莓派5算力效率对比分析

    在当前边缘计算与嵌入式AI加速落地的背景下,单板计算机的选择标准正从“能跑Linux即可”转向对特定算力指标的量化评估。本次评测以OrangePi 5RK3588S平台)为测试对象,聚焦其N
    的头像 发表于 05-09 16:10 1285次阅读
    OrangePi <b class='flag-5'>5</b>详测:<b class='flag-5'>RK3588</b>S <b class='flag-5'>NPU</b>推理<b class='flag-5'>实测</b>与树莓派<b class='flag-5'>5</b>算力效率对比分析

    AI硬件选型必看!瑞芯微RV1126B/RK3562/RK3576/RK3588NPU性能实测对比

    做边缘计算、AI视觉产品,却在瑞芯微一堆芯片里看花眼?RV1126B、RK3562、RK3576、RK3588虽有明面上NPU性能数据,但
    的头像 发表于 03-14 07:11 918次阅读
    <b class='flag-5'>AI</b>硬件选型必看!瑞芯微RV1126B/<b class='flag-5'>RK</b>3562/<b class='flag-5'>RK</b>3576/<b class='flag-5'>RK3588</b>之<b class='flag-5'>NPU</b>性能<b class='flag-5'>实测</b>对比

    RK3588操控终端

    叠加,并用螺钉紧固,确保飞机在恶劣的环境中飞行,颠簸而稳定工作。RK3588的处理器架构结合了高性能的Cortex-A76核心和高效能的Cortex-A55核心,内存为16GB,ROM为128GB
    发表于 02-28 09:42

    OPi RK3588/RK3588S系列产品全面适配Openclaw,智能体“人人可及”时代正式开启

    招呼它帮你干活。 这只能理解指令、自主操作电脑、打通真实工作流的胖憨小龙虾,就问你馋不馋?快来跟我一起拿下它!以下是香橙派RK3588/RK3588S系列板子的详细部署教程(以OrangePi 5Plus
    发表于 02-10 17:43

    NPU实战】在迅为RK3588上玩转YOLOv8:目标检测与语义分割一站式部署指南

    NPU实战】在迅为RK3588上玩转YOLOv8:目标检测与语义分割一站式部署指南
    的头像 发表于 12-12 14:30 6516次阅读
    【<b class='flag-5'>NPU</b>实战】在迅为<b class='flag-5'>RK3588</b>上玩转YOLOv8:目标检测与语义分割一站式部署指南

    基于迅为RK3588开发板实现高性能机器狗主控解决方案- AI能力实战:YOLOv5目标检测例程

    基于迅为RK3588开发板实现高性能机器狗主控解决方案- AI能力实战:YOLOv5目标检测例程
    的头像 发表于 11-28 11:32 1818次阅读
    基于迅为<b class='flag-5'>RK3588</b>开发板实现高性能机器狗主控解决方案- <b class='flag-5'>AI</b>能力实战:YOLOv<b class='flag-5'>5</b>目标检测例程

    BPI-AIM7 RK3588 AI与 Nvidia Jetson Nano 生态系统兼容的低功耗 AI 模块

    Banana Pi BPI-AIM7 RK3588 AI Module7 (AIM7) 配备 64 位八核处理器、6 TOPS NPU、8 GB 内存、PCIe 3.0 支持以及软件定
    发表于 10-11 09:08

    BPI-AIM7 RK3588 AI与 Nvidia Jetson Nano 生态系统兼容的低功耗 AI 模块

    Banana Pi BPI-AIM7 RK3588 AI Module7 (AIM7) 配备 64 位八核处理器、6 TOPS NPU、8 GB 内存、PCIe 3.0 支持以及软件定
    的头像 发表于 10-11 09:06 1647次阅读
    BPI-AIM7 <b class='flag-5'>RK3588</b> <b class='flag-5'>AI</b>与 Nvidia Jetson Nano 生态系统兼容的低功耗 <b class='flag-5'>AI</b> 模块

    瑞芯微RK3588RK3576技术参数详解

    电子发烧友网报道(文/李弯弯)瑞芯微不久前表示,2025年上半年AIoT市场延续蓬勃发展趋势,因应AI在端侧应用发展需求,公司旗舰产品RK3588、次新产品RK3576等带领AIoT各产品线继续
    的头像 发表于 09-23 08:20 9437次阅读
    瑞芯微<b class='flag-5'>RK3588</b>与<b class='flag-5'>RK</b>3576技术参数详解

    请问如何在RK3588上使用npu,用onnx模型来推理

    请问如何在瑞芯微 RK3588上使用npu,用onnx模型来推理。官网上介绍说要把ONNX模型转换成RKNN模型。但是我并不想这么干,请问有什么办法吗?
    发表于 08-09 00:51

    RK3588数据手册

    RK3588的资料
    发表于 08-01 16:08 59次下载

    RK这2款旗舰芯片RK3588 PK RK3576,谁是最优选

    AI 边缘计算领域,瑞芯微的 RK3588RK3576 都是备受瞩目的处理器。在中国半导体产业的版图中,瑞芯微作为国内 SoC 芯片领跑者,凭借其在处理器芯片设计领域的深厚积累和持续创新
    发表于 07-10 18:24

    RK3576 vs RK3588:为何越来越多的开发者转向RK3576?

    高端平板、边缘计算)。 NPU 算力相同,但 RK3588 支持更复杂的 AI 计算(如 INT4/FP16)。 2. 多媒体与存储:满足主流需求 [td]项目RK3576RK3588
    发表于 05-30 08:46

    轻松上手边缘AI:MemryX MX3+结合Orange Pi 5 Plus的C/C++实战指南

    AI 和边缘计算快速发展的时代,MemryX MX3+ 加速卡凭借其 20 TOPS 的强大性能和低功耗(5 TFLOPS/W),成为边缘智能应用的理想选择。结合 Orange Pi
    的头像 发表于 05-28 08:01 1014次阅读
    轻松上手边缘<b class='flag-5'>AI</b>:MemryX MX3+结合<b class='flag-5'>Orange</b> <b class='flag-5'>Pi</b> <b class='flag-5'>5</b> <b class='flag-5'>Plus</b>的C/C++实战指南