0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

想用RK3588在边缘端跑大模型?你的算力还差多少?

广州灵眸科技有限公司 2026-04-10 17:31 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在边缘计算与嵌入式AI应用飞速发展的今天,瑞芯微RK3588平台凭借其强大的多媒体处理能力和6TOPS的NPU算力,已成为高端AIoT项目的首选之一。然而,面对日益复杂的大模型(LLM)部署需求与高并发的视觉推理任务,单一的SoC算力往往面临瓶颈。

为此,瑞芯微推出了专为算力扩展设计的RK1820 AI加速卡。本文将以EASY-EAI的MONSTER(RK3588)开发板为例,提供一份从硬件对接到模型部署的完整适配指南,并对其性能进行实测分析,为开发者实现算力升级提供切实可行的技术路径。


PART.01

核心硬件:

RK1820加速卡与RK3588的协同架构

RK1820加速卡概览

RK1820是一款采用PCIe接口的独立AI加速卡,其核心设计目标是作为主控SoC的协处理器,专攻高强度、批量的AI推理任务。其关键特性如下:

高密度算力:提供高达20 TOPS@INT8的峰值算力,足以应对大多数视觉大模型及十亿参数级别的语言模型。

大容量板载内存:集成2.5GB专用内存,能够将大型模型完全载入,避免频繁通过PCIe总线与主机交换数据,从而显著降低推理延迟。

标准接口:采用M.2 Key M接口,便于与具备PCIe通道的RK3588核心板或开发板快速集成。


1d1c3fea-34c0-11f1-ab55-92fbcf53809c.png


RK3588 + RK1820的异构计算模式

在此方案中,RK3588与RK1820构成了一个典型的异构计算系统:

RK3588(主机):负责运行完整的操作系统(如Ubuntu)、处理通用计算、多媒体编解码、系统调度以及轻量级或实时性要求高的AI任务。

RK1820(设备):作为专用的AI推理加速器,接收来自主机的推理任务和数据,利用其高并行计算单元完成高效处理,并将结果返回。

这种分工实现了计算资源的优化配置,使RK3588平台的能力边界得以大幅扩展,尤其适合智能NVR(多路视频结构化分析)、服务机器人、边缘AI服务器及需要端侧运行大语言模型的场景。


1d336f1c-34c0-11f1-ab55-92fbcf53809c.pngPART.02

软硬件适配与驱动部署

*以下适配流程基于EASY-EAI-MONSTER开发板及配套的软件包

硬件连接与准备

硬件:EASY-EAI-MONSTER开发板、RK1820 M.2加速卡、12V/3A电源(为算力卡独立供电)。

连接顺序:务必先将RK1820加速卡插入主板的M.2插槽并连接好12V供电,然后再为开发板上电。此顺序可确保PCIe设备能被系统正确识别枚举。

软件基础:开发板需预先烧录适配后的固件(如EASY-EAI-Monster-Ubuntu 22.04-firmware_20260407或更新版本)。


驱动安装与验证

将提供的适配套件rknn3_rk182x_sodimm_installer_arm64.tgz拷贝至开发板,并按顺序执行以下命令:

1d5b9604-34c0-11f1-ab55-92fbcf53809c.png

安装脚本将自动部署PCIe驱动(pcie-rkep)、用户态库及相关服务。


设备验证

重启后,可通过以下命令验证适配是否成功:

检查PCIe设备识别:执行lspci,列表中应出现Rockchip Electronics Co., Ltd Device 182a的设备信息。

1d6db348-34c0-11f1-ab55-92fbcf53809c.png

检查驱动加载:执行dmesg | grep pcie-rkep,查看驱动加载日志,确认无错误信息。

检查设备节点:执行ls -l /dev/pcie-rkep*,确认驱动已创建设备节点。

查看算力卡状态:执行rknn-smi info,此命令可显示RK1820的详细信息,包括设备名称、算力利用率和内存使用情况,是验证加速卡是否就绪的最直接方式。


PART.03

模型部署与性能实测

适配成功后,即可利用RKNN工具链将模型部署到RK1820上运行。套件中提供了rknn3_model_testrknn3_session_test两个测试程序,分别用于传统视觉模型和大语言模型。


视觉模型测试

(以YOLOv5s为例)

模型准备:使用RKNN-Toolkit2将训练好的YOLOv5s模型转换为RK1820支持的.rknn格式。

执行推理:将模型文件置于板端,运行以下命令:

1d7f6a5c-34c0-11f1-ab55-92fbcf53809c.png

性能指标:在测试中,YOLOv5s模型在RK1820上的单次推理耗时约为30.27毫秒,展现了其处理实时视觉任务的高效能力。

1d86e746-34c0-11f1-ab55-92fbcf53809c.png


大语言模型测试

(以Qwen2.5-1.5B为例)

模型准备:需要准备转换后的Qwen2.5-1.5B.rknn模型文件、权重文件(.weight)、分词器文件(.tokenizer.gguf)和嵌入层文件(.embed.bin)。

执行推理:由于大模型运行通常需要独立的模型服务,需先停止系统默认的rknpu服务,然后启动会话测试:

1d9e6178-34c0-11f1-ab55-92fbcf53809c.png

能力验证:此测试将启动一个交互式会话,开发者可以直接输入文本,模型将基于RK1820的算力进行生成式回复,直观验证了在边缘端部署并运行十亿参数级大模型的可行性。


1da96370-34c0-11f1-ab55-92fbcf53809c.png


1db5a518-34c0-11f1-ab55-92fbcf53809c.png


1dc15f8e-34c0-11f1-ab55-92fbcf53809c.pngPART.04

应用场景与开发建议

典型应用场景

多路高性能视频分析:利用RK3588强大的解码能力处理多路视频流,将解码后的画面数据通过PCIe总线发送给RK1820进行高精度、高并发的目标检测与识别。

边缘AI服务器:在局域网内部署,为多个终端提供低延迟的AI服务,如智能客服、代码辅助、文档摘要等。

复杂环境下的机器人:同时处理激光雷达、视觉、语音等多模态传感器的输入,进行实时融合感知与决策。


1dda2d70-34c0-11f1-ab55-92fbcf53809c.png


开发建议

任务划分:将时延敏感、控制相关的轻量模型放在RK3588 NPU上运行;将计算密集、允许微秒级延迟的批量推理任务卸载到RK1820。

数据传输优化:尽量减少主机与加速卡之间不必要的内存拷贝,利用零拷贝等技术优化PCIe数据传输效率。

功耗管理:在连续推理任务中,RK1820的功耗是需要考虑的因素。在间歇性工作场景,可通过驱动接口管理其工作状态以实现能效平衡。

通过上述适配,RK3588平台成功融合了RK1820加速卡的20TOPS算力,构建了一个总计超过26TOPS的强劲边缘AI系统。本次实践表明,该方案软硬件集成度较高,驱动安装便捷,为开发者提供了清晰的从验证到部署的路径。无论是提升现有视觉应用的性能密度,还是探索在边缘设备运行大语言模型这一前沿领域,RK3588+RK1820的组合都提供了一个稳定而强大的硬件基础。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • EASY-EAI灵眸科技

    关注

    4

    文章

    95

    浏览量

    3720
  • 算力
    +关注

    关注

    2

    文章

    1658

    浏览量

    16832
  • RK3588
    +关注

    关注

    8

    文章

    585

    浏览量

    7540
  • 大模型
    +关注

    关注

    2

    文章

    3750

    浏览量

    5268
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    麒麟适配 | 眺望电子上线 “RK3588+麒麟” 全功能主板

    引言:国产化加速的工业新时代,需要从核心芯片到操作系统实现全栈自主可控。眺望电子发布上线RK3588麒麟全功能主板,集高性能、国产化、工业级于一体,以安全可靠的国产底座,赋能
    的头像 发表于 04-17 17:03 2228次阅读
    麒麟适配 | 眺望电子上线 “<b class='flag-5'>RK3588</b>+麒麟” 全功能主板

    支持卡扩展的RK3588国产工控机,实现AI性能25TOPS按需升级

    人工智能与工业深度融合的今天,工控机面临的挑战不再是“能不能”,而是“算得快不快”、“够不够”。虽然RK3588内置的6TOPS N
    的头像 发表于 04-08 17:00 282次阅读
    支持<b class='flag-5'>算</b><b class='flag-5'>力</b>卡扩展的<b class='flag-5'>RK3588</b>国产工控机,实现AI性能25TOPS按需升级

    国产RK182X协处理器 + RK3588实测,大模型“极速流畅”

    我们拿到瑞芯微RK182X协处理器评估套件实物后,第一时间基于创龙科技RK3588工业评估板进行了实测,用真实数据告诉,这款“AI推理
    的头像 发表于 03-13 11:05 477次阅读
    国产<b class='flag-5'>RK</b>182X<b class='flag-5'>算</b><b class='flag-5'>力</b>协处理器 + <b class='flag-5'>RK3588</b>实测,大<b class='flag-5'>模型</b>“极速流畅”

    Hailo-8卡 + RK3588实测!26TOPS加持,助力AI视觉升级!

    近年来,AI视觉边缘应用广泛,行业对AI推理硬件的要求也日益提升。传统CPUCNN等视觉模型推理任务中逐渐显露瓶颈,而专用AI加速器成
    的头像 发表于 03-02 16:46 375次阅读
    Hailo-8<b class='flag-5'>算</b><b class='flag-5'>力</b>卡 + <b class='flag-5'>RK3588</b>实测!26TOPS加持,助力AI视觉升级!

    RK3588操控终端

    的应用场景。 板卡超小型 RK3588 模组,外形为圆形板,直径仅为54mm,抛弃冗余功能,保留仅需要的端口,让体积和重量缩小到极限,极大的确保飞行的续航,并保证电路的稳定运行。外形上采用3层板
    发表于 02-28 09:42

    的专属“数字员工”已到岗!迅为RK3588系列适配OpenClaw

    的专属“数字员工”已到岗!迅为RK3588系列适配OpenClaw
    的头像 发表于 02-27 15:33 776次阅读
    <b class='flag-5'>你</b>的专属“数字员工”已到岗!迅为<b class='flag-5'>RK3588</b>系列适配OpenClaw

    深入解析RK3588 U-Boot板级文件:evb_rk3588.c核心逻辑拆解

    嵌入式开发领域,瑞芯微RK3588凭借超强的、丰富的接口和广泛的场景适配性,成为高端边缘计算、消费电子项目的热门选择。而U-Boot作
    的头像 发表于 02-24 15:24 960次阅读
    深入解析<b class='flag-5'>RK3588</b> U-Boot板级文件:evb_<b class='flag-5'>rk3588</b>.c核心逻辑拆解

    RK3588平台USB摄像头调试实战:从报错到稳定运行

    嵌入式开发中,RK3588 凭借强劲的常被用于边缘计算、工业视觉等场景,而 USB 摄像头作为常见外设,调试过程中难免遇到各类 “卡壳
    的头像 发表于 02-04 16:13 653次阅读

    RK3588 6TOPS如何落地,钡铼技术AXMxy BL450告诉您!

    这几年但凡聊到“AI边缘推理”“工业视觉”“本地大模型”,RK3588 这个名字一定听过。它的名号很简单—— 6TOPS
    的头像 发表于 12-09 15:29 1084次阅读

    RK3588数据手册

    RK3588的资料
    发表于 08-01 16:08 54次下载

    揭秘瑞芯微协处理器,RK3576/RK3588强大搭档

    瑞芯微协处理器-Gongga1(简称“贡嘎”),是瑞芯微针对旗舰芯片平台RK3576/RK3588等SoC平台配套的
    的头像 发表于 07-17 10:00 1519次阅读
    揭秘瑞芯微<b class='flag-5'>算</b><b class='flag-5'>力</b>协处理器,<b class='flag-5'>RK</b>3576/<b class='flag-5'>RK3588</b>强大<b class='flag-5'>算</b><b class='flag-5'>力</b>搭档

    RK这2款旗舰芯片RK3588 PK RK3576,谁是最优选

    AI 边缘计算领域,瑞芯微的 RK3588RK3576 都是备受瞩目的处理器。中国半导体产业的版图中,瑞芯微作为国内 SoC 芯
    发表于 07-10 18:24

    RK3576 vs RK3588:为何越来越多的开发者转向RK3576?

    高端平板、边缘计算)。 NPU 相同,但 RK3588 支持更复杂的 AI 计算(如 INT4/FP16)。 2. 多媒体与存储:满足主流需求 [td]项目
    发表于 05-30 08:46

    RK3588参数与主要特性 RK3588数据手册解读

    RK3588参数与主要特性 RK3588数据手册解读
    的头像 发表于 05-19 18:34 1.5w次阅读
    <b class='flag-5'>RK3588</b>参数与主要特性  <b class='flag-5'>RK3588</b>数据手册解读

    RK3588S和RK3588S2差异说明

    CSI_RX PORT1 不变外,其余接口位置有整体移动,并且RK3588S的MIPI DPHY CSI_RX PORT0接口PIN AN37/AN38新增新增一组时钟MIPI_CSI0_CLK1P/MIPI_CSI0_CLK1N
    的头像 发表于 05-13 14:23 3168次阅读
    <b class='flag-5'>RK3588</b>S和<b class='flag-5'>RK3588</b>S2差异说明