0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

引领端侧大模型落地!Firefly-RK182X 开发套件上线发售

Firefly开源团队 2025-11-26 16:33 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

海量参数的大模型给AI行业带来颠覆性的体验,然而在端侧设备中,由于有限的DRAM带宽、硬件算力、存储容量端等瓶颈,让端侧大模型长期停留在概念阶段,实时响应速度、输出长度等核心诉求难以落地。

943e7fc6-caa2-11f0-8ce9-92fbcf53809c.jpg

Rockchip全新高性能端侧大模型协处理器RK182X,以硬核技术突破瓶颈,重构端侧智能格局,引领端侧大模型落地。

3D 堆叠架构突破带宽瓶颈

RK182X 作为针对端侧3B/7B大模型的协处理器,通过先进的3D堆叠封装技术,集成高带宽嵌入式片内DRAM(2.5GB/5GB版本),端侧生成速率超100 tokens/s,端到端延迟低至0.1s,能够提供包括文本、语音、图片、视频、传统CNN等大模型在内全方位的模型算法支持。

944d2288-caa2-11f0-8ce9-92fbcf53809c.png

7B大模型30TPS带宽需求:3.5GBx30=105GB/s

传统2D芯片的DDR只能提供44-100GB的理论带宽,而3D堆叠芯片的DDR能提供1TB/s DRAM 的理论带宽!

RK182X LLM/VLM性能

RK182X有着专为AI设计的NPU架构,并通过PCIe高速接口,与主SOC协同工作,内置高带宽DRAM,助力大模型的本地化部署和高效运行。

以下是 RK182X 在运行LLM时的表现:

9462518a-caa2-11f0-8ce9-92fbcf53809c.png

数据基于RKNN3 SDK,所有模型使用w4a16量化,LLM input为128

以下是 RK182X 在运行VLM时的表现:

947797b6-caa2-11f0-8ce9-92fbcf53809c.png

数据基于RKNN3 SDK,所有模型使用w4a16量化

VL的LLM部分input为128

RK182X应用案例演示

应用案例1:视频摘要

9489ad84-caa2-11f0-8ce9-92fbcf53809c.jpg

RK182X的端侧VLM视频分析以及实时预警方案中,RK3588对视频进行一个预处理,RK182X对VLM模型进行推理加速,对画面内容作出实时且准确的分析。以下是视频摘要的案例演示:


从视频中看出,RK182X对视频中人物的行为、动作及所在场景都做出了准确的分析判断,并且会对异常行为发出预警,适用于摄像头监控、安防NVR后端、车载哨兵模式等场景。AI处理均在端侧离线的情况下进行,保障用户的隐私安全。


应用案例2:视频检索

94939fe2-caa2-11f0-8ce9-92fbcf53809c.jpg

视频检索的应用场景中,模型通过遍历视频资源,提取视频序列存储到数据库,再通过图文模态相似度比对,显示检索结果。以下是视频检索的案例演示:


从视频可以看出,模型对视频资源行为内容的高精度匹配,对于超大视频数据库也能进行快速匹配。该功能可适用于安防NVR后端、各类监控等应用场景。


应用案例3:同声传译

949f51e8-caa2-11f0-8ce9-92fbcf53809c.jpg

同声传译是通过高速PCIe总线互联,RK3588集成音频3A算法,实现精准拾音,RK182X则部署了同声传译模型,首包延迟仅3.2秒。采用离线端部署,无需网络,不仅保护隐私,还可以实现稳定实时的语言翻译。以下是同声传译中会议模式的演示:


从视频中可以看出模型低延迟、高准确率的表现,同声传译可应用于视频会议、商务洽谈、留学旅游等跨语言交流的场景。


应用案例4:陪伴机器人

94aa94f4-caa2-11f0-8ce9-92fbcf53809c.jpg

陪伴机器人的应用场景中,RK3588作为“小脑”,负责运动控制,而RK1828作为“大脑”负责感知决策,在对话(LLM)和场景分析(VLM)的方面都能发挥其极强优势,其中VLM在端侧运行,能够有效保护用户的隐私。双模组架构实现端云结合,同时满足了表现效果和场景需求。

Firefly RK182X开发套件

RK182X开发套件采用双模组结构设计,通过PCIe接口连接,其中RK3588负责任务调度和数据预处理,RK182X专注AI推理,支持模型并行和多任务协作,确保高效分工和低延迟响应。

94b383e8-caa2-11f0-8ce9-92fbcf53809c.jpg

Firefly RK182X 开发套件

1. 增强AI加速


基于RK182X的端侧VLM视频分析以及实时预警方案,其中RK3588对视频进行一个预处理,RK182X对VLM模型进行推理加速,对画面内容作出实时且准确的分析。

2. 高性能计算

RK3588采用8核CPU架构,集成高性能VPU,支持8K视频编解码,结合RK182X实现高效视频AI分析。

3. 边缘低延迟


本地AI处理减少网络依赖,实现毫秒级响应和数据隐私保护,可在弱网环境下维持实时决策,提升整体系统可靠性和安全性。

4. 多网口连接


配备8个网口,支持高吞吐量数据传输和多设备互联,适用于泛安防、教育、安全生产等场景。

5. 存储扩展性


通过SATA接口扩展SSD/HDD,高效处理 AI 数据集或视频日志,避免云端传输风险。


抢先体验双核AI性能

Firefly RK182X开发套件为AI大模型提供强劲算力,多任务并行处理的能力。可支持语音识别、视频编解码、长上下文对话等应用场景,广泛适用于智慧安防、智能机器人、边缘AI计算、智能座舱、监控分析、工业视觉检测等领域。

现已正式上线发售,点击前往购买。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38073

    浏览量

    296299
  • 开发套件
    +关注

    关注

    2

    文章

    196

    浏览量

    24979
  • Firefly
    +关注

    关注

    2

    文章

    546

    浏览量

    9001
  • 大模型
    +关注

    关注

    2

    文章

    3439

    浏览量

    4960
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Firefly 推出基于 RK1820 / RK1828 的开发套件与 AI NVR 服务器

    RK1820/RK1828是瑞芯微面向AI时代推出的算力协处理器,采用先进的3D堆叠封装技术,集成高带宽嵌入式片内DRAM(2.5GB/5GB版本),生成速率超100tokens/
    的头像 发表于 11-05 18:52 1063次阅读
    <b class='flag-5'>Firefly</b> 推出基于 <b class='flag-5'>RK</b>1820 / <b class='flag-5'>RK</b>1828 的<b class='flag-5'>开发套件</b>与 AI NVR 服务器

    STM32 Nucleo IO-Link开发套件技术解析

    -NUCLEOIOD02A1和X-NUCLEO-DO40A1扩展板组成。该Nucleo套件可用于评估目的和用作开发环境。P-NUCLEO-IOD5A1套件用于
    的头像 发表于 10-16 10:01 422次阅读
    STM32 Nucleo IO-Link<b class='flag-5'>开发套件</b>技术解析

    ‌TI CC1311P3 LaunchPad™开发套件技术解析与应用指南

    Texas Instruments CC1311P3 LaunchPad™ 开发套件设计用于加速开发SimpleLink™ 亚1GHz无线MCU。该器件支持TI 15.4堆栈和专有射频协议。CC13XX-CC26XX软件开发套件
    的头像 发表于 09-01 15:19 812次阅读
    ‌TI CC1311P3 LaunchPad™<b class='flag-5'>开发套件</b>技术解析与应用指南

    斩获金奖!利尔达AI开发套件继续解锁更多应用场景

    评选作为物联网行业的一项重要权威活动,以“技术突破力、场景落地性与产业引领性”为核心标准,旨在发掘并推广前沿物联网创新成果,为产业树立标杆。利尔达AI开发套件在众
    的头像 发表于 08-28 17:56 851次阅读
    斩获金奖!利尔达AI<b class='flag-5'>开发套件</b>继续解锁更多应用场景

    德州仪器LAUNCHXL-F28P65X LaunchPad开发套件技术解析与应用指南

    Texas Instruments LAUNCHXL-F28P65X LaunchPad™ 开发套件基于C2000™ 实时微控制器系列F28P65x器件。LAUNCHXL-F28P65X
    的头像 发表于 08-14 14:23 1168次阅读
    德州仪器LAUNCHXL-F28P65<b class='flag-5'>X</b> LaunchPad<b class='flag-5'>开发套件</b>技术解析与应用指南

    德州仪器AM243x LaunchPad™开发套件技术解析与应用指南

    Texas Instruments AM243x LaunchPad™ 开发套件包括一块开发板,专为Sitara™ AM243x系列高性能微控制器设计。该电路板提供了一个标准化和易于使
    的头像 发表于 08-14 09:34 717次阅读
    德州仪器AM243<b class='flag-5'>x</b> LaunchPad™<b class='flag-5'>开发套件</b>技术解析与应用指南

    广和通加速通义千问Qwen3在全面落地

    6月,广和通宣布:率先完成通义千问Qwen3系列混合推理模型在高通QCS8550平台的适配部署。广和通通过定制化混合精度量化方案与创新硬件加速算法,成功突破Qwen3新型架构在边缘
    的头像 发表于 06-25 15:35 767次阅读

    DA14594 BLE Pro开发套件 开源 (原理图+BOM+PCB)

    DA14594-006FDEVKT-P BLE Pro开发套件 *附件:REN_DA1459x_开发板 硬件手册.pdf *附件:DA1459x Pro
    的头像 发表于 05-22 10:47 1027次阅读
    DA14594 BLE Pro<b class='flag-5'>开发套件</b> 开源 (原理图+BOM+PCB)

    SC171开发套件V3 技术资料

    /jishu_2485277_1_1.html 硬件配件测试与使用(SC171开发套件V3) https://bbs.elecfans.com/jishu_2485280_1_1.html AI侧部署开发
    发表于 04-17 11:03

    模型实战(SC171开发套件V3)

    模型实战(SC171开发套件V3) 序列 课程名称 视频课程时长 视频课程链接 课件链接 工程源码 1 火山引擎豆包大模型调试指南 3分31秒 https://t.elecfans.com/v
    发表于 04-16 18:52

    AI侧部署开发(SC171开发套件V3)

    AI侧部署开发(SC171开发套件V3) 序列 课程名称 视频课程时长 视频课程链接 课件链接 工程源码 1 Fibo AI Stack模型转化指南------Docker Desk
    发表于 04-16 18:30

    首创开源架构,天玑AI开发套件AI模型接入得心应手

    ,联发科带来了全面升级的天玑AI开发套件2.0,在模型库规模、架构开放程度、前沿AI技术支持和
    发表于 04-13 19:52

    AI大模型侧部署正当时:移远端AI大模型解决方案,激活场景智能新范式

    AI大模型解决方案备受瞩目,为AI设备的革新注入了澎湃动力。万亿级市场蓝海显现,AI大模型加速落地近年来,
    的头像 发表于 03-26 19:05 969次阅读
    AI大<b class='flag-5'>模型</b><b class='flag-5'>端</b>侧部署正当时:移远端<b class='flag-5'>侧</b>AI大<b class='flag-5'>模型</b>解决方案,激活场景智能新范式

    广和通开启AI新时代

    AI发展正酣,随着终端芯片算力越来越高、模型能力越来越强、实时响应及隐私保护的应用需求增加,
    的头像 发表于 12-12 10:35 1280次阅读

    【正点原子STM32H7R3开发套件试用体验】开发套件开箱报告

    非常有幸,能够体验正点原子STM32H7R3开发套件。 一直以来,用了不少正点原子的产品,总的来说,体验非常的好。 收到套件快递,开箱的那一刻,觉得就是那个正点原子的味儿,一直没变。 一、套件盒子
    发表于 12-12 00:54