0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

引领端侧大模型落地!Firefly-RK182X 开发套件上线发售

Firefly开源团队 2025-11-26 16:33 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

海量参数的大模型给AI行业带来颠覆性的体验,然而在端侧设备中,由于有限的DRAM带宽、硬件算力、存储容量端等瓶颈,让端侧大模型长期停留在概念阶段,实时响应速度、输出长度等核心诉求难以落地。

943e7fc6-caa2-11f0-8ce9-92fbcf53809c.jpg

Rockchip全新高性能端侧大模型协处理器RK182X,以硬核技术突破瓶颈,重构端侧智能格局,引领端侧大模型落地。

3D 堆叠架构突破带宽瓶颈

RK182X 作为针对端侧3B/7B大模型的协处理器,通过先进的3D堆叠封装技术,集成高带宽嵌入式片内DRAM(2.5GB/5GB版本),端侧生成速率超100 tokens/s,端到端延迟低至0.1s,能够提供包括文本、语音、图片、视频、传统CNN等大模型在内全方位的模型算法支持。

944d2288-caa2-11f0-8ce9-92fbcf53809c.png

7B大模型30TPS带宽需求:3.5GBx30=105GB/s

传统2D芯片的DDR只能提供44-100GB的理论带宽,而3D堆叠芯片的DDR能提供1TB/s DRAM 的理论带宽!

RK182X LLM/VLM性能

RK182X有着专为AI设计的NPU架构,并通过PCIe高速接口,与主SOC协同工作,内置高带宽DRAM,助力大模型的本地化部署和高效运行。

以下是 RK182X 在运行LLM时的表现:

9462518a-caa2-11f0-8ce9-92fbcf53809c.png

数据基于RKNN3 SDK,所有模型使用w4a16量化,LLM input为128

以下是 RK182X 在运行VLM时的表现:

947797b6-caa2-11f0-8ce9-92fbcf53809c.png

数据基于RKNN3 SDK,所有模型使用w4a16量化

VL的LLM部分input为128

RK182X应用案例演示

应用案例1:视频摘要

9489ad84-caa2-11f0-8ce9-92fbcf53809c.jpg

RK182X的端侧VLM视频分析以及实时预警方案中,RK3588对视频进行一个预处理,RK182X对VLM模型进行推理加速,对画面内容作出实时且准确的分析。以下是视频摘要的案例演示:


从视频中看出,RK182X对视频中人物的行为、动作及所在场景都做出了准确的分析判断,并且会对异常行为发出预警,适用于摄像头监控、安防NVR后端、车载哨兵模式等场景。AI处理均在端侧离线的情况下进行,保障用户的隐私安全。


应用案例2:视频检索

94939fe2-caa2-11f0-8ce9-92fbcf53809c.jpg

视频检索的应用场景中,模型通过遍历视频资源,提取视频序列存储到数据库,再通过图文模态相似度比对,显示检索结果。以下是视频检索的案例演示:


从视频可以看出,模型对视频资源行为内容的高精度匹配,对于超大视频数据库也能进行快速匹配。该功能可适用于安防NVR后端、各类监控等应用场景。


应用案例3:同声传译

949f51e8-caa2-11f0-8ce9-92fbcf53809c.jpg

同声传译是通过高速PCIe总线互联,RK3588集成音频3A算法,实现精准拾音,RK182X则部署了同声传译模型,首包延迟仅3.2秒。采用离线端部署,无需网络,不仅保护隐私,还可以实现稳定实时的语言翻译。以下是同声传译中会议模式的演示:


从视频中可以看出模型低延迟、高准确率的表现,同声传译可应用于视频会议、商务洽谈、留学旅游等跨语言交流的场景。


应用案例4:陪伴机器人

94aa94f4-caa2-11f0-8ce9-92fbcf53809c.jpg

陪伴机器人的应用场景中,RK3588作为“小脑”,负责运动控制,而RK1828作为“大脑”负责感知决策,在对话(LLM)和场景分析(VLM)的方面都能发挥其极强优势,其中VLM在端侧运行,能够有效保护用户的隐私。双模组架构实现端云结合,同时满足了表现效果和场景需求。

Firefly RK182X开发套件

RK182X开发套件采用双模组结构设计,通过PCIe接口连接,其中RK3588负责任务调度和数据预处理,RK182X专注AI推理,支持模型并行和多任务协作,确保高效分工和低延迟响应。

94b383e8-caa2-11f0-8ce9-92fbcf53809c.jpg

Firefly RK182X 开发套件

1. 增强AI加速


基于RK182X的端侧VLM视频分析以及实时预警方案,其中RK3588对视频进行一个预处理,RK182X对VLM模型进行推理加速,对画面内容作出实时且准确的分析。

2. 高性能计算

RK3588采用8核CPU架构,集成高性能VPU,支持8K视频编解码,结合RK182X实现高效视频AI分析。

3. 边缘低延迟


本地AI处理减少网络依赖,实现毫秒级响应和数据隐私保护,可在弱网环境下维持实时决策,提升整体系统可靠性和安全性。

4. 多网口连接


配备8个网口,支持高吞吐量数据传输和多设备互联,适用于泛安防、教育、安全生产等场景。

5. 存储扩展性


通过SATA接口扩展SSD/HDD,高效处理 AI 数据集或视频日志,避免云端传输风险。


抢先体验双核AI性能

Firefly RK182X开发套件为AI大模型提供强劲算力,多任务并行处理的能力。可支持语音识别、视频编解码、长上下文对话等应用场景,广泛适用于智慧安防、智能机器人、边缘AI计算、智能座舱、监控分析、工业视觉检测等领域。

现已正式上线发售,点击前往购买。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    42239

    浏览量

    303264
  • 开发套件
    +关注

    关注

    2

    文章

    245

    浏览量

    25345
  • Firefly
    +关注

    关注

    2

    文章

    549

    浏览量

    9204
  • 大模型
    +关注

    关注

    2

    文章

    3884

    浏览量

    5312
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI的大模型时代,从面壁智能开始

    模型落地难,面壁智能开源了一个答案
    的头像 发表于 05-26 10:34 1468次阅读
    <b class='flag-5'>端</b><b class='flag-5'>侧</b>AI的大<b class='flag-5'>模型</b>时代,从面壁智能开始

    AIBOX PRO:全新一代边缘 AI 大模型一体机

    现突出。Firefly依托RK182X开发套件持续助力各行业AI项目落地。如今,我们结合用户的实际反馈,对原有设计进行大幅优化升级,推出全新一代边缘AI大
    的头像 发表于 05-21 16:40 546次阅读
    AIBOX PRO:全新一代边缘 AI 大<b class='flag-5'>模型</b>一体机

    Power Manager II Hercules开发套件快速上手

    Power Manager II Hercules开发套件快速上手 在电子设计领域,开发套件的高效使用能极大地推动项目进展。Power Manager II Hercules开发套件为电子工程师提供
    的头像 发表于 05-21 14:30 176次阅读

    国产RK182X算力协处理器 + RK3588实测,大模型“极速流畅”

    我们拿到瑞芯微RK182X算力协处理器评估套件实物后,第一时间基于创龙科技RK3588工业评估板进行了实测,用真实数据告诉你,这款“AI推理外挂”究竟有多强! ▍
    的头像 发表于 03-13 11:05 858次阅读
    国产<b class='flag-5'>RK182X</b>算力协处理器 + <b class='flag-5'>RK</b>3588实测,大<b class='flag-5'>模型</b>“极速流畅”

    模型实战(SC171开发套件V2-FAS)

    模型实战(SC171开发套件V2-FAS) 序列 课程名称 视频课程时长 视频课程链接 课件链接 工程源码 1 大语言模型(Qwen3)案例----基于SC171开发套件V2-FAS
    发表于 02-11 14:57

    AI侧部署开发(SC171开发套件V2-FAS)

    AI侧部署开发(SC171开发套件V2-FAS) 序列 课程名称 视频课程时长 视频课程链接 课件链接 工程源码 1 Fibo AI Stack模型转化指南 27分19秒 https
    发表于 02-11 11:44

    瑞芯微RK182X全面适配主流多模态大模型

    在全球人工智能加速渗透的今天, “生态适配广度”与“场景落地深度”正成为衡量AI平台核心价值的新标尺。瑞芯微基于全球首颗3D创新架构
    的头像 发表于 01-27 16:16 1289次阅读

    SC171开发套件V3 技术资料 2026版

    开发套件V3) https://bbs.elecfans.com/jishu_2485280_1_1.html AI侧部署开发(SC171开发套件V3)2026版 https
    发表于 01-15 12:13

    模型实战(SC171开发套件V3)2026版

    模型实战(SC171开发套件V3)2026版 序列 课程名称 视频课程时长 视频课程链接 课件链接 工程源码 1 火山引擎大模型调试指南 6分53秒 https://t.elecfans.com
    发表于 01-15 12:05

    AI功能(SC171开发套件V3)2026版

    )案例_V2.0.pdf 见文档说明 3 图像超分辨率(real esrgan x4plus)案例----基于SC171开发套件V3 8分22秒 https://t.elecfans.com/v
    发表于 01-15 11:18

    AI侧部署开发(SC171开发套件V3)2026版

    AI侧部署开发(SC171开发套件V3)2026版 序列 课程名称 视频课程时长 视频课程链接 课件链接 工程源码 1 Fibo AI Stack模型转化指南 27分19秒 http
    发表于 01-15 10:31

    SC171开发套件V3 技术资料 2026版

    /jishu_2485280_1_1.html AI侧部署开发(SC171开发套件V3)2026版 https://bbs.elecfans.com/jishu_2509049_1_1.html AI
    发表于 01-09 10:03

    探索Renesas DA1459x PRO开发套件:硬件设计与应用解析

    探索Renesas DA1459x PRO开发套件:硬件设计与应用解析 在当今的电子设计领域,开发套件的选择对于项目的成功至关重要。Renesas的DA1459x PRO
    的头像 发表于 12-29 11:30 931次阅读

    DA14535 USB开发套件硬件解析:开启低功耗蓝牙开发新征程

    USB开发套件(型号610 - 12 - A),为开发者提供了一个低成本且功能丰富的开发平台,助力蓝牙相关项目的快速落地。今天,我们就来深入剖析这个
    的头像 发表于 12-29 11:00 1427次阅读

    Firefly 推出基于 RK1820 / RK1828 的开发套件与 AI NVR 服务器

    RK1820/RK1828是瑞芯微面向AI时代推出的算力协处理器,采用先进的3D堆叠封装技术,集成高带宽嵌入式片内DRAM(2.5GB/5GB版本),生成速率超100tokens/
    的头像 发表于 11-05 18:52 6530次阅读
    <b class='flag-5'>Firefly</b> 推出基于 <b class='flag-5'>RK</b>1820 / <b class='flag-5'>RK</b>1828 的<b class='flag-5'>开发套件</b>与 AI NVR 服务器