0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Firefly-RK1828 赋能视频大模型:多目标+全场景,引领智能分析新风向

Firefly开源团队 2026-04-15 16:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

如今,在视频分析领域,传统检测模型存在这一局限:单个模型只能聚焦单一目标检测,面对复杂场景中多样的检测需求时,往往需要多套模型叠加部署才能满足。这不仅增加开发成本,还会有响应延迟、兼容性不足等问题。

01221ea6-38a6-11f1-ab55-92fbcf53809c.png

针对这一问题,我们基于 Firefly RK1828 开发套件,搭载南京锐景专属视频分析算法,以视频大模型为核心,实现「多目标检测+全场景适配」,可自定义各种问题,适应多种非典型场景,通过自然语言描述,来定制大模型的检测目标。

视频大模型全目标检测

本次搭载的视频分析算法,是由南京锐景专为 RK1828 + RK3588 开发套件量身打造,视频大模型可以对视频流进行全方位解析,具备以下检测优势:


1. 突破单任务模型局限,支持全域检测

打破传统模型「一个模型只做一种检测」的局限,可以对视频流进行全方位智能解析,支持任意目标统一检测,无需针对不同目标部署多套模型,极大简化开发与部署流程。


2. 大分辨率图像单次检测耗时<1s

依托高效的模型架构与推理引擎,在保证高精度的同时实现极速检测。大分辨率图像单次推理耗时控制在1秒以内,满足实时视频流、快速预警等对延迟敏感的场景需求,为安防与监测业务争取黄金处置时间。


3. 自然语言交互,零代码配置检测任务

支持通过自然语言描述设置检测任务,无需修改模型、编写代码或重新训练,即可快速定义需要识别的对象与规则,大幅降低使用门槛,提升场景配置效率。


4.全品类识别,覆盖人、车、物及行为状态

可快速识别并精准判断场景中的人员、车辆、物体等常规目标,同时支持特定行为、异常状态等复杂事件检测,泛用性更强,适配多样化检测需求。


以下是场景检测演示

通过提问式指令设定检测目标,例如对大模型进行提问:图中是否有红色或绿色的车辆经过,如果有请回答1,否则回答0。如图为演示结果,大模型快速做出准确回答。

012f23da-38a6-11f1-ab55-92fbcf53809c.png


同时对大模型进行多个检测问题的提问:应急车道在哪里?是否有车辆占用了应急车道?如果有,有几辆,分别是什么颜色?如图为演示结果,大模型快速对多个检测问题做出准确的回答。

01384d3e-38a6-11f1-ab55-92fbcf53809c.png


物品检测及坐标获取演示,对大模型进行提问:图中是否有公路上的障碍物?如有请给出对应的二维坐标。如图为演示结果,大模型准确识别出图中障碍物类型并标注对应坐标。

014096ba-38a6-11f1-ab55-92fbcf53809c.png014a7342-38a6-11f1-ab55-92fbcf53809c.png



大模型驱动缺陷检测

大模型支持对工业与安防场景中的缺陷目标进行直接检测,无需依赖传统图像预处理或复杂规则配置。图中所示,大模型快速检测出变色呼吸机并提供其对应坐标。

0151a748-38a6-11f1-ab55-92fbcf53809c.png01588d6a-38a6-11f1-ab55-92fbcf53809c.jpg



支持Prompt过滤自定义

支持Prompt过滤自定义,可在检测任务中追加检测条件,对初步检测结果进行二次过滤与精准提取。通过灵活的自然语言表达,精准筛选目标结果,减少误报,让缺陷检测更加灵活可控。

015f9178-38a6-11f1-ab55-92fbcf53809c.jpg01683850-38a6-11f1-ab55-92fbcf53809c.png

图中为针对能源、安防场景优化的缺陷检测设置



多路视频流接入

算法支持同时接入多路视频流,可实现多画面同步解析、并行检测,适用于工业厂房、校园、小区、车载环视等多摄像头覆盖场景,大幅提升视频监控的效率与覆盖面,让多区域监控实现一体化管理。

多算法叠加运行

支持多种视频分析算法叠加使用,可在全目标检测的基础上,叠加行为分析、异常预警、人数统计等附加算法。例如在工业场景中,可同时检测人员违规操作、设备异常运行、外来人员闯入等多种情况,满足复杂场景下的多元化需求。

0178c468-38a6-11f1-ab55-92fbcf53809c.png



智能报警功能

算法内置智能报警机制,当检测到设定的异常目标或行为时,可快速触发报警信号,同时留存检测证据,便于后续追溯与处理。当违规行为、危险场景或异常目标出现时第一时间发出提醒,提升场景安全管理水平。

017fedd8-38a6-11f1-ab55-92fbcf53809c.png



RK1828开发套件提供硬件支持

目前我们通过 Firefly-RK1828 开发套件完成了这套视频分析 Demo 搭建,以上提及的功能均可继进行现场演示。该套件凭借其高效算力和稳定的运行表现,对开发者和企业用户在项目开发、产品落地等方面都能提供全方位支持,加速视频分析应用场景的智能化进程。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Firefly
    +关注

    关注

    2

    文章

    549

    浏览量

    9156
  • RK3588
    +关注

    关注

    8

    文章

    585

    浏览量

    7540
  • 大模型
    +关注

    关注

    2

    文章

    3748

    浏览量

    5268
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    节省龙虾 40% Token 消耗!ClawChips 加持 Firefly-RK1828 端云协同

    随着AIAgent逐步走向实际业务场景,客户的关注点也在发生变化。相比单纯的模型能力展示,客户更关心的是:Agent能否真正落地到设备侧、场景侧和交互侧,并在成本、体验与适配性之间取得有效平衡?针对
    的头像 发表于 04-09 18:10 226次阅读
    节省龙虾 40% Token 消耗!ClawChips 加持 <b class='flag-5'>Firefly-RK1828</b> 端云协同

    Altair CFD 以技术工程创新?

    的端到端无缝衔接。具备自动网格划分、GPU加速、稳态时间行进等功能,其中几何模型准备效率较传统工具提升80%,稳态仿真可在少于100次迭代中快速收敛,大幅缩短仿真周期。4. AI+便捷交互,降低
    发表于 02-28 14:47

    模型物资需求精准预测与采购系统软件平台

        北京五木恒润大模型物资需求精准预测与采购平台系统软件,深度融合多源数据与智能算法,大幅提升需求预测准确性与采购决策科学性,成为企业优化供应链管理、降低运营成本的核心工具。以
    的头像 发表于 12-17 16:37 372次阅读

    模型物资需求精准预测与采购系统:功能特点与平台架构解析

        大模型物资需求预测与采购智能化:核心功能与价值解析    大模型
    的头像 发表于 12-16 11:54 448次阅读

    引领端侧大模型落地!Firefly-RK182X 开发套件上线发售

    。Rockchip全新高性能端侧大模型协处理器RK182X,以硬核技术突破瓶颈,重构端侧智能格局,引领端侧大模型落地。3D堆叠架构突破带宽瓶
    的头像 发表于 11-26 16:33 2655次阅读
    <b class='flag-5'>引领</b>端侧大<b class='flag-5'>模型</b>落地!<b class='flag-5'>Firefly-RK</b>182X 开发套件上线发售

    Firefly 推出基于 RK1820 / RK1828 的开发套件与 AI NVR 服务器

    RK1820/RK1828是瑞芯微面向AI时代推出的算力协处理器,采用先进的3D堆叠封装技术,集成高带宽嵌入式片内DRAM(2.5GB/5GB版本),端侧生成速率超100tokens/s,端到端延迟
    的头像 发表于 11-05 18:52 5875次阅读
    <b class='flag-5'>Firefly</b> 推出基于 <b class='flag-5'>RK</b>1820 / <b class='flag-5'>RK1828</b> 的开发套件与 AI NVR 服务器

    12 路低延迟推流!米尔 RK3576 智能安防 360° 环视

    接入,覆盖全场景点位开发板搭载瑞芯微 RK3576 芯片,原生提供 3 组 4-lane MIPI-CSI 接口,配合米尔专属 MY-CAM004M 视频转换模块,可直接接入 12 路
    发表于 09-18 17:51

    单板挑战4路YOLOv8!米尔瑞芯微RK3576开发板性能实测

    ,-pos来演示。米尔基于RK3576开发板 单独测试视频场景1.YOLOv8s.int 目标检测模型 2.YOLOv8s-seg.int
    发表于 09-12 17:52

    明远智睿RK3506:场景智能硬件的核心芯片

    主频以及出色的视频解码能力,迅速成为智能摄像头、视频监控、门禁系统、智能音箱等领域的 “新宠儿”,为多场景
    的头像 发表于 09-05 17:48 1414次阅读

    RK3576无人机巡检:多路视频+AI识别引领智能化变革

    ,采用RK3576平台的无人机不仅能发现问题,还能在空中调用云端模型进行方案比对,并将处置建议直接回传到调度中心。这种从“看见”到“分析”再到“决策”的闭环,将让巡检工作更高效、更安全。 想了解更多
    发表于 08-20 17:26

    12路1080P高清视频流,米尔RK3576 开发板车载360环视

    ,RTSP传输,再到解码播放延迟在120~150ms。对比两个过程各单元占用情况 三、广泛的应用场景工业安防下12路摄像头对于RK3576只算是热身,别忘了它还有6TOPS的NPU没发挥,它也
    发表于 08-14 14:01

    基于RK3576开发板的yolov11-track多目标跟踪部署教程

    1.yolov11_track简介(多目标跟踪算法)YOLO11是UltralyticsYOLO系列实时物体检测器的最新版本,重新定义了在尖端准确度、速度和效率方面的可能性。在前几代YOLO版本
    的头像 发表于 07-25 15:21 2141次阅读
    基于<b class='flag-5'>RK</b>3576开发板的yolov11-track<b class='flag-5'>多目标</b>跟踪部署教程

    中软国际推出全场景AI-R1系列产品

    近日,中软国际与华为云“同舟共济”战略合作8周年庆典暨“云智能行业全场景AI正当时”高峰论坛隆重举行。会上,中软国际正式发布全场景AI
    的头像 发表于 07-18 17:18 1632次阅读

    科士达亮相ASEW 2025,全场景光储解决方案泰国绿色转型

    全面展示其推动能源结构升级的核心技术实力,并深度泰国清洁能源转型进程。针对泰国蓬勃发展的光伏与储需求,科士达此次展出的解决方案精准覆盖多类应用场景。在户用领域
    的头像 发表于 07-07 15:55 1034次阅读
    科士达亮相ASEW 2025,<b class='flag-5'>全场景</b>光储解决方案<b class='flag-5'>赋</b><b class='flag-5'>能</b>泰国绿色转型

    宇视科技梧桐大模型交通治理

    迭代已实现多场景任务覆盖。近期推出的“梧桐”大模型事件检测和交通抓拍系列产品,将AI能力深度落地于交通治理场景,在算法精度、成像质量和分析性能等方面实现显著提升,
    的头像 发表于 05-16 17:23 1227次阅读