0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

摄像头系统的"第二层":当视频 AI 不再只读单帧

jf_84330549 来源:jf_84330549 作者:jf_84330549 2026-05-19 16:08 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

▌ 引言

嵌入式IoT 工程师来说,摄像头接入 AI 的路径已经相当成熟:IPC 输出 RTSP 流,边缘盒子跑推理,检测结果上传云端或触发本地动作。YOLOv8 轻量化版本在 RK3588、昇腾 310 等芯片上的部署,已经有大量工程实践可以参考。
但在部署层之上,有一个问题逐渐变得突出:推理结果的"颗粒度"与实际应用需求之间存在错配。
模型识别出"一个人在用手机"——这是感知结果。但业务系统需要的是"这名员工在岗位上持续使用手机超过 X 分钟"——这是判断结论。本文从硬件感知到系统逻辑,梳理这一层的设计思路。

▌ 一、感知层现状:端侧推理已相当成熟

硬件侧:
• 边缘 AI 芯片:瑞芯微 RK3588、海思 Hi3516/Hi3519、地平线 J5/J6、昇腾 310B 等
• 典型算力:1 ~ 10 TOPS INT8,满足 1080P 视频实时检测需求
• 接入方式:RTSP/RTMP 拉流,GigE 有线或 WiFi 无线,POE 供电

软件侧:
• 推理框架:RKNN、MNN、OpenVINO、TensorRT(按芯片选择)
• 检测模型:YOLOv8/v9 轻量化版本,端侧部署帧率一般在 15 ~ 30 FPS
• 跟踪算法:ByteTrack、OC-SORT,用于目标 ID 持久化

这一层能稳定输出:目标框、类别标签、置信度、目标 ID(跟踪情况下)。但这些输出是逐帧结构化数据,缺乏时序上下文。

▌ 二、中间层缺失:从特征流到事件结论的鸿沟

设想一个具体场景:需要判断后厨员工是否在处理食材前完整执行了洗手流程。
流程定义为:
1. 员工接触原材料(摄像头 A 覆盖区域)
2. 员工移动至洗手台(摄像头 B 覆盖区域)
3. 洗手动作持续时间 ≥ 20 秒
4. 员工返回操作台(摄像头 A)

如果只依赖端侧推理输出,系统接收到的是:

如果只依赖端侧推理输出,系统接收到的是:
t=00:01:23 cam_A person_07 action: touching_ingredients conf=0.91
t=00:01:47 cam_B person_? action: handwashing conf=0.83
t=00:02:09 cam_A person_07 action: food_prep conf=0.88

要从这三条离散记录中判断"洗手流程合规",系统需要解决:
• cam_B 中的 person_? 是否与 cam_A 的 person_07 是同一个人?(跨摄像头 ReID)
• 洗手动作是否持续了足够时长?(时序状态持久化)
• 整个流程的时间间隔是否在合理范围内?(序列时间约束)
这些处理,全部发生在感知层之上、应用层之下的中间层,而这一层目前在很多系统设计中处于空白状态。

▌ 三、中间层的关键技术模块

1. 目标 ReID(跨摄像头重识别)

原理上是基于外观特征向量(ResNet/ViT 提取)的相似度匹配,但实际工程中需要应对:
• 光线差异(不同区域摄像头的曝光条件不同)
• 服装相似(同一品牌制服的员工高度相似)
• 遮挡与角度变化
工程上通常结合空间拓扑约束来降低误匹配率:只有摄像头网络中空间相邻的点位,才对目标 ReID 进行匹配尝试。

2.行为状态机

用于对单一目标的跨帧行为状态进行管理,典型设计如下:
IDLE ──[首次检测到目标行为]──> TRIGGERED
TRIGGERED ──[持续N帧确认]──> CONFIRMED
TRIGGERED ──[行为消失]──> IDLE
CONFIRMED ──[超过时长阈值]──> EVENT_GENERATED
CONFIRMED ──[行为消失]──> IDLE(不生成事件)

3.序列流程验证器

本质上是一个带时间约束的有限状态自动机(FSA):
• 定义动作节点序列:[A, B, C]
• 为相邻节点间定义时间窗口约束:A→B ≤ 30s,B→C ≤ 120s
• 状态在收到对应事件信号时迁移,超时则回到初始状态或标记为流程中断
3.4 规则配置层
业务规则以结构化配置描述,而非硬编码,规则变更只需修改配置文件,无需重新训练或部署模型。

▌ 四、端侧 vs 边缘服务器的分工建议

处理模块 推荐部署位置 原因
目标检测 + 跟踪 端侧 AI 芯片 计算密集,本地处理降低带宽
行为分类 端侧 AI 芯片 对延迟敏感,本地处理更快
跨摄像头 ReID 边缘服务器 需要多摄像头数据汇聚
状态机 + 规则引擎 边缘服务器 计算量小,但需要状态持久化
事件存储 + 审计 云端 持久化存储,支持历史查询

▌ 五、开发者注意事项

时钟同步: 多摄像头跨帧分析的基础是时间戳可信。边缘设备需要接入 NTP 同步,时钟偏差控制在 100ms 以内,否则跨摄像头的时序逻辑会出现系统性误差。
帧采样策略: 不需要对每帧都运行全量推理。对于持续性行为判断,1 ~ 5 FPS 的关键帧采样通常足够,结合运动检测进行自适应采样可进一步降低计算开销。
特征流格式标准化: 中间层输入的特征流格式要尽早标准化(推荐 Protobuf 或 JSON Schema),这是规则引擎与感知层解耦的基础。
状态持久化: 边缘服务器需要对目标状态进行持久化(SQLite 或 Redis),避免因重启丢失跨时段的行为状态记录。

▌ 小结

视频 AI 系统从"端侧推理"到"事件判定",需要在感知层之上构建一个完整的中间分析层,核心模块包括:跨摄像头 ReID、行为状态机、序列流程验证器和规则配置引擎。
这一层的工程挑战主要集中在跨摄像头目标关联的准确性、实时系统的延迟控制和规则描述的表达能力上。

感兴趣的朋友欢迎在评论区讨论相关的工程实践经验。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 摄像头
    +关注

    关注

    61

    文章

    5136

    浏览量

    103679
  • AI
    AI
    +关注

    关注

    91

    文章

    42239

    浏览量

    303269
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI军备竞赛下的SD NAND 存储选型重构:4GB-32GB eMMC成为"战略稀缺资源"

    导致驱动适配问题 • 替代验证周期长:BGA封装换料需重新走4-6板设计、焊接工艺验证 时间成本被严重低估:在传统思维下,一个存储器件的替代验证周期往往占据项目总周期的30%-40%。在AI产品迭代周期以"周&
    的头像 发表于 05-20 17:03 47次阅读
    <b class='flag-5'>AI</b>军备竞赛下的SD NAND 存储选型重构:<b class='flag-5'>当</b>4GB-32GB eMMC成为&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;战略稀缺资源&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    亚马逊正在公司内部大规模部署其自研AI产品&amp;quot;MeshClaw&amp;quot;

    提升工作效率的工具,却被部分员工玩出了&quot;新花样&quot;——他们利用MeshClaw把一些本无必要的工作也实现了自动化,目的只有一个:让自己的AI词元(token)消耗量看起来更高,从而向管理
    的头像 发表于 05-15 10:25 2425次阅读

    IBM发布&amp;quot;AI运营模式&amp;quot;蓝图

    近期,在年度Think大会上,IBM正式发布了迄今为止其企业级AI和混合云管理能力的最全面扩展,重磅推出&quot;AI运营模式&quot;(AI
    的头像 发表于 05-12 09:50 667次阅读

    ESP32-S3在初始化摄像头时检测到摄像头模组型号不被支持

    为OV2640/OV5640(最省心),或自行移植对应型号的驱动(新手不推荐)。 2. 第二步:检查ESP32-S3与摄像头的硬件接线(必查) ESP32-S3的摄像头引脚和普通ESP32
    发表于 02-11 06:38

    从&amp;amp;quot;替代人力&amp;amp;quot;到&amp;amp;quot;智能协同&amp;amp;quot;:履带式巡检机器人的产业跃迁

    2026年的工业智能化转型浪潮中,一个显著的趋势正在形成——工业巡检机器人正从单纯的&quot;人力替代工具&quot;升级为具备感知、决策与协同能力的&quot;智能体&quot;。
    的头像 发表于 02-05 10:42 540次阅读

    L3试点落地,和芯星通如何成为车企突围的&amp;amp;quot;隐形守护者&amp;amp;quot;?

    长安汽车与北汽极狐拿到中国首批L3级自动驾驶准入许可的那一刻,整个产业链等待多年的&quot;靴子&quot;终于落地。在这个责任主体从驾驶员转向车企的关键转折下,系统可靠性成为真正
    的头像 发表于 01-04 12:03 875次阅读
    L3试点落地,和芯星通如何成为车企突围的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;隐形守护者&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;?

    视频安全监测系统,从&amp;quot;看见&amp;quot;到&amp;quot;看懂&amp;quot;

    在数字视觉技术飞速发展的今天, 视频安全监测系统 正在重新定义安全防护的边界。这套系统通过赋予摄像头思考能力,让安全防护从被动记录迈向主动预警,构筑起一道智能化的视觉防线。 从"看见"
    的头像 发表于 11-14 11:06 548次阅读
    <b class='flag-5'>视频</b>安全监测<b class='flag-5'>系统</b>,从&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;看见&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;到&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;看懂&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    为什么变频器一开,监控画面就&amp;amp;quot;雪花&amp;amp;quot;?

    当你的工厂监控画面总是&quot;雪花&quot;闪烁,变频器一启动就跳线,你是不是以为是摄像头老化了?其实,90%的这类问题都是变频器谐波在作怪!这不是摄像头的错,而是变频器输出的高
    的头像 发表于 09-23 14:17 829次阅读
    为什么变频器一开,监控画面就&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;雪花&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;?

    让每一颗&amp;amp;quot;眼睛&amp;amp;quot;都可靠:车载摄像头密封测试解决方案

    随着智能汽车时代的到来,车载摄像头作为汽车的“眼睛”,其密封性能直接关系到ADAS系统和自动驾驶功能的可靠性。在雨水、盐雾、高低温等恶劣环境下,如何确保这些精密元件长期稳定工作?气密性检测提供了关键技术保障。
    的头像 发表于 09-09 09:12 1416次阅读
    让每一颗&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;眼睛&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;都可靠:车载<b class='flag-5'>摄像头</b>密封测试解决方案

    智慧路灯的&amp;amp;quot;智慧&amp;amp;quot;从何而来?一文读懂灯控制器工作原理

    夜幕低垂,当你走在灯火通明的城市街道上,是否曾想过:这些路灯是如何实现智能化管理的?为什么有些路段在人车稀少时会自动调暗?故障又是如何被第一时间发现的?这一切的奥秘,都藏在那个不起眼的&quot;
    的头像 发表于 08-29 20:08 989次阅读
    智慧路灯的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;智慧&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;从何而来?一文读懂<b class='flag-5'>单</b>灯控制器工作原理

    FTTR-B主网关二层透传配置过程

    二层透传(Layer 2 Transparent Transmission)指在数据链路层(OSI第二层)上,数据在传输过程中保持原始的二层信息(如MAC地址、VLAN标签等)不变,
    的头像 发表于 08-20 10:23 1875次阅读
    FTTR-B主网关<b class='flag-5'>二层</b>透传配置过程

    【HZ-RK3568开发板免费体验】基于USB摄像头拍照

    [20] =\&quot;rk_picture\&quot;; int num = 0; /** * @brief打开摄像头设备函数 * @paramNone * @retval fd
    发表于 08-19 22:07

    精密设备的&amp;amp;quot;电力保镖&amp;amp;quot;:优比施UPS如何守护数据与硬件安全?

    未保存数据丢失,次故障损失可达数十万美元(如金融交易系统)。硬件损耗加速:电压波动或瞬间断电会产生浪涌电流,缩短服务器、医疗设备等精密硬件寿命。程序中断风险:工业控制系统断电可能导致生产线停机,甚至引
    的头像 发表于 07-25 09:00 1270次阅读
    精密设备的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;电力保镖&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;:优比施UPS如何守护数据与硬件安全?

    为什么GNSS/INS组合被誉为导航界的&amp;amp;quot;黄金搭档&amp;amp;quot;?

    解决方案。而ER-GNSS/MINS-05低成本组合导航系统的出现,更是让这一&quot;黄金组合&quot;走进了更广泛的应用场景,让高性能导航不再昂贵。
    的头像 发表于 07-09 17:12 1298次阅读
    为什么GNSS/INS组合被誉为导航界的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;黄金搭档&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;?

    usb摄像头输入的图像,哪种格式才能让yolo正常检测?

    MediaManager.init() 检测摄像头 while True: plugin, dev = UVC.probe() if plugin: print(f&amp;quot;检测到USB
    发表于 06-13 07:55