0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

研究人员最近开发了一种新的CNN,用于识别视频中的人类行为

倩倩 来源:百度粉丝网 2020-09-10 13:48 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

诸如卷积神经网络(CNN)之类的深度学习算法已在各种任务上取得了显著成果,包括那些涉及识别图像中特定人物或物体的任务。基于视觉的人类动作识别(HAR)是计算机科学家经常尝试使用深度学习解决的任务,它特别需要识别图像或视频中捕获的人类动作。

HITEC大学和巴基斯坦伊斯兰堡基础大学,韩国世宗大学和中正大学,英国莱斯特大学和沙特阿拉伯苏丹王子大学的研究人员最近开发了一种新的CNN,用于识别视频中的人类行为。该CNN在Springer Link的“多媒体工具和应用程序”期刊上发表的一篇论文中进行了介绍,经过培训可以区分几种不同的人类动作,包括拳击,拍手,挥舞,慢跑,跑步和散步。

研究人员在论文中写道:“我们设计了一种新的26层卷积神经网络(CNN)架构,用于精确的复杂动作识别。” “这些特征是从全局平均池化层和完全连接(FC)层中提取的,并通过建议的基于高熵的方法进行融合。”

当试图识别人类在图像或视频中的动作时,CNN通常会将其分析重点放在许多潜在的相关特征上。但是,某些人类动作(例如慢跑和步行)可能非常相似,这使得这些算法很难区分它们,特别是如果它们专注于相似性核心的特征时。为了克服这一挑战,研究人员使用了一种方法,该方法将称为Poisson分布的特征选择方法与单变量测量(PDaUM)合并在一起。

研究人员观察到,CNN所基于的分析功能有时可能不相关或多余,这导致它们做出错误的预测。为了降低发生这种情况的风险,他们的PDaUM方法仅选择最强大的功能来识别特定的人类行为,并确保CNN基于这些功能做出最终预测。

研究人员在HMDB51,UFC Sports,KH和Weizmann数据集这四个数据集上训练和评估了两个截然不同的CNN,一个极端机器学习(EML)和一个Softmax分类器。这些数据集包含几个人类执行不同类型动作的视频。

然后,研究人员比较了两个CNN的性能,这两个CNN均使用其特征选择方法进行了增强。在他们的评估中,ELM分类器的性能明显优于Softmax算法,可以从视频中识别出人类动作,其在HMDB51数据集上的准确性为81.4%,在UCF Sports数据集上的准确性为99.2%,在KTH数据集上的准确性为98.3%,在KTH数据集上的准确性为98.7%。魏茨曼数据集。

值得注意的是,PDaUM增强的ELM分类器在准确性和预测时间方面也优于研究人员将其与之相比的所有现有深度学习技术。因此,这些结果凸显了研究人员介绍的特征选择方法在提高CNN在HAR任务上的性能方面的潜力。

将来,本文介绍的ELM分类器和PDaUM方法可以开发更有效的工具,以自动区分人类在录制和实况录像中正在做什么。这些工具可以通过几种不同的方式证明其价值,例如,帮助执法人员监视CCTV视频上嫌疑犯的行为,或者允许研究人员快速分析大量视频。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4842

    浏览量

    108178
  • 深度学习
    +关注

    关注

    73

    文章

    5608

    浏览量

    124635
  • cnn
    cnn
    +关注

    关注

    3

    文章

    356

    浏览量

    23547
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    基于米尔MYC-LR3576开发板的实时视频识别系统设计与实现

    基于米尔MYC-LR3576开发板的实时视频识别系统设计与实现 摘要本文基于米尔电子MYC-LR3576开发板(搭载瑞芯微RK3576处理器)的硬件平台与Debian 12操作系统,
    发表于 12-01 21:23

    研究人员复兴针孔相机技术以推动下代红外成像发展

    研究人员运用具有数百年历史的针孔成像原理,开发一种无需透镜的高性能红外成像系统。这种新型相机能够在大范围距离内和弱光条件下拍摄极其清晰的照片,使其在传统相机难以应对的场景中发挥重要
    的头像 发表于 11-17 07:40 358次阅读

    构建CNN网络模型并优化的般化建议

    :Dropout层随机跳过神经网络模型某些神经元之间的连接,通过随机制造缺陷进行训练提升整个神经网络的鲁棒性。 6)指定合理的学习率策略:旦神经网络的准确率饱和,那么学习率应当适当的减少,使得模型跳出局部最优解,并提升模型识别
    发表于 10-28 08:02

    利用 Banana Pi BPI-CM5 Pro(ARMSoM CM5 SoM) 加速保护科学

    政府、大学和非政府组织的研究人员。通过使用开源计算硬件,实时声学监测的构建成本可以低于使用专用微控制器的系统。 实施过程 为了展示开源硬件在生物声学边缘处理方面的优势,我们需要个演示浮标。我们专注于开发
    发表于 10-27 09:18

    大小鼠糖水偏好实验系统

    基因操作对动物行为的影响,或者用于研究奖赏系统和成瘾行为。大小鼠糖水实验系统套装为研究人员提供了
    发表于 08-14 13:40

    AI视频识别系统的应用领域

    、城市治理现代化 AI视频识别技术 正深度重构城市管理体系。在城市安防领域,系统通过行为模式分析实现异常事件主动预警,对人员聚集、异常滞留
    的头像 发表于 07-24 11:06 1390次阅读

    【高云GW5AT-LV60 开发套件试用体验】基于开发板进行深度学习实践,并尽量实现皮肤病理图片的识别,第四阶段

    的原始视频数据。 处理: 在FPGA上实现的CNN加速器对视频流进行实时处理。例如: 目标检测: 识别视频
    发表于 07-12 07:58

    无刷直流电机双闭环串级控制系统仿真研究

    Madlab进行BLDC建模仿真的方法,并且也提出了很多的建模仿真方案。例如有研究人员提出采用节点电流法对电机控制系统进行分析,通过列写m函数,建立BLDC控制系统真模型,这种方法实质上是一种整体建模
    发表于 07-07 18:36

    无人机AI视觉行为识别系统

    的需求。同时,人工监控存在效率低下、易疲劳、反应滞后等问题,无法应对日益复杂的安全管理挑战。 在这背景下,陕西广合通结合无人机机动性与人工智能分析能力的视觉行为识别系统为基础研发了
    的头像 发表于 07-04 16:53 1207次阅读

    【高云GW5AT-LV60 开发套件试用体验】基于开发板进行深度学习实践,并尽量实现皮肤病理图片的识别

    Equalization,对比度受限自适应直方图均衡化)是一种改进的直方图均衡化算法,主要用于增强图像的局部对比度,同时避免传统直方图均衡化可能导致的过度增强和噪声放大问题。当然还是AHE比较简单
    发表于 06-11 22:35

    明远智睿SSD2351开发板:视频监控领域的卓越之选

    服务器。在监控中心,工作人员可以通过监控软件对视频画面进行实时查看、回放和分析,及时发现异常情况并采取相应措施。此外,开发板还可以结合人工智能算法,实现视频内容的智能分析,如人脸
    发表于 05-30 10:24

    工地AI行为识别系统作用

    工地AI行为识别系统作用 工地AI行为识别系统是什么? 工地AI行为识别系统是
    的头像 发表于 05-08 12:00 1092次阅读

    基于RK3576开发的人员检测算法

    展示了RK3576开发的人员检测算法例程及API说明
    的头像 发表于 05-07 17:33 1025次阅读
    基于RK3576<b class='flag-5'>开发</b>板<b class='flag-5'>的人员</b>检测算法

    景区AI行为识别系统作用

    景区AI行为识别系统作用 景区AI行为识别系统是什么? 景区AI行为识别系统是利用人工智能技术(
    的头像 发表于 05-07 15:32 1189次阅读
    景区AI<b class='flag-5'>行为</b><b class='flag-5'>识别</b>系统作用

    工厂园区AI行为识别系统作用

    工厂园区AI行为识别系统作用 工厂园区AI行为识别系统是什么? 工厂园区AI行为识别系统是基于人
    的头像 发表于 05-06 17:49 1004次阅读