0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

深兰科技DeepBlueAI团队斩获低分辨率视频行为识别挑战赛的冠军

深兰科技 来源:DeepBlue深兰科技 作者:DeepBlue深兰科技 2021-06-30 10:19 次阅读

导读近日,全球三大计算机视觉顶级会议之一CVPR如期举行,深兰科技DeepBlueAI团队斩获TinyAction Challenge(低分辨率视频行为识别挑战赛)的冠军。

TinyAction Challenge是第六届动作识别国际挑战赛系列竞赛之一,该系列竞赛由CVPR2021 International Challenge on Activity Recognition (ActivityNet) workshop 主办,旨在推动视频理解的进一步发展。

冠军方案解读

赛题介绍

TinyAction Challenge使用TinyVirat-v2[1]数据集,旨在提高低分辨率高噪声等真实监控场景下的视频行为识别能力。比赛提供大量真实场景视频片段及标注,每个视频片段中可能含有多个动作,本质是一个多标签的行为识别任务,比赛结果采用precision、recall、F1-score等多个指标来评测。

赛题难点

视频分辨率很低,最小只有10x10像素尺度;

视频尺度多样,从10x10到128x128不等;

视频质量较差,含有大量噪声;

视频场景多样,行为多样,每个视频可能含有多个行为。

解决方案

算法选择上,团队广泛尝试了TSM[2]、TPN-Slowonly[3]等经典算法,最终采用交互移除的CSN[4](ir-CSN)模型,在保证性能的前提下适当减少计算量,同时减轻对数据的过拟合。

数据增强方面,训练时团队首先随机调整尺度裁剪,再统一调整尺度到128x128,最后再随机翻转。而在测试时,通过Tencrop,即对视频帧及其水平翻转在中心与四角区域分别裁剪求平均,有效提高了inference时单模型性能。

测试阶段团队进一步使用了五折交叉验证的模型融合方法。另外由于观察到在比赛数据集的26类行为中有些类别是互斥的,因而对最终的结果添加了后处理规则,使得F1指标进一步提高0.6个点。通过一步步优化,DeepBlueAI团队单模型的F1指标即超过了第二名达到0.4447,并最终达到0.4782,实现大幅度领先。

总结

在本次比赛中,团队对任务及数据做了仔细的分析,合理地选择了模型算法,进行了精细的模型训练,同时在数据的后处理上做了大量的优化,有效实现了低分辨率高噪声视频中行为识别,并最终获得冠军。相信随着计算机视觉及多模态技术的深入发展,行为识别等视频理解问题能够得到更好的解决,并获得越来越广泛的实际应用。

参考文献:

[1] Demir U, Rawat Y S, Shah M. TinyVIRAT: low-resolution video action recognition[C]//2020 25th International Conference on Pattern Recognition (ICPR)。 IEEE, 2021: 7387-7394

[2] Yang C, Xu Y, Shi J, et al. Temporal pyramid network for action recognition[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020: 591-600.

[3] Lin J, Gan C, Han S. TSM: Temporal Shift Module for Efficient Video Understanding[C]// 2019 IEEE/CVF International Conference on Computer Vision (ICCV)。 IEEE, 2019.

[4] Du T, Wang H, Feiszli M, et al. Video Classification With Channel-Separated Convolutional Networks[C]// International Conference on Computer Vision. 0.

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机视觉
    +关注

    关注

    8

    文章

    1601

    浏览量

    45639
  • 高噪声率
    +关注

    关注

    0

    文章

    2

    浏览量

    5980
  • 数据集
    +关注

    关注

    4

    文章

    1179

    浏览量

    24364
  • CSN
    CSN
    +关注

    关注

    0

    文章

    2

    浏览量

    8750
  • 深兰科技
    +关注

    关注

    1

    文章

    50

    浏览量

    5841

原文标题:赛道 | CVPR2021深兰冠军方案解读- TinyAction Challenge低分辨率视频行为识别挑战赛

文章出处:【微信号:kmdian,微信公众号:深兰科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于CNN的图像超分辨率示例

    考虑单个低分辨率图像,首先使用双三次插值将其放大到所需的大小,这是执行的唯一预处理。将插值图像表示为Y。我们的目标是从Y中恢复与真实高分辨率图像X尽可能相似的图像F (Y) 。
    的头像 发表于 03-11 11:40 298次阅读
    基于CNN的图像超<b class='flag-5'>分辨率</b>示例

    EVAL_PASCO2_SENSOR为什么无法从较低的分辨率高速获得更高的分辨率

    捕获,同时高速传输较低分辨率(640x480,1280x720,1920x1080)时,静止请求被触发,它正在从一种分辨率转移到另一种分辨率,但无法进行静态捕获。 我在调试时观察到了以下几点: 1
    发表于 02-22 07:58

    峰峰值分辨率与有效分辨率的区别

    低带宽、高分辨率ADC的分辨率为16位或24位。但是,器件的有效位数受噪声限制,而噪声则取决于输出字速率和所用的增益设置。有些公司规定使用有效分辨率来表示该参数,ADI则规定使用峰峰值分辨率
    发表于 12-15 07:56

    深兰科技连续第4年通过SGS的4体系审核

    近日,国际权威第三方认证机构SGS,对深兰科技进行了“ISO 27001信息安全管理体系”的换证审核,经过SGS派遣的外审员为期数天的严格审核,深兰科技成功过审。 SGS对信息安全管理体系的审核
    的头像 发表于 12-14 09:28 400次阅读

    HDBaseT传输器支持传输4K30及以下分辨率吗?

    传输器广泛应用于家庭娱乐系统、商业展示、会议室等场景。 在传输视频信号方面,HDBaseT传输器支持多种分辨率,包括但不限于4K30及以下分辨率。这意味着它可以传输4K分辨率
    的头像 发表于 12-07 09:07 238次阅读

    SAFA:高效时空视频分辨率的尺度自适应特征聚合

    的问题,考虑把插帧做到特征图上,即 低分辨率帧 -> 编码成特征 -> 特征图上插帧 -> 解码得到高分辨率帧。
    的头像 发表于 11-29 16:31 311次阅读
    SAFA:高效时空<b class='flag-5'>视频</b>超<b class='flag-5'>分辨率</b>的尺度自适应特征聚合

    峰值噪声与有效噪声的区别?峰值分辨率与有效分辨率的区别?

    峰值噪声与有效噪声的区别,峰值分辨率与有效分辨率的区别?无失码分辨率又是指的什么?
    发表于 11-27 11:42

    请问AD5522的分辨率如何提高?

    AD5522的输出电压跨度在22.5V左右,对应16bit的DAC的分辨率约22.5V/65536=343uV。 如果我想提高到170uV左右的分辨率,但是又要保持输出电压跨度22.5V不变需要用
    发表于 11-15 08:20

    怎么调整andriod输出分辨率,适配分辨率大的屏?

    求教,怎么调整andriod输出分辨率,适配分辨率大的屏
    发表于 11-06 07:13

    深兰科斩获“上海设计100+”和“设享奖EDW”大奖

    国庆前夕,“上海设计100+”和“设享奖EDW”两项产品设计大奖的获奖榜单先后揭晓,深兰科技出品的计算机视觉工业检测标准化设备-剑齿虎在两项大奖的评选中皆获大奖。
    的头像 发表于 10-12 16:03 480次阅读

    深兰科技与西班牙BOMAPA集团签署AI工业解决方案合作协议

    近日,深兰科技集团与西班牙BOMAPA SERVICES SL.集团在深兰科技上海总部大厦正式签署AI工业解决方案合作协议。
    的头像 发表于 09-14 17:50 859次阅读

    直接飞行时间(DToF)视频的深度一致超分辨率重建

    本文提出从两个方面解决dToF数据的空间模糊:利用RGB-dToF视频序列中的多帧信息融合和dToF直方图信息。我们设计了dToF视频分辨网络DVSR,输入是高分辨率RGB图像序列和
    的头像 发表于 08-30 15:15 749次阅读
    直接飞行时间(DToF)<b class='flag-5'>视频</b>的深度一致超<b class='flag-5'>分辨率</b>重建

    深兰团队已连续5年在CVPR挑战赛斩获冠军

    ”的好成绩。自2019年起,深兰团队已经连续5年在CVPR挑战赛中有冠军斩获。 CVPR是计算机视觉领域的一个权威学术会议,由IEEE(In
    的头像 发表于 06-26 11:11 348次阅读

    如何使用gstreamer获得更高的分辨率

    我正在使用带有最新 Kirkstone yocto bsp 版本的 imx8mp,我的图像传感器支持 4056x3040 分辨率。 运行 gstreamer 时,我观察到任何高于 4K
    发表于 05-29 06:00