导读近日,全球三大计算机视觉顶级会议之一CVPR如期举行,深兰科技DeepBlueAI团队斩获TinyAction Challenge(低分辨率视频行为识别挑战赛)的冠军。
TinyAction Challenge是第六届动作识别国际挑战赛系列竞赛之一,该系列竞赛由CVPR2021 International Challenge on Activity Recognition (ActivityNet) workshop 主办,旨在推动视频理解的进一步发展。
冠军方案解读
赛题介绍
TinyAction Challenge使用TinyVirat-v2[1]数据集,旨在提高低分辨率高噪声等真实监控场景下的视频行为识别能力。比赛提供大量真实场景视频片段及标注,每个视频片段中可能含有多个动作,本质是一个多标签的行为识别任务,比赛结果采用precision、recall、F1-score等多个指标来评测。
赛题难点
视频分辨率很低,最小只有10x10像素尺度;
视频尺度多样,从10x10到128x128不等;
视频质量较差,含有大量噪声;
视频场景多样,行为多样,每个视频可能含有多个行为。
解决方案
在算法选择上,团队广泛尝试了TSM[2]、TPN-Slowonly[3]等经典算法,最终采用交互移除的CSN[4](ir-CSN)模型,在保证性能的前提下适当减少计算量,同时减轻对数据的过拟合。
数据增强方面,训练时团队首先随机调整尺度裁剪,再统一调整尺度到128x128,最后再随机翻转。而在测试时,通过Tencrop,即对视频帧及其水平翻转在中心与四角区域分别裁剪求平均,有效提高了inference时单模型性能。
测试阶段团队进一步使用了五折交叉验证的模型融合方法。另外由于观察到在比赛数据集的26类行为中有些类别是互斥的,因而对最终的结果添加了后处理规则,使得F1指标进一步提高0.6个点。通过一步步优化,DeepBlueAI团队单模型的F1指标即超过了第二名达到0.4447,并最终达到0.4782,实现大幅度领先。
总结
在本次比赛中,团队对任务及数据做了仔细的分析,合理地选择了模型算法,进行了精细的模型训练,同时在数据的后处理上做了大量的优化,有效实现了低分辨率高噪声视频中行为识别,并最终获得冠军。相信随着计算机视觉及多模态技术的深入发展,行为识别等视频理解问题能够得到更好的解决,并获得越来越广泛的实际应用。
参考文献:
[1] Demir U, Rawat Y S, Shah M. TinyVIRAT: low-resolution video action recognition[C]//2020 25th International Conference on Pattern Recognition (ICPR)。 IEEE, 2021: 7387-7394
[2] Yang C, Xu Y, Shi J, et al. Temporal pyramid network for action recognition[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020: 591-600.
[3] Lin J, Gan C, Han S. TSM: Temporal Shift Module for Efficient Video Understanding[C]// 2019 IEEE/CVF International Conference on Computer Vision (ICCV)。 IEEE, 2019.
[4] Du T, Wang H, Feiszli M, et al. Video Classification With Channel-Separated Convolutional Networks[C]// International Conference on Computer Vision. 0.
编辑:jq
-
计算机视觉
+关注
关注
9文章
1716浏览量
47787 -
高噪声率
+关注
关注
0文章
2浏览量
6089 -
数据集
+关注
关注
4文章
1242浏览量
26317 -
CSN
+关注
关注
0文章
2浏览量
9035 -
深兰科技
+关注
关注
1文章
116浏览量
6711
原文标题:赛道 | CVPR2021深兰冠军方案解读- TinyAction Challenge低分辨率视频行为识别挑战赛
文章出处:【微信号:kmdian,微信公众号:深兰科技】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
神州鲲泰斩获魔乐社区龙虾挑战赛一等奖
北京人形具身天工3.0斩获全球首个全自主机器人勇士挑战赛冠军
思必驰斩获Interspeech 2026音频推理挑战赛智能体赛道亚军
摩尔线程在SIGGRAPH Asia 2025斩获3DGS重建挑战赛银奖
第三届ICPC与华为挑战赛冠军杯圆满结束
电能质量在线监测装置的暂态记录分辨率如何影响故障类型识别?
廊坊市政府领导莅临深兰科技调研考察
传音TEX AI团队斩获ICCV 2025大型视频目标分割挑战赛双料亚军
山东大学与济南市科技局领导莅临深兰科技调研考察
深兰科技发布AI法务大模型产品
分辨率对于模拟到数字转换器有什么重要性
如何构建带有VGA输出的低分辨率热成像
传音多媒体团队揽获CVPR NTIRE 2025两项挑战赛冠亚军,推动视频画质升级
传音多媒体团队揽获CVPR NTIRE 2025两项挑战赛冠亚军
分辨率 vs 噪声 —— ADC的挑战
深兰科技DeepBlueAI团队斩获低分辨率视频行为识别挑战赛的冠军
评论