深兰科技DeepBlueAI团队斩获低分辨率视频行为识别挑战赛的冠军-电子发烧友网

导读近日，全球三大计算机视觉顶级会议之一CVPR如期举行，深兰科技DeepBlueAI团队斩获TinyAction Challenge（低分辨率视频行为识别挑战赛）的冠军。

TinyAction Challenge是第六届动作识别国际挑战赛系列竞赛之一，该系列竞赛由CVPR2021 International Challenge on Activity Recognition （ActivityNet） workshop 主办，旨在推动视频理解的进一步发展。

冠军方案解读

赛题介绍

TinyAction Challenge使用TinyVirat-v2［1］数据集，旨在提高低分辨率高噪声等真实监控场景下的视频行为识别能力。比赛提供大量真实场景视频片段及标注，每个视频片段中可能含有多个动作，本质是一个多标签的行为识别任务，比赛结果采用precision、recall、F1-score等多个指标来评测。

赛题难点

视频分辨率很低，最小只有10x10像素尺度；

视频尺度多样，从10x10到128x128不等；

视频质量较差，含有大量噪声；

视频场景多样，行为多样，每个视频可能含有多个行为。

解决方案

在算法选择上，团队广泛尝试了TSM［2］、TPN-Slowonly［3］等经典算法，最终采用交互移除的CSN［4］（ir-CSN）模型，在保证性能的前提下适当减少计算量，同时减轻对数据的过拟合。

数据增强方面，训练时团队首先随机调整尺度裁剪，再统一调整尺度到128x128，最后再随机翻转。而在测试时，通过Tencrop，即对视频帧及其水平翻转在中心与四角区域分别裁剪求平均，有效提高了inference时单模型性能。

测试阶段团队进一步使用了五折交叉验证的模型融合方法。另外由于观察到在比赛数据集的26类行为中有些类别是互斥的，因而对最终的结果添加了后处理规则，使得F1指标进一步提高0.6个点。通过一步步优化，DeepBlueAI团队单模型的F1指标即超过了第二名达到0.4447，并最终达到0.4782，实现大幅度领先。

总结

在本次比赛中，团队对任务及数据做了仔细的分析，合理地选择了模型算法，进行了精细的模型训练，同时在数据的后处理上做了大量的优化，有效实现了低分辨率高噪声视频中行为识别，并最终获得冠军。相信随着计算机视觉及多模态技术的深入发展，行为识别等视频理解问题能够得到更好的解决，并获得越来越广泛的实际应用。

参考文献：

［1］ Demir U， Rawat Y S， Shah M. TinyVIRAT： low-resolution video action recognition［C］//2020 25th International Conference on Pattern Recognition （ICPR）。 IEEE， 2021： 7387-7394

［2］ Yang C， Xu Y， Shi J， et al. Temporal pyramid network for action recognition［C］//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020： 591-600.

［3］ Lin J， Gan C， Han S. TSM： Temporal Shift Module for Efficient Video Understanding［C］// 2019 IEEE/CVF International Conference on Computer Vision （ICCV）。 IEEE， 2019.

［4］ Du T， Wang H， Feiszli M， et al. Video Classification With Channel-Separated Convolutional Networks［C］// International Conference on Computer Vision. 0.

编辑：jq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

计算机视觉

计算机视觉

+关注

关注
8

文章
1601

浏览量
45639
高噪声率

高噪声率

+关注

关注
0

文章
2

浏览量
5980
数据集

数据集

+关注

关注
4

文章
1179

浏览量
24364
CSN

CSN

+关注

关注
0

文章
2

浏览量
8750
深兰科技

深兰科技

+关注

关注
1

文章
50

浏览量
5841

原文标题：赛道 | CVPR2021深兰冠军方案解读- TinyAction Challenge低分辨率视频行为识别挑战赛

文章出处：【微信号：kmdian，微信公众号：深兰科技】欢迎添加关注！文章转载请注明出处。

基于CNN的图像超分辨率示例

考虑单个低分辨率图像，首先使用双三次插值将其放大到所需的大小，这是执行的唯一预处理。将插值图像表示为Y。我们的目标是从Y中恢复与真实高分辨率图像X尽可能相似的图像F (Y) 。

发表于 03-11 11:40 •298次阅读

EVAL_PASCO2_SENSOR为什么无法从较低的分辨率高速获得更高的分辨率？

捕获，同时高速传输较低分辨率（640x480,1280x720,1920x1080）时，静止请求被触发，它正在从一种分辨率转移到另一种分辨率，但无法进行静态捕获。我在调试时观察到了以下几点： 1

发表于 02-22 07:58

峰峰值分辨率与有效分辨率的区别

低带宽、高分辨率ADC的分辨率为16位或24位。但是，器件的有效位数受噪声限制，而噪声则取决于输出字速率和所用的增益设置。有些公司规定使用有效分辨率来表示该参数，ADI则规定使用峰峰值分辨率

发表于 12-15 07:56

深兰科技连续第4年通过SGS的4体系审核

近日，国际权威第三方认证机构SGS，对深兰科技进行了“ISO 27001信息安全管理体系”的换证审核，经过SGS派遣的外审员为期数天的严格审核，深兰科技成功过审。 SGS对信息安全管理体系的审核

发表于 12-14 09:28 •400次阅读

酣畅淋漓的知识分享|精度、精确度、准确度、分辨率怎么区别？#精度 #精确度 #准确度 #分辨率

元器件分辨率

安泰小课堂
发布于 :2023年12月08日 13:46:05

HDBaseT传输器支持传输4K30及以下分辨率吗？

传输器广泛应用于家庭娱乐系统、商业展示、会议室等场景。在传输视频信号方面，HDBaseT传输器支持多种分辨率，包括但不限于4K30及以下分辨率。这意味着它可以传输4K分辨率的

发表于 12-07 09:07 •238次阅读

SAFA：高效时空视频超分辨率的尺度自适应特征聚合

的问题，考虑把插帧做到特征图上，即 低分辨率帧 -> 编码成特征 -> 特征图上插帧 -> 解码得到高分辨率帧。

发表于 11-29 16:31 •311次阅读

峰值噪声与有效噪声的区别？峰值分辨率与有效分辨率的区别？

峰值噪声与有效噪声的区别，峰值分辨率与有效分辨率的区别？无失码分辨率又是指的什么？

发表于 11-27 11:42

请问AD5522的分辨率如何提高？

AD5522的输出电压跨度在22.5V左右，对应16bit的DAC的分辨率约22.5V/65536=343uV。如果我想提高到170uV左右的分辨率，但是又要保持输出电压跨度22.5V不变需要用

发表于 11-15 08:20

怎么调整andriod输出分辨率，适配分辨率大的屏？

求教，怎么调整andriod输出分辨率，适配分辨率大的屏

发表于 11-06 07:13

深兰科技斩获“上海设计100+”和“设享奖EDW”大奖

国庆前夕，“上海设计100+”和“设享奖EDW”两项产品设计大奖的获奖榜单先后揭晓，深兰科技出品的计算机视觉工业检测标准化设备-剑齿虎在两项大奖的评选中皆获大奖。

发表于 10-12 16:03 •480次阅读

深兰科技与西班牙BOMAPA集团签署AI工业解决方案合作协议

近日，深兰科技集团与西班牙BOMAPA SERVICES SL.集团在深兰科技上海总部大厦正式签署AI工业解决方案合作协议。

发表于 09-14 17:50 •859次阅读

直接飞行时间（DToF）视频的深度一致超分辨率重建

本文提出从两个方面解决dToF数据的空间模糊:利用RGB-dToF视频序列中的多帧信息融合和dToF直方图信息。我们设计了dToF视频超分辨网络DVSR,输入是高分辨率RGB图像序列和

发表于 08-30 15:15 •749次阅读

深兰团队已连续5年在CVPR挑战赛中斩获冠军

”的好成绩。自2019年起，深兰团队已经连续5年在CVPR挑战赛中有冠军斩获。 CVPR是计算机视觉领域的一个权威学术会议，由IEEE（In

发表于 06-26 11:11 •348次阅读

如何使用gstreamer获得更高的分辨率？

我正在使用带有最新 Kirkstone yocto bsp 版本的 imx8mp，我的图像传感器支持 4056x3040 分辨率。运行 gstreamer 时，我观察到任何高于 4K

发表于 05-29 06:00

搜索历史

深兰科技DeepBlueAI团队斩获低分辨率视频行为识别挑战赛的冠军

评论

基于CNN的图像超分辨率示例

EVAL_PASCO2_SENSOR为什么无法从较低的分辨率高速获得更高的分辨率？

峰峰值分辨率与有效分辨率的区别

深兰科技连续第4年通过SGS的4体系审核

酣畅淋漓的知识分享|精度、精确度、准确度、分辨率怎么区别？#精度 #精确度 #准确度 #分辨率

HDBaseT传输器支持传输4K30及以下分辨率吗？

SAFA：高效时空视频超分辨率的尺度自适应特征聚合

峰值噪声与有效噪声的区别？峰值分辨率与有效分辨率的区别？

请问AD5522的分辨率如何提高？

怎么调整andriod输出分辨率，适配分辨率大的屏？

深兰科技斩获“上海设计100+”和“设享奖EDW”大奖

深兰科技与西班牙BOMAPA集团签署AI工业解决方案合作协议

直接飞行时间（DToF）视频的深度一致超分辨率重建

深兰团队已连续5年在CVPR挑战赛中斩获冠军

如何使用gstreamer获得更高的分辨率？