0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

深兰科技DeepBlueAI团队斩获低分辨率视频行为识别挑战赛的冠军

深兰科技 来源:DeepBlue深兰科技 作者:DeepBlue深兰科技 2021-06-30 10:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

导读近日,全球三大计算机视觉顶级会议之一CVPR如期举行,深兰科技DeepBlueAI团队斩获TinyAction Challenge(低分辨率视频行为识别挑战赛)的冠军。

TinyAction Challenge是第六届动作识别国际挑战赛系列竞赛之一,该系列竞赛由CVPR2021 International Challenge on Activity Recognition (ActivityNet) workshop 主办,旨在推动视频理解的进一步发展。

冠军方案解读

赛题介绍

TinyAction Challenge使用TinyVirat-v2[1]数据集,旨在提高低分辨率高噪声等真实监控场景下的视频行为识别能力。比赛提供大量真实场景视频片段及标注,每个视频片段中可能含有多个动作,本质是一个多标签的行为识别任务,比赛结果采用precision、recall、F1-score等多个指标来评测。

赛题难点

视频分辨率很低,最小只有10x10像素尺度;

视频尺度多样,从10x10到128x128不等;

视频质量较差,含有大量噪声;

视频场景多样,行为多样,每个视频可能含有多个行为。

解决方案

算法选择上,团队广泛尝试了TSM[2]、TPN-Slowonly[3]等经典算法,最终采用交互移除的CSN[4](ir-CSN)模型,在保证性能的前提下适当减少计算量,同时减轻对数据的过拟合。

数据增强方面,训练时团队首先随机调整尺度裁剪,再统一调整尺度到128x128,最后再随机翻转。而在测试时,通过Tencrop,即对视频帧及其水平翻转在中心与四角区域分别裁剪求平均,有效提高了inference时单模型性能。

测试阶段团队进一步使用了五折交叉验证的模型融合方法。另外由于观察到在比赛数据集的26类行为中有些类别是互斥的,因而对最终的结果添加了后处理规则,使得F1指标进一步提高0.6个点。通过一步步优化,DeepBlueAI团队单模型的F1指标即超过了第二名达到0.4447,并最终达到0.4782,实现大幅度领先。

总结

在本次比赛中,团队对任务及数据做了仔细的分析,合理地选择了模型算法,进行了精细的模型训练,同时在数据的后处理上做了大量的优化,有效实现了低分辨率高噪声视频中行为识别,并最终获得冠军。相信随着计算机视觉及多模态技术的深入发展,行为识别等视频理解问题能够得到更好的解决,并获得越来越广泛的实际应用。

参考文献:

[1] Demir U, Rawat Y S, Shah M. TinyVIRAT: low-resolution video action recognition[C]//2020 25th International Conference on Pattern Recognition (ICPR)。 IEEE, 2021: 7387-7394

[2] Yang C, Xu Y, Shi J, et al. Temporal pyramid network for action recognition[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020: 591-600.

[3] Lin J, Gan C, Han S. TSM: Temporal Shift Module for Efficient Video Understanding[C]// 2019 IEEE/CVF International Conference on Computer Vision (ICCV)。 IEEE, 2019.

[4] Du T, Wang H, Feiszli M, et al. Video Classification With Channel-Separated Convolutional Networks[C]// International Conference on Computer Vision. 0.

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机视觉
    +关注

    关注

    9

    文章

    1714

    浏览量

    47449
  • 高噪声率
    +关注

    关注

    0

    文章

    2

    浏览量

    6082
  • 数据集
    +关注

    关注

    4

    文章

    1230

    浏览量

    26041
  • CSN
    CSN
    +关注

    关注

    0

    文章

    2

    浏览量

    8987
  • 深兰科技
    +关注

    关注

    1

    文章

    94

    浏览量

    6445

原文标题:赛道 | CVPR2021深兰冠军方案解读- TinyAction Challenge低分辨率视频行为识别挑战赛

文章出处:【微信号:kmdian,微信公众号:深兰科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    第三届ICPC与华为挑战赛冠军杯圆满结束

    近日,第三届ICPC&华为挑战赛冠军杯在上海练秋湖研发中心闭幕,来自佐治亚理工学院的中国选手褚写庭获得冠军。这项赛事由ICPC(国际大学生程序设计竞赛)基金会和华为联合举办,汇聚全球顶尖
    的头像 发表于 11-19 16:15 655次阅读

    电能质量在线监测装置的暂态记录分辨率如何影响故障类型识别

    、相位差),低分辨率则会让特征模糊或丢失,直接导致故障类型误判。具体影响可按核心分辨率指标与故障识别逻辑拆解: 一、核心影响逻辑:分辨率决定 “故障特征的可
    的头像 发表于 11-14 16:10 1718次阅读
    电能质量在线监测装置的暂态记录<b class='flag-5'>分辨率</b>如何影响故障类型<b class='flag-5'>识别</b>?

    廊坊市政府领导莅临深兰科技调研考察

    2025年11月4日,河北省廊坊市市长刘媛市政府考察团一行莅临深兰科技集团上海总部调研考察。深兰科技集团董事副总裁杨秀珂率团队热情接待。双方围绕人工智能产业发展、技术应用落地、机器人
    的头像 发表于 11-05 17:57 1045次阅读

    传音TEX AI团队斩获ICCV 2025大型视频目标分割挑战赛双料亚军

    近日,国际计算机视觉大会(ICCV 2025)举办了第七届大型视频目标分割挑战赛(LSVOS Challenge),传音TEX AI团队凭借自主研发的创新技术方案,在复杂视频目标分割和
    的头像 发表于 10-31 09:42 281次阅读
    传音TEX AI<b class='flag-5'>团队</b><b class='flag-5'>斩获</b>ICCV 2025大型<b class='flag-5'>视频</b>目标分割<b class='flag-5'>挑战赛</b>双料亚军

    山东大学与济南市科技局领导莅临深兰科技调研考察

    2025年10月27日,山东大学副校长王美琴山东大学及济南市科技局领导一行莅临深兰科技集团上海总部进行调研考察,并与深兰科技创始人兼董事长陈海波及公司高层进行了卓有成效的座谈交流。
    的头像 发表于 10-30 15:19 411次阅读

    深兰科技发布AI法务大模型产品

    近日,深兰科技发布面向律所与企业法务部门的AI法务大模型产品——“深兰律师办公自动化系统(AI版)”。通过AI技术赋能法律服务行业,它能够显著提升法律文书处理效率与事务性工作自动化水平,为律所和法务团队带来全新的工作体验。
    的头像 发表于 10-23 17:58 943次阅读

    分辨率对于模拟到数字转换器有什么重要性

    96dB以上,而低分辨率ADC(如8位)仅约48dB。这意味着高分辨率ADC能同时处理强信号和弱信号,避免弱信号被量化噪声淹没。信噪比(SNR)提升:分辨率每增加1位,理论SNR提升约6dB(实际因
    发表于 09-18 09:31

    如何构建带有VGA输出的低分辨率热成像

    在本文中,我们将介绍如何构建带有VGA输出的低分辨率热成像。该解决方案基于Melexis MLX90640红外阵列、FPGA S7 50开发板(AMD-Xilinx Spartan-7 FPGA,带VGA输出)。
    的头像 发表于 07-15 11:06 3898次阅读
    如何构建带有VGA输出的<b class='flag-5'>低分辨率</b>热成像

    传音多媒体团队揽获CVPR NTIRE 2025两项挑战赛冠亚军,推动视频画质升级

    近日,在计算机视觉领域最具影响力的国际竞赛CVPRNTIRE2025中,传音多媒体团队与上海交通大学图像所MediaLab联合团队分别斩获高效超分辨率
    的头像 发表于 06-24 17:03 746次阅读
    传音多媒体<b class='flag-5'>团队</b>揽获CVPR NTIRE 2025两项<b class='flag-5'>挑战赛</b>冠亚军,推动<b class='flag-5'>视频</b>画质升级

    传音多媒体团队揽获CVPR NTIRE 2025两项挑战赛冠亚军

    近日,在计算机视觉领域最具影响力的国际竞赛 CVPR NTIRE 2025中,传音多媒体团队与上海交通大学图像所MediaLab联合团队分别斩获 高效超分辨率
    的头像 发表于 06-24 16:08 1430次阅读
    传音多媒体<b class='flag-5'>团队</b>揽获CVPR NTIRE 2025两项<b class='flag-5'>挑战赛</b>冠亚军

    分辨率 vs 噪声 —— ADC的挑战

    设计者常用高分辨率 ADC 以降低最低可量测单位(LSB),提高检测精度。 比如一个 16 位 ADC 在 5V 范围内, LSB ≈ 76 μV ;理想情况下可以检测到微弱电信号。 问题是: 若
    的头像 发表于 06-23 07:38 1468次阅读
    <b class='flag-5'>分辨率</b> vs 噪声 —— ADC的<b class='flag-5'>挑战</b>

    比利时考察团到访深兰科技调研

    近日,比利时王国驻上海总领馆法兰德斯投促局投资总监Diane Zhang考察团到访深兰科技集团总部调研。深兰科技集团创始人、董事长陈海波集团相关部门负责人进行了热情接待,双方就商贸
    的头像 发表于 01-10 11:28 892次阅读

    如何选择扫描电镜的分辨率

    选择扫描电镜的分辨率需要综合考虑多个因素。首先是研究目的。如果只是需要对样品的大致形貌进行观察,例如查看较大颗粒的分布或者材料表面的宏观缺陷,较低分辨率(如3-10nm)可能就足够了。但如果要观察
    的头像 发表于 12-25 14:29 1190次阅读
    如何选择扫描电镜的<b class='flag-5'>分辨率</b>?

    芯华章持续助力EDA精英挑战赛

    日前,2024中国研究生创“芯”大赛·EDA精英挑战赛(以下简称EDA竞赛)决赛在南京江北新区举办。今年EDA竞赛首次升级为国,在全国超过500个参赛队伍中,来自华南理工大学的"EDA240931参赛队"从芯华章赛道脱颖而出,斩获
    的头像 发表于 12-17 15:47 1303次阅读

    EDA精英挑战赛果公布!思尔芯“战队”薪火相承斩获“麒麟杯”

    2024中国研究生创芯大赛·EDA精英挑战赛12月7-8日,2024中国研究生创芯大赛·EDA精英挑战赛(原“集成电路EDA设计精英挑战赛”)总决赛及颁奖典礼在南京成功举办。此次大赛,思尔芯作为核心
    的头像 发表于 12-11 01:03 1397次阅读
    EDA精英<b class='flag-5'>挑战赛</b><b class='flag-5'>赛</b>果公布!思尔芯“战队”薪火相承<b class='flag-5'>斩获</b>“麒麟杯”