0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

COCO单模型测试取得新纪录:60.6 AP

新机器视觉 来源:新智元 作者:袁路 2021-06-23 16:02 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着注意力机制在自然语言处理和计算机视觉等多个人工智能领域风靡,计算机视觉领域刷榜之争可谓是进入白热化阶段。

近期大量工作刷新现有各项任务SOTA:前脚谷歌刚在图像识别ImageNet上准确度超过90,紧接着微软又在目标检测COCO上AP超过60。

在一篇CVPR 2021 论文中,来自微软的研究者提出多重注意力机制统一目标检测头方法Dynamic Head, 可插拔特性提高多种目标检测框架的性能。

在Transformer骨干和额外数据加持下,COCO单模型测试取得新纪录:60.6 AP。

方法概述

本文首先对现有目标检测头的改进工作进行了总结,发现近期方法主要通过三个不同的角度出发进行目标检测性能的提升:

尺度感知:目标尺度的差异对应了不同尺度的特征,改进不同级的表达能力可以有效提升目标检测器的尺度感知能力;

空间位置:不相似目标形状的不同几何变换对应了特征的不同空间位置,改进不同空间位置的表达能力可以有效提升目标检测器的空间位置感知能力;

多任务:目标表达与任务的多样性对应了不同通道特征,改进不同通道的表达能力可以有效提升目标检测的任务感知能力。

本文提出一种新颖的动态头框架,它采用多注意力机制将不同的目标检测头进行统一。

通过特征层次之间的注意力机制用于尺度感知,空间位置之间的注意力机制用于空间感知,输出通道内的注意力机制用于任务感知,该方法可以在不增加计算量的情况显著提升模型目标检测头的表达能力。

为了达成以上目的,本文对特征金字塔进行重构,将不同层级的特征统一到一个3D张量,并发现在不同维度引入注意力机制可以提高对尺度,空间位置和多任务的感知能力。

因此上述方向可以统一到一个高效注意力学习问题中。本文也是首个尝试采用多注意力机制将三个维度组合构建统一头并最大化其性能的工作。

作者将注意力函数转换为三个序列子注意力函数来解决传统注意力函数在高维度导致计算量激增的问题。

每个注意力函数仅聚焦一个维度:基于SE模块的尺度自注意函数π_L, 基于可变形卷积的空间自注意函数π_S 和 基于动态ReLU激活函数的多任务的自注意函数π_C。

作者将三种自注意函数进行堆叠,形成一个可轻易插拔的模块DyHead,并将其应用于多种目标检测框架中。

实验结果

作者首先分析了的计算效率。当采用6个模块时,模型性能提升达到最大,而计算量提升相比骨干网络可以忽略。

作者将DyHead集成到不同检测器进行性能对比,发现所提DyHead可以一致性提升所有主流目标检测器性能:1.2~3.2AP,展示了优异的可插拔扩展性能。

在与其他目标检测方法的对比中,所提方案以较大的优势超越了流行方案。相比仅采用多尺度寻览的方法,所提方案仅需2x训练即可取得新的SOTA指标52.3AP。相对于谷歌提出的EfficientDet与SpineNet,所提方法训练时间更少(仅1/20);

当同时采用多尺度训练与测试时,所提方法取得了新的SOTA指标54.0AP,以1.3AP指标优于此前最佳。

当引入更优异的Transformer骨干网络、以及通过类似于谷歌自我学习方法生成的额外伪框的ImageNet数据后,所提方案取得了COCO新的记录:60.6 AP,成为首个超过60的单模型方法。

责任编辑:lq6

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

原文标题:刷新记录! CVPR2021全新目标检测机制达到SOTA!

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    喜讯 | 凌科DL28系列连接器荣获「第二十四届(2025)深圳企业创新纪录」殊荣

    凌科喜获三项大奖近日,凌科电气荣获三项殊荣:第二十四届(2025)深圳企业创新纪录(DL28系列连接器);2025粤港澳大湾区企业创新力榜单(高成长创新榜);深圳工匠培育示范单位(复审)。本次三奖
    的头像 发表于 02-05 18:00 680次阅读
    喜讯 | 凌科DL28系列连接器荣获「第二十四届(2025)深圳企业创<b class='flag-5'>新纪录</b>」殊荣

    阿里巴巴发布通义千问旗舰推理模型Qwen3-Max-Thinking

    今天,我们正式发布千问旗舰推理模型Qwen3-Max-Thinking,创下数项权威评测全球新纪录
    的头像 发表于 01-27 15:47 590次阅读
    阿里巴巴发布通义千问旗舰推理<b class='flag-5'>模型</b>Qwen3-Max-Thinking

    单模光纤理论速率是多少

    单模光纤理论传输速率可达100Gbps,且未来可通过技术升级进一步提升。以下是对单模光纤理论速率的详细解释: 一、单模光纤的基本特性 传输模式:单模光纤仅允许单一光模式传播,减少了信号
    的头像 发表于 01-27 09:55 257次阅读

    海外首发即告售罄,韶音OpenFit Pro创新纪录!中国智造标杆再获全球认可

    %,新客增长率突破100%,创下韶音在海外市场的销售新纪录。这一成绩不仅反映出全球消费者对韶音产品的高度认可,也印证了韶音在全球市场上日益增长的影响力与号召力。
    的头像 发表于 01-14 17:31 1017次阅读

    单模光缆与多模​光缆的区别?​

    单模光缆的传输 单模光缆实际用于传输的是中间纤芯,称为光纤。即单模光缆是由光纤+外护套+中间介质的组成。在光纤通信中,单模光纤(SMF)是一种在横向模式直接传输光信号的光纤。
    的头像 发表于 12-23 10:14 175次阅读

    晶科能源创下n型TOPCon太阳能电池效率新纪录

    来源:维度网 中国晶科能源公司宣布其n型TOPCon太阳能电池转换效率达到27.79%,该成果已获得德国哈默尔恩太阳能研究所独立验证。这一太阳能电池效率新纪录较该公司今年6月公布的27.02%有所
    的头像 发表于 12-22 17:24 996次阅读

    深入剖析AP61200/AP61201/AP61202/AP61203同步降压转换器

    深入剖析AP61200/AP61201/AP61202/AP61203同步降压转换器 在电子设计领域,电源管理芯片的选择至关重要,它直接影响着整个系统的性能和稳定性。今天,我们就来深入
    的头像 发表于 12-17 18:20 4363次阅读

    晶科能源第31次打破电池效率和组件功率世界纪录

    效率和组件功率世界纪录。 本次刷新纪录得益于晶科能源在TOPCon基础核心技术上的一系列前瞻性布局与深耕。该技术采用新型钝化接触技术,通过复合钝化材料和工艺开发及优化,实现了对电池表面的全面高效钝化,有效抑制载流子复合损失。并使用超低光学寄生
    的头像 发表于 11-24 15:00 656次阅读

    速腾聚创月交付激光雷达破12万台,创造行业新纪录

    速腾聚创近日宣布,公司在2025年10月实现了激光雷达单月交付量突破12万台的里程碑,创下全球激光雷达行业的新纪录。这一突破性成绩标志着智能驾驶核心零部件正式迈入大规模商业化应用的新阶段。尤为
    的头像 发表于 11-11 18:43 1937次阅读

    四芯单模光缆和六芯单模光缆有什么不同呢

    四芯单模光缆与六芯单模光缆的核心差异体现在光纤芯数、传输容量、应用场景、成本效益及扩展性五个方面,具体分析如下: 一、光纤芯数:物理结构的直接差异 四芯单模光缆内置4根单模光纤,每根光
    的头像 发表于 11-11 10:28 1212次阅读

    如何在vivadoHLS中使用.TLite模型

    (ap_uint<8> input[INPUT_HEIGHT][INPUT_WIDTH][INPUT_CHANNELS], ...){ // 定义模型输入和输出变量 hls
    发表于 10-22 06:29

    Siumulink模型测试典型问题分享——模型层级设计不合理

    典型测试问题分享-模型层级设计不合理 问题描述: 重点功能与非重点功能混合,导致测试层级选择困难。 模型未体现层级划分,结构平铺导致层级圈复杂度异常。 部分计算/判断/赋值等结构
    的头像 发表于 09-20 12:31 3087次阅读
    Siumulink<b class='flag-5'>模型</b><b class='flag-5'>测试</b>典型问题分享——<b class='flag-5'>模型</b>层级设计不合理

    比亚迪仰望U9工程测试车打破全球电车极速纪录

    近日,仰望汽车宣布,仰望U9工程测试车在德国ATP测试场实现472.41km/h的最高时速成绩,打破全球电车极速纪录,此举是中国自主品牌首次在该领域问鼎世界。
    的头像 发表于 08-27 10:32 1169次阅读

    模型捉虫行家MV:致力全流程模型动态测试

    随着基于模型设计(MBD)开发量的增长,其对应的测试需求也显著提升。此前,在《您的模型诊断专家MI:助力把好模型质量关》一文中详述了模型静态
    的头像 发表于 07-09 16:37 885次阅读
    <b class='flag-5'>模型</b>捉虫行家MV:致力全流程<b class='flag-5'>模型</b>动态<b class='flag-5'>测试</b>

    是德科技AP5000系列模拟信号源在接收机测试中的应用

    利用是德科技AP5000系列高精度、经济型模拟信号源,对接收机测试中的功率进行精细校准。
    的头像 发表于 05-16 09:14 1063次阅读
    是德科技<b class='flag-5'>AP</b>5000系列模拟信号源在接收机<b class='flag-5'>测试</b>中的应用