0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

MS-DETR和其他SOTA方法的对比

3D视觉工坊 来源:3D视觉工坊 2024-01-23 14:14 次阅读

1. 写在前面

目标检测到底是DETR好还是YOLO好?感觉也没有一个明确的答案,YOLO在不停的平衡精度和效率,DETR也在不停的提高实时性。今天笔者为大家推荐一篇最新的DETR开源工作MS-DETR,通过一对一监督和一对多监督相结合的方式,提高DETR的训练效率。

下面一起来阅读一下这项工作

2. 摘要

DETR通过迭代地生成基于图像特征的多个候选目标,并为每个真值目标提升一个候选目标,从而实现端到端的目标检测。原始DETR中采用一对一监督的传统训练过程缺乏对目标检测候选的直接监督。

我们旨在通过一对一监督和一对多监督相结合的方式,对候选生成过程进行明确监督,从而提高DETR的训练效率。我们的方法,即MS - DETR,简单,并且对用于推理的主解码器的对象查询进行一对多的监督。与现有的一对多监督的DETR变体(如Group DETR和Hybrid DETR )相比,我们的方法不需要额外的解码器分支或对象查询。在我们的方法中,主解码器的对象查询直接受益于一对多的监督,因此在对象候选预测方面具有优势。实验结果表明,我们的方法优于相关DETR变体,如DN - DETR、Hybrid DETR和Group DETR,与相关DETR变体的结合进一步提高了性能。

3. 效果展示

这篇文章的思想就是使用一对一监督和一对多监督相结合的混合监督。混合监督会产生更好的检测候选。Top:box真值。Middle:与基线匹配的前20个查询的候选框。Bottom:使用MS - DETR从前20个查询中选出候选框。可以看出,MS - DETR比基线产生了更好的检测候选。

4. 具体原理是什么?

混合监督会产生比基线更低的一对一损失。x轴对应epoch,y轴对应一对一监督的训练损失。虚线和实线分别对应于Deformable DETR基线和MS - DETR的损失曲线。

f7538902-b164-11ee-8b88-92fbcf53809c.jpg

不同架构的差异。( a )原始DETR:采用一对一监督的方式对其进行训练。( b ) MS -- DETR:通过混合一对一和一对多监督的方式进行训练。这两种监督都施加在初级解码器上。( c ) DETR组和DN - DETR组。引入了额外的并行译码器,并对额外的译码器进行一对一的监督。DETR和DN - DETR可能会使用更多的额外解码器。(d) 混合DETR:增加了一个额外的并行译码器,并对额外的译码器施加一对多的监督。

f75ce43e-b164-11ee-8b88-92fbcf53809c.jpg

MS-DETR的具体实现。( a )对每个解码器层的输出对象查询进行一对一和一对多的监督。( b )对每个稍作修改的解码器层的输出对象查询进行两次监督:首先执行交叉注意力,然后执行自注意力。( c )和( d )对内部对象查询进行一对多监督。cls11和box11是一对一监督的class和box预测子,cls1m和box1m是一对多监督的class和box预测子。

f7832108-b164-11ee-8b88-92fbcf53809c.jpg

5. 和其他SOTA方法的对比

MS - DETR与一对多( O2M )监督的其他方法在不同基线上的比较。MS - DETR一致地改进了各种流行的DETR基线。

f789fa50-b164-11ee-8b88-92fbcf53809c.jpg

与其他方法相结合的对比, MS - DETR是现有O2M方法的一种补充方法。

f7968252-b164-11ee-8b88-92fbcf53809c.jpg

6. 总结

这篇文章在原有一对一监督的基础上增加了一对多的监督,用于DETR训练。主要特点是显式地监督了对象查询。MS-DETR是对相关方法的补充,这些方法主要是修改交叉注意力结构或使用额外的查询或额外的解码器来学习解码器权重。

审核编辑:黄飞

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 解码器
    +关注

    关注

    9

    文章

    1073

    浏览量

    40159
  • 目标检测
    +关注

    关注

    0

    文章

    185

    浏览量

    15455

原文标题:MS-DETR:全面提升目标检测的效率和精度!

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    SOTA的定义是什么?常规的实现方式有哪些

    1.SOTA的定义SOTA即软件在线升级(Software updates Over The Air),是指在不连接烧写器的情况下,通过CAN、UART或其它通讯方式,实现应用程序的更新。在进行
    发表于 02-14 06:14

    实体关系联合抽取取得SOTA的三种方法

    2020实体关系联合抽取一片红海,各种SOTA方法你方唱罢我方登场,在一些数据集上也是不断刷出新高度,为信息抽取领域带来了新思路,推动了信息抽取领域的发展。本文梳理了实体关系联合抽取取得SOTA
    的头像 发表于 02-10 17:08 1.2w次阅读
    实体关系联合抽取取得<b class='flag-5'>SOTA</b>的三种<b class='flag-5'>方法</b>

    SOTA机制详解

    1.SOTA的定义SOTA即软件在线升级(Software updates Over The Air),是指在不连接烧写器的情况下,通过CAN、UART或其它通讯方式,实现应用程序的更新。在进行
    发表于 12-09 15:06 10次下载
    <b class='flag-5'>SOTA</b>机制详解

    如何A2B正在改变SOTA在汽车应用中的游戏规则

    空中软件 (SOTA) 正迅速成为汽车 OEM 开发和部署的重要功能。更新模块、支持客户和将附加功能货币化的能力使掌握 SOTA 成为一个有吸引力的主张。本文讨论了为什么SOTA会出现在汽车环境中,如何部署它,以及如何2B技术可
    的头像 发表于 12-09 15:56 563次阅读
    如何A2B正在改变<b class='flag-5'>SOTA</b>在汽车应用中的游戏规则

    RT-DETR用114FPS实现54.8AP远超YOLOv8

    最近,基于Transformer的端到端检测器(DETR)已经取得了显著的性能。然而,DETR的高计算成本问题尚未得到有效解决,这限制了它们的实际应用,并使它们无法充分利用无后处理的好处,如非最大值抑制(NMS)。
    的头像 发表于 04-20 09:59 608次阅读

    介绍RT-DETR两种风格的onnx格式和推理方式

    RT-DETR是由百度近期推出的DETR-liked目标检测器,该检测器由HGNetv2、混合编码器和带有辅助预测头的Transformer编码器组成
    的头像 发表于 05-17 17:46 2254次阅读
    介绍RT-<b class='flag-5'>DETR</b>两种风格的onnx格式和推理方式

    通过A2B更新软件—A2B如何给汽车应用中的SOTA带来变革

    无线软件升级(SOTA)正迅速成为汽车OEM须开发和部署的重要能力。更新模块、支持客户、和通过附加特性带来利润的能力,使得掌握SOTA成为一个有吸引力的主张。本文讨论SOTA为何出现在汽车环境中,如何部署
    的头像 发表于 06-15 16:02 1179次阅读
    通过A2B更新软件—A2B如何给汽车应用中的<b class='flag-5'>SOTA</b>带来变革

    Focus-DETR:30%Token就能实现SOTA性能,效率倍增

    目前 DETR 类模型已经成为了目标检测的一个主流范式。但 DETR 算法模型复杂度高,推理速度低,严重影响了高准确度目标检测模型在端侧设备的部署,加大了学术研究和产业应用之间的鸿沟。
    的头像 发表于 08-02 15:12 451次阅读
    Focus-<b class='flag-5'>DETR</b>:30%Token就能实现<b class='flag-5'>SOTA</b>性能,效率倍增

    一种新型的DETR轻量化模型Focus-DETR

    作者对多个 DETR 类检测器的 GFLOPs 和时延进行了对比分析,如图 1 所示。从图中发现,在 Deformable-DETR 和 DINO 中,encoder 的计算量分别是 decoder
    的头像 发表于 08-02 15:34 391次阅读
    一种新型的<b class='flag-5'>DETR</b>轻量化模型Focus-<b class='flag-5'>DETR</b>

    人工智能SOTA什么意思

    中,SOTA通常用于描述当前最先进的算法或者模型在一个特定数据集上的表现。 SOTA是一个极其重要的标准,因为它可以衡量研究人员的技术水平,并且可以用于比较不同算法的性能优劣。SOTA是数据科学家们努力工作的目标之一,通过不断地
    的头像 发表于 08-22 16:45 1w次阅读

    DETR架构的内部工作方式分析

    这是一个Facebook的目标检测Transformer (DETR)的完整指南。   介绍 DEtection TRansformer (DETR)是Facebook研究团队巧妙地利
    的头像 发表于 08-30 10:53 587次阅读
    <b class='flag-5'>DETR</b>架构的内部工作方式分析

    基于OpenVINO Python API部署RT-DETR模型

    RT-DETR 是在 DETR 模型基础上进行改进的,一种基于 DETR 架构的实时端到端检测器,它通过使用一系列新的技术和算法,实现了更高效的训练和推理,我们将在 Python、C++、C# 三个
    的头像 发表于 10-20 11:15 535次阅读
    基于OpenVINO Python API部署RT-<b class='flag-5'>DETR</b>模型

    第一个基于DETR的高质量通用目标检测方法

    现有的DETR系列模型在非COCO数据集上表现较差,且预测框不够准确。其主要原因是:DETR在检测头中用全局交叉注意力替换了原来的卷积,删除了以中心为中心的先验知识;另一方面,DETR仅依赖分类分数评分查询提议,忽略了定位质量。
    的头像 发表于 11-01 16:12 315次阅读
    第一个基于<b class='flag-5'>DETR</b>的高质量通用目标检测<b class='flag-5'>方法</b>

    基于OpenVINO C++ API部署RT-DETR模型

    RT-DETR 是在 DETR 模型基础上进行改进的,一种基于 DETR 架构的实时端到端检测器,它通过使用一系列新的技术和算法,实现了更高效的训练和推理,在前文我们发表了《基于 OpenVINO
    的头像 发表于 11-03 14:30 373次阅读
    基于OpenVINO C++ API部署RT-<b class='flag-5'>DETR</b>模型

    基于OpenVINO C# API部署RT-DETR模型

    在 C# 环境下使用该模型应用到工业检测中,因此在本文中,我们将向大家展示使用 OpenVINO Csharp API 部署 RT-DETR 模型,并对比不同编程平台下模型部署的速度。
    的头像 发表于 11-10 16:59 400次阅读
    基于OpenVINO C# API部署RT-<b class='flag-5'>DETR</b>模型