0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

MUS-CDB:遥感目标检测中的主动标注的具有类分布平衡的混合不确定性采样

CVer 来源:CVer 2023-09-10 10:02 次阅读

引言:

现有的遥感目标检测模型通常依赖于大量的标记训练数据,然而由于遥感场景中物体密度较高,因此手工标注所需的时间和金钱成本非常昂贵。主动学习通过有选择地查询信息丰富和代表性的未标记样本,有效降低了数据标注成本。然而,现有的主动学习方法主要适用于类别平衡设置和基于图像查询的通用物体检测任务,而在遥感目标检测场景中,由于存在长尾类分布和密集小物体,这些方法并不太适用。如图1所示,相较于通用场景下的物体分布,航空遥感图像中的目标通常呈现较小、模糊的特点,并且在复杂背景中密集分布。

在本文中,我们提出了一种新颖的遥感目标检测主动学习方法,旨在有效降低成本。具体而言,在物体采样中考虑了对象级和图像级的信息性,以避免冗余和短视的查询。此外,还结合了一个易于使用的类平衡准则,以支持少数类对象,缓解模型训练中的长尾类分布问题。我们进一步设计了一个训练损失,来挖掘未标记图像区域中的潜在知识。

78a212fa-4f2a-11ee-a25d-92fbcf53809c.png

方法:

使用主动学习进行遥感目标检测旨在通过从大型未标记数据集78de30dc-4f2a-11ee-a25d-92fbcf53809c.png中选择信息量丰富的样本来降低标注成本,从而训练一个性能良好的检测器78eb6f72-4f2a-11ee-a25d-92fbcf53809c.png。该问题由三组数据定义:用于初始化模型的小型完全标记集78f8b948-4f2a-11ee-a25d-92fbcf53809c.png,用于数据选择的大型未标记集78de30dc-4f2a-11ee-a25d-92fbcf53809c.png,以及通过主动学习方法采样的部分标记集790febae-4f2a-11ee-a25d-92fbcf53809c.png。为了使用最小的标记成本来训练一个性能良好的检测器791ff170-4f2a-11ee-a25d-92fbcf53809c.png,我们使用采样函数从78de30dc-4f2a-11ee-a25d-92fbcf53809c.png中选择信息最丰富的样本进行标注,标注后的图片加入790febae-4f2a-11ee-a25d-92fbcf53809c.png。我们设计了两个模块来进行经济高效的采样:混合不确定性采样模块(MUS)和类别分布平衡采样(CDB)。方法的整体框架如图2所示。

79428456-4f2a-11ee-a25d-92fbcf53809c.png

混合不确定性采样:

现有的基于对象的采样方法主要考虑预测框本身的信息,即类别不确定性或回归不确定性,但忽视了图像的空间信息和语义结构。为了解决这个问题,我们提出考虑图像和对象的不确定性,即结合全局和局部信息以进行更全面的数据评估。

关于图像不确定性,如果一张图像中有许多预测对象具有较高的不确定性,那么应该优先选择该图像进行采样。为此,我们评估并聚合模型预测的不确定性值以表示整个图像的不确定性值。具体而言,对于给定的图像 79d6ad02-4f2a-11ee-a25d-92fbcf53809c.png,图像不确定性 79e12caa-4f2a-11ee-a25d-92fbcf53809c.png 的表达式如下所示:

79f861c2-4f2a-11ee-a25d-92fbcf53809c.png

其中,7a154670-4f2a-11ee-a25d-92fbcf53809c.png 表示集合中元素的数量,7a1d928a-4f2a-11ee-a25d-92fbcf53809c.png 是分数阈值。图像不确定性值 79e12caa-4f2a-11ee-a25d-92fbcf53809c.png是通过计算图像中边界框的平均置信度得到的。只有置信度大于阈值 7a1d928a-4f2a-11ee-a25d-92fbcf53809c.png 的边界框被用于计算平均置信度。当图像中存在许多置信度较低的预测边界框时,79e12caa-4f2a-11ee-a25d-92fbcf53809c.png 值会较高。这是因为图像中包含了难以区分的对象,导致预测结果不一致且置信度较低。因此,具有较高 79e12caa-4f2a-11ee-a25d-92fbcf53809c.png值的图像更有可能包含罕见模式的有用信息,也就更适合进行选择。

关于对象不确定性,为了在查询中考虑对象级别的信息,我们使用熵来评估每个预测边界框的不确定性。具体而言,对象不确定性 7a5da1f4-4f2a-11ee-a25d-92fbcf53809c.png 的计算如下所示:

7a6a5840-4f2a-11ee-a25d-92fbcf53809c.png

其中7a828d16-4f2a-11ee-a25d-92fbcf53809c.png 是图像7a91ab16-4f2a-11ee-a25d-92fbcf53809c.png中第 7a9ea802-4f2a-11ee-a25d-92fbcf53809c.png 个边界框在类别7ab32c1e-4f2a-11ee-a25d-92fbcf53809c.png上的预测概率。

接下来,我们将图像不确定性 79e12caa-4f2a-11ee-a25d-92fbcf53809c.png 和对象不确定性 7acc22fa-4f2a-11ee-a25d-92fbcf53809c.png 结合起来,得到最终的对象信息分数 7add6434-4f2a-11ee-a25d-92fbcf53809c.png

7aec228a-4f2a-11ee-a25d-92fbcf53809c.png

类别分布平衡采样:

遥感数据存在类别不平衡的问题,其中罕见类别对模型性能产生严重损害。为了解决这个问题,我们提出了一种在主动查询过程中强调低频类别的采样方法。具体而言,我们首先统计标记数据集中的类别分布情况,然后确定标记数据集中的罕见类别。设7b0abb64-4f2a-11ee-a25d-92fbcf53809c.png表示类别7ab32c1e-4f2a-11ee-a25d-92fbcf53809c.png对应的对象数量,其中7b218f38-4f2a-11ee-a25d-92fbcf53809c.png。我们的目标是在采样阶段通过对每个类别施加与7b0abb64-4f2a-11ee-a25d-92fbcf53809c.png成反比的偏好7b3bf2d8-4f2a-11ee-a25d-92fbcf53809c.png,来更多地查询罕见的类别对象。采样偏好7b5347f8-4f2a-11ee-a25d-92fbcf53809c.png的计算方式如下:

7b650d26-4f2a-11ee-a25d-92fbcf53809c.png

首先,根据ak值,我们计算标记集中每个类别的分布概率。然后,我们取其倒数得到类别权重βk,用于采样过程中的权重调整。接下来,我们使用Softmax函数计算采样期间预期的类别分布。通过这种方式,我们能够为不同的类别设定偏好7b3bf2d8-4f2a-11ee-a25d-92fbcf53809c.png,并在选择阶段有选择性地查询罕见类别对象,以提高模型的性能和准确性。

处理部分标记图像:

为了应对模型训练过程中存在一些数据集完全标记,而另一些图像数据集仅部分标记的情况,我们采用了不同的训练损失函数来处理这两个集合。对于完全标记的数据集,我们沿用了检测器的默认训练损失函数;而对于部分标记的数据集,我们则采用了自定义的损失函数,以有效地挖掘图像中未标记区域的潜在知识。

具体来说,部分标记的图像在模型训练时会给分类损失中的负样本损失引入噪声,因为图像中的某些对象可能没有被标记并被视为负样本。为了解决这个问题,我们提出了一种自适应权重损失函数,用来处理分类损失中的负样本损失。该方法基于每个负样本的预测背景分数来调整其对应的分类损失权重。这种方法可以有效地抑制模型对于具有低背景分数的负样本(通常是前景对象)的分类损失。7b803fb0-4f2a-11ee-a25d-92fbcf53809c.png定义如下:

7b8ca58e-4f2a-11ee-a25d-92fbcf53809c.png

7b803fb0-4f2a-11ee-a25d-92fbcf53809c.png 包含分类损失(前两项)和框回归损失(最后一项)。其中,i和j是一个小批量中图像和区域提案的索引,W代表着参与训练的区域提案数。7bb8d82a-4f2a-11ee-a25d-92fbcf53809c.png7bc5e448-4f2a-11ee-a25d-92fbcf53809c.png 是指示函数,用于表示图像是否是部分标记或完全标记。7bd47076-4f2a-11ee-a25d-92fbcf53809c.png用于表示区域提案是否是正样本(即包含对象)。为了实现稳健的学习,引入了参数7be40f86-4f2a-11ee-a25d-92fbcf53809c.png来降低背景对象的分类损失权重。

实验:

1、与其他主动学习方法比较

我们在四个遥感检测器(包括两个单阶段遥感检测器:KLD和SASM,以及两个双阶段遥感检测器:ReDet和Oriented R-CNN)以及两个数据集(DOTA-v1.0和DOTA-v2.0)上进行了性能比较。我们使用mAP作为比较指标。实验结果如表I所示。通过在多个检测器上进行的实验证明了所提出的MUS-CDB方法的有效性和通用性。该方法可以轻松地集成到各种目标检测框架中,并有助于提高不同应用中的目标检测模型性能。

7bf33eac-4f2a-11ee-a25d-92fbcf53809c.png

熵采样仅在采样过程中考虑目标级别的信息,而混合不确定性采样则综合考虑目标级别和图像级别的信息。为了验证混合采样的有效性,我们进行了两种采样方法的性能比较。

7c65085c-4f2a-11ee-a25d-92fbcf53809c.png

2、消融实验

为了证明我们提出的两个采样模块的有效性,我们进行了如下的消融实验。可以看到不确定性采样(MUS)和类别分布平衡采样(DUS)两个模块都可以有效提升模型性能。两者结合的二阶段采样可以更好的平衡采样结果的多样性和代表性。

7c908fae-4f2a-11ee-a25d-92fbcf53809c.png

我们还做消融实验证明了自适应损失函数的有效性。(1)代表使用默认的损失函数,(2)代表使用提出的改进损失。

7ca9d4b4-4f2a-11ee-a25d-92fbcf53809c.png

结论:

在本文中,我们提出了一种名为MUS-CDB的基于对象的主动学习方法,旨在减轻遥感目标检测数据注释所带来的巨大负担。我们在采样过程中设计了一种基于图像和对象的混合不确定性采样模块,以选择信息最丰富的实例进行标注。考虑到遥感图像数据集中的长尾问题,我们在采样过程中引入了类别偏好的策略,以促进所选对象的多样性。此外,我们还提出了一种针对部分标记数据的有效训练方法,以充分利用主动查询所获取的知识。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 遥感
    +关注

    关注

    0

    文章

    210

    浏览量

    16602
  • 目标检测
    +关注

    关注

    0

    文章

    185

    浏览量

    15455
  • 数据集
    +关注

    关注

    4

    文章

    1179

    浏览量

    24356

原文标题:遥感顶刊TGRS 2023!MUS-CDB:遥感目标检测中的主动标注的具有类分布平衡的混合不确定性采样

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    去嵌入和不确定性是否使用了正确的设置

    大家好,所以我遇到的问题是确定用于测试夹具纠错过程的适配器特征的不确定性。我们将使用适配器及其s2p文件对测试夹具的所有信号路径进行路径表征,然后移除以进行性能测试。这个过程在不确定性
    发表于 09-27 15:47

    E8364C PNA的不确定性和跟踪是什么?

    在中断后,我回到网络分析仪,并提出一个简单的问题。我正在阅读E8364C PNA的数据表,并遇到了E8364C PNA,不确定性和跟踪,但没有解释这些术语。我的猜测是,不确定性是与公认标准相比的误差
    发表于 10-18 17:03

    是否可以使用全双端口校准的S11不确定性来覆盖单端口校准的不确定性

    ,增强响应或响应),没有单端口校准。我们是否可以使用全双端口校准的S11不确定性来覆盖单端口校准的不确定性?或者我们是否必须执行全双端口校准来测量单端口设备?注意:查看各种Agilent VNA
    发表于 12-29 16:32

    N5531S TRFL不确定性

    我正在尝试使用N5531S(选择550传感器)测量接收器系统测量0到-130dBm的绝对功率水平,然后计算它的不确定性。安捷伦的应用笔记已经提到,不确定度可以使用公式+/-计算(功率计范围2-4
    发表于 02-19 15:40

    435B-K05输出不确定性

    不确定性。他们说,由于这是一个相对测量,我们在测量必须考虑的是435B-K05的输出不确定性。你怎么看?我们需要以这种或那种方式解决这个问题。 以上来自于谷歌翻译 以下为原文There is a
    发表于 08-02 14:33

    测试系统不确定性分析

    测试系统不确定性分析
    发表于 09-18 09:19

    5G网络架构的不确定性及其对承载网的影响

    端口数量将是池组化DU的10倍,传的成本将远高于池组化DU方式。  从承载网的成本考虑,DU池组化对带宽进行汇聚和收敛是非常有价值的。  3.4 CU的不确定性  CU容量的大小决定了CU的数量和部署
    发表于 12-03 16:03

    傅里叶变换与不确定性看了就知道

    傅里叶变换与不确定性
    发表于 12-30 06:41

    基于RFID技术的供应链管理项目存在哪些不确定性

    基于RFID技术的供应链管理项目存在哪些不确定性?项目嵌入的实物期权类型有哪几种?
    发表于 05-28 07:08

    运算放大器的开环电压增益有哪些不确定性

    运算放大器的开环电压增益的值有多大?运算放大器的开环电压增益有哪些不确定性?如何去解决?
    发表于 07-19 09:11

    如何使用椭球凸集模型实现多目标不确定性优化方法及其在车辆工程中的应用

    。与此同时,由于制造、安装和测量等误差的存在导致某些确定性的参数表现为不确定性变量,确定性优化方法在处理此类问题时会降低其准确性。
    发表于 01-16 08:00 9次下载
    如何使用椭球凸集模型实现多<b class='flag-5'>目标</b><b class='flag-5'>不确定性</b>优化方法及其在车辆工程中的应用

    深部目标姿态估计的不确定性量化研究

      FastUQ 是一种新的用于深部目标姿态估计的快速不确定性量化方法,具有高效、即插即用的特点,支持一类通用的姿态估计任务。这项研究在自主驾驶和一般自主性方面具有潜在的重大影响,包括
    的头像 发表于 04-26 16:18 969次阅读

    傅里叶变换的性质 波函数和海森堡不确定性原理

    在量子力学中,存在一系列关于共轭物理量(如位置和动量)的不等式,它们限制了同时测量这些成对物理量的精度,这些不等式中的任意一个都可以被称为不确定性原理(或是海森堡不确定性原理)。
    的头像 发表于 07-07 17:17 2016次阅读

    不确定性感知和姿态回归结合用于自动驾驶车辆定位

    提出了一种联合训练姿态估计和不确定性的方法,其具有可靠的不确定性估计和改进的训练稳定性
    的头像 发表于 01-30 11:30 1219次阅读

    海森堡不确定性原理的本质是什么呢?

    海森堡不确定性原理是德国物理学家维尔纳·海森堡于1927年提出的,它表明在量子力学里,粒子的位置和动量不可能同时被精确地测量
    的头像 发表于 04-03 10:03 922次阅读