0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

探索对抗训练的概率分布偏差:DPA双概率对齐的通用域自适的目标检测方法

智能感知与物联网技术研究所 来源:智能感知与物联网技术研 2025-01-15 13:45 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

论文标题:Universal Domain Adaptive Object Detection via Dual Probabilistic Alignment

论文地址:

https://arxiv.org/abs/2412.11443

代码地址:

https://github.com/WeitaiKang/SegVG/tree/main

▲ 图1. UniDAOD任务示例 (通用跨域目标检测)

目标检测作为计算机视觉领域的核心任务,在闭集场景中已经取得了显著的进展。然而,现有的方法通常假设类别集合是固定的,并依赖于大量的标注数据,这导致它们在处理跨域数据时,特别是在源域与目标域之间存在域偏移的情况下,泛化性能受限。例如,针对晴天数据训练的目标检测模型往往难以有效适应雾天或其他场景条件下的场景变化。

为了应对这一挑战,域自适应目标检测(Domain Adaptive Object Detection, DAOD)方法被提出。DAOD 的主要目标是通过将源域的有标签数据迁移到目标域的无标签数据上,从而缓解源域与目标域之间分布不一致所带来的性能下降问题。

在源域和目标域类别集合相同的前提下,DAOD 能够有效实现跨域迁移,并减少对大规模标注数据的依赖,从而降低了高昂的数据标注成本。然而,在开放世界场景中,源域与目标域之间可能会存在私有类别(即目标域包含源域未见过的类别)。因此,传统的 DAOD 方法受限于闭集假设,无法处理私有类别的域对齐问题,从而限制了其在开放世界场景中的应用。

为了解决这一问题,通用域自适应目标检测(Universal Domain Adaptive Object Detection, UniDAOD)方法被提出。UniDAOD 通过放宽类别集合的闭集假设,能够在没有类别先验信息的情况下实现源域与目标域的跨域对齐,从而适应包括闭集、部分集和开放集等多种场景。此方法显著提升了目标检测模型在开放世界中的鲁棒性和泛化能力,拓展了目标检测技术在更复杂和动态场景中的应用范围。

现有UniDAOD模型的不足

现有的通用域自适应目标检测(UniDAOD)方法的核心思想借鉴了域自适应目标检测(DAOD)和通用域自适应(UniDA)方法的范式。

具体而言,UniDAOD 方法结合了 DAOD 系列的基础对齐方法,包括实例对齐与全局对齐,并借鉴了 UniDA 系列方法来挖掘源域和目标域中的公共类别样本。在 UniDA 中,通过构建概率阈值机制,域判别器的概率层面能够筛选出公共类别的样本,从而实现源域与目标域的对齐。

因此,现有的 UniDAOD 方法的基本流程通常包括以下步骤:

首先,区分源域和目标域中的类别,并将其划分为公共类别和私有类别;

接着,去除私有类别,仅保留公共类别;

然后,针对这些公共类别的特征进行对齐,从而实现从开放集场景到闭集场景的转变。

在域判别器的设计上,UniDAOD 通过设定概率阈值来进一步区分源域和目标域中的公共类别与私有类别,从而达到更精确的对齐效果。

尽管 UniDAOD 方法在许多场景下表现良好,尤其是在处理从闭集场景到开放集场景的转变时,然而,直接使用 DAOD 和 UniDA 的方法结论,使得 UniDAOD 方法在开放世界场景下仍然存在次优化问题。具体来说,以下两个问题值得进一步探索:

1. 全局特征与实例特征是否都对齐公共类别特征?

2. 概率阈值是否在复杂的检测任务中对不同特征都有效?

▲ 图2. 域鉴别器中的概率的可视化。横轴为训练迭代次数(×100),纵轴为域判别器的概率。

为了探索上述问题,我们在图 2 中对域判别器的概率进行了可视化分析。图 2 为源域(Source Domain)和目标域(Target Domain)域鉴别器中的概率差异分析,分为全局级别(Global-level)和实例级别(Instance-level),在不同的域私有类别占比(25%、50%、75%)下进行评估。

在全局级别,图 2(a) 中展示了随着域私有类别比例的增加,源域与目标域之间的整体预测概率差异逐步扩大,表现为两条概率曲线之间的间距逐渐增大,反映出域私有类别比例的提高显著增强了域间的概率差异。

在实例级别图 2(b) 中,呈现了实例目标特征的概率在源域和目标域中的概率差异。与全局级别相比,实例级别的概率差异更加显著,即目标实例特征的概率差异在源域和目标域之间存在较大偏差。

此外,随着域私有类别比例的增加,实例级别的概率差异并未发生显著变化,而是保持相对稳定。全局级别的概率差异随着私有类别的增加而增加。

针对第一个问题,现有的域自适应目标检测(DAOD)方法假设域共享类别集是已知的,并且在进行域对齐时,假定全局特征和实例特征对齐的贡献是相同的。也就是说,全局特征和实例特征都应该对齐共享类别特征。然而,这与图 2 中的结论相悖:全局特征倾向于对齐域私有类别,而实例特征则更倾向于对齐域共享类别。

针对第二个问题,现有的 UniDA 方法通过使用阈值对样本进行筛选,但这依赖于稳定的概率分布。在图 2(a) 中,概率差异波动较大,导致阈值难以有效筛选样本;而在图 2(b) 中,概率变化相对稳定,因此阈值筛选样本效果较好。不同的特征在概率分布上是异构的。因此,现有基于阈值的范式难以在目标检测中有效适应不同特征下的概率分布。

为了解决上述两个问题,我们通过公式推导(见图 3)证明了在最小化标签函数期望的条件下,全局级别的特征倾向于对齐域私有类别,而实例级别的特征则倾向于对齐域共享类别。这一理论推导的结果与图 2 中的实验现象高度一致,进一步验证了我们模型假设的合理性。基于这一发现,接下来我们将引入双概率建模方法,以实现异构域分布下的样本采样和权重估计。

▲ 图3. UniDAOD的泛化误差上界

在全局特征层面,区域提议网络(RPN)构建了前景类别 和背景类别 的类别空间。 表示标签函数。因此,域共享和域私有类别标签函数的概率为:。

在实例特征层面,ROI头部(ROI-head)构建了前景域共享类别(c)、域私有类别( )和背景类别()的类别空间,其中类别数量 假设条件是大于 1 。因此,域共享和域私有类别标签函数的概率可以表示为:

我们通过分析 P 以估计当前特征标签函数的概率。全局特征层面最小化;

1. 当满足条件 (global-feature) (instance-feature) 时,域私有标签函数可以在全局特征层面最小化;

2. 当满足条件 (global-feature) (instance-feature) 时,域共享标签函数可以在实例特征层面最小化。

双概率建模

▲ 图4. 实例级别特征的概率分布与频率建模

通过图 3 中的理论分析,我们已经明确了全局特征与实例特征在对齐过程中的不同作用,并揭示了域私有类别与域共享类别之间的关系。在此基础上,双概率建模方法能够有效解决这些问题。

具体而言,我们通过对全局特征和实例特征进行正态分布建模,从而实现样本的采样与加权,进而更好地进行对齐。由于对抗训练中的数据概率分布近似正态分布,因此我们采用正态分布对全局特征和实例特征进行建模,以进行样本的采样与加权。

在图 4(a) 中,左图展示了多次对实例特征进行采样后的概率分布,结果表明这些特征的概率分布基本符合正态分布。因此,我们提出的一个直观思路是通过正态分布建模概率,并剔除那些不符合正态分布的样本。图 4(b) 展示了我们的方法:首先计算样本梯度的模长,并将其划分为不同的 bins,进而建模高斯分布。

可以看到,位于分布边缘之外的 bins 对应的样本是需要剔除的样本。所有这些 bins 的总和代表了特征空间中距离特征质心的采样半径,并且在对抗训练过程中,基于源域或目标域数据的高斯分布,该半径会动态调整。

▲ 图5. 全局级别特征的分布累计函数CDF

在全局特征层面,我们通过使用累计分布函数(Cumulative Distribution Function, CDF)来估计私有类别的分布,从而避免因过度域对齐而导致的负迁移问题。根据图 2 的结论,私有类别的增强概率通常偏离 0.5,因此在 CDF 上,私有类别的数量与其对应的分布值之间存在一定的关系。

为了避免直接将 CDF 作为权重进行对齐所可能引发的过度域对齐问题,我们计算源域和目标域的 CDF,并采用正则化方法对其进行调整。具体的 CDF 计算公式如下:

为了避免直接将 CDF 作为权重进行对齐所导致的过度域对齐,我们对源域和目标域的 CDF 值进行正则化调整。具体来说,我们设计了以下正则化形式作为域对齐的权重:

DPA模型框架

DPA 的模型设计思路主要来源于我们得到的公式(见图 3)。在图 6 中,DPA 包含三个定制模块:全局级别域私有对齐(GDPA)、实例级别域共享对齐(IDSA)和私有类别约束(PCC)。

为了最小化目标域的域共享类别的上限 ,DPA 包括 GDPA、IDSA 和 PCC,以优化方程:

中的项。GDPA 最小化域私有类别 域分布差异 ,适用于全局级特征;IDSA 最小化域共享类别域分布差异 ,适用于实例级特征。此外,PCC 最大化目标域的域私有类别风险误差 。

具体来说,GDPA 利用全局级别采样挖掘域私有类别样本并通过累积分布函数计算对齐权重来解决全局级别私有类别对齐。IDSA 利用实例级别采样挖掘域共享类别样本并通过高斯分布计算对齐权重来进行域共享类别域对齐以解决特征异质性问题。PCC 在特征和概率空间之间聚合域私有类别质心以缓解负迁移。

▲ 图6. 本文所提出的DPA 框架示意图

实验结果

我们在三个域自适应场景(开放集、部分集和封闭集)中,针对五个数据集对我们的DPA框架进行了评估。这些数据集包括:Foggy Cityscapes、Cityscapes、Pascal VOC、Clipart1k 和 Watercolor。

我们在三钟域自适应场景(开放集、部分集和封闭集)中,针对五个数据集对我们的DPA框架进行了评估。这些数据集包括:Foggy Cityscapes、Cityscapes、Pascal VOC、Clipart1k 和 Watercolor。

在开放集场景中,源域和目标域均包含共享类别和私有类别样本。我们引入了多个共享类别比例 来构建不同的共享类别比例基准,其中 和 分别表示源域和目标域的类别集合。在部分集场景中,源域的类别集合是目标域类别集合的子集,或者反之亦然。在封闭集场景中,源域和目标域的类别集合完全相同。

开放集场景中的性能结果

开放集场景中的性能结果

部分集场景中的性能结果

封闭集场景中的性能结果

消融实验

可视化分析

为了比较所提方法与现有 DAOD 和 UniDAOD 方法在正迁移和负迁移方面的性能,我们在图 7 中展示了 DAOD 和 UniDAOD 相对于仅使用源域模型的性能提升。

结果显示,DAOD 方法存在显著的负迁移,其中 DAF、MAF 和 HTCN 在类别 0 上的平均精度(AP)分别下降约 2%、4% 和 1%。

相比之下,UniDAOD 方法有效缓解了负迁移,CODE 和 DPA 在类别 4 上分别实现了约 3% 和 10% 的正迁移。这种基于类别的性能分析证明了所提方法能够有效应对负迁移并增强正迁移效果。

▲ 图7. 相较于Source-Only模型的类别性能提升(类别包括飞机、自行车、鸟、船和瓶子)。正迁移以绿色表示,负迁移以红色表示。

▲ 图8. 关于类别对齐的定性分析,以平均概率差为指标:(a) 全局特征对齐,(b) 实例特征对齐。横轴表示训练迭代次数(×100),纵轴为域判别器的概率。基准实验采用 Pascal VOC 到 Clipart1k 数据集()。

我们进一步分析了 DPA 框架在开放集对齐中的概率差表现。如图8(a) 所示,全局级别的平均概率差在 DPA 中更加显著,这突显了其在区分域私有类别方面的有效性。相比之下,图 8(b) 显示实例级别的平均概率差较小,这表明 DPA 能更好地对齐域共享类别。

此外,我们对全局域私有对齐进行了权重定量分析(见图 9)。随着域私有类别比例的增加,平均权重差也随之增大,这表明对抗训练通过权重调整,自适应地惩罚了与域私有类别相关的特征。

▲ 图9. 针对全局域私有特征的权重定量分析。横轴表示训练迭代次数(×100),纵轴表示源域和目标域的权重值。

总结

我们提出了一种用于通用域自适应目标检测的 DPA 框架,包含两种概率对齐方式。受理论视角启发,我们设计了 GDPA 模块,用于对齐全局私有样本,以及 IDSA 模块,用于对齐实例级域共享样本。为应对负迁移问题,我们引入了 PCC 模块,用于混淆私有类别的可辨识性。

大量实验表明,在开放集、部分集和封闭集场景中,DPA 框架显著优于现有的通用域自适应目标检测方法。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • DPA
    DPA
    +关注

    关注

    0

    文章

    32

    浏览量

    16138
  • 目标检测
    +关注

    关注

    0

    文章

    230

    浏览量

    16379

原文标题:AAAI 2025 | 探索对抗训练的概率分布偏差:DPA双概率对齐的通用域自适的目标检测方法

文章出处:【微信号:tyutcsplab,微信公众号:智能感知与物联网技术研究所】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    电能质量在线监测装置精度等级校准失败的概率高吗?

    电能质量在线监测装置精度等级校准失败的概率因设备等级、运行环境、维护水平等因素差异显著,无法用单一数值概括。以下是基于行业实践和技术标准的综合分析: 一、基础概率范围与核心影响因素 根据电力行业校准
    的头像 发表于 11-12 09:24 535次阅读

    设备出现通信问题的概率大吗?

    设备出现通信问题的概率并非固定值,而是受 “通信链路类型(有线 / 无线)、应用场景(工业 / 民用)、设备老化程度、设计安装规范度、干扰源强度” 等多因素影响,整体呈现 “工业场景高于民用
    的头像 发表于 09-25 14:08 401次阅读
    设备出现通信问题的<b class='flag-5'>概率</b>大吗?

    瑞芯微3576,使用FP16模型进行训练,瑞芯微官方接口概率崩溃

    corrupted。之前使用INT8的模型没出现过这个错误。使用的是model_zoo中的aarch64下的librknnrt.so。未崩溃时能正常检测,可以确认崩溃前没有内存泄漏或者不足的情况
    发表于 07-17 13:25

    WLE5CBU6在STOP2模式下,概率性不能通过RTC闹钟中断唤醒,为什么?

    已知闹钟中断优先级最高,跑RTC测试时,挂测会出现概率性的无法唤醒MCU
    发表于 06-16 06:34

    基于LockAI视觉识别模块:C++目标检测

    检测是计算机视觉领域中的一个关键任务,它不仅需要识别图像中存在哪些对象,还需要定位这些对象的位置。具体来说,目标检测算法会输出每个检测到的对象的边界框(Bounding Box)以及其
    发表于 06-06 14:43

    伺服电机编码器与转子磁极相位对齐方法

    永磁交流伺服电机的编码器相位为何要与转子磁极相位对齐 其唯一目的就是要达成矢量控制的目标,使 d 轴励磁分量和 q 轴出力分量解耦,令永磁交流伺服电机定子绕组产生的电磁场始终正交于转子永磁场,从而
    发表于 05-14 16:00

    芯片软错误概率探究:基于汽车芯片安全设计视角

    摘要: 本文深入剖析了芯片软错误概率问题,结合 AEC-Q100 与 IEC61508 标准,以 130 纳米工艺 1Mbit RAM 芯片为例阐述其软错误概率,探讨汽车芯片安全等级划分及软错误
    的头像 发表于 04-30 16:35 687次阅读
    芯片软错误<b class='flag-5'>概率</b>探究:基于汽车芯片安全设计视角

    DLPC3436+PAD3000开机会有3%的概率无法正常启动,LED没有点亮,无投影怎么解决?

    DLPC3436+PAD3000开机会有3%的概率无法正常启动,LED没有点亮,无投影;加大PAD3000输入电容,问题还在;
    发表于 02-21 06:05

    Orcad绘制原理图的元器件对齐方法

    在使用Orcad软件绘制原理图的时候,为了使原理图绘制的美观一些,有时候也希望像PCB设计一样,将所有的器件都进行对齐,这里我们给大家介绍下,原理图器件对齐方法,方便大家在原理图设计的时候也可以将元器件进行
    的头像 发表于 02-07 10:33 2588次阅读
    Orcad绘制原理图的元器件<b class='flag-5'>对齐</b><b class='flag-5'>方法</b>

    大连理工提出基于Wasserstein距离(WD)的知识蒸馏方法

    的机制,应用于中间层蒸馏时存在问题,其无法处理不重叠的分布且无法感知底层流形的几何结构。 为了解决这些问题,大连理工大学的研究人员提出了一种基于 Wasserstein 距离(WD)的知识蒸馏方法。所提出方法在图像分类和
    的头像 发表于 01-21 09:45 1019次阅读

    LM98640是给一个过满度的正弦波采集大量全码数据进行概率分布计算DNL还是给个斜坡波进行静态测试?

    是给一个过满度的正弦波采集大量全码数据进行概率分布计算DNL还是给个斜坡波进行静态测试? 我用的正弦波测试结果怎么使两头各有一大坨黑的?
    发表于 12-25 07:11

    ADC0XD1520RB输出信号有概率出现尖峰杂波怎么解决?

    ),输入信号交流耦合,发现输出信号有概率出现尖峰杂波(大概几百K个采样点会出现一组),而且大多数为单点杂波。信号源没有问题,用示波器看一切正常。原厂的评估板,原厂的驱动,信号源是信号发生器,不应该有问题,有没有人出现过类似情况,请教解决方法。 (最后一个是100ns的脉冲
    发表于 12-23 07:00

    一文解析LOPA应用-点火概率估算的策略与实践

    收到关于点火概率确定方法的咨询,因其评估方法众多且难获全员认同,成为 LOPA 分析的痛点和难点。本文将探讨 LOPA 分析时点火概率的估算方法
    的头像 发表于 12-21 14:46 2033次阅读
    一文解析LOPA应用-点火<b class='flag-5'>概率</b>估算的策略与实践

    AI模型部署边缘设备的奇妙之旅:目标检测模型

    并非易事,它涉及到从选择合适的算法架构到针对特定硬件平台进行优化等一系列复杂的工作。 接下来,我们将详细介绍如何在资源受限的边缘设备上成功部署目标检测模型,探索其背后的原理和技术,并讨论解决该领域内常见
    发表于 12-19 14:33

    TPS62170输入12V输出4.5V发现烧坏的概率好大,为什么?

    我用TI的一款降压芯片 TPS62170 输入12V输出4.5V发现烧坏的概率好大,找不到原因。另外同时用这款芯片做的5V转3.3V就没有这种情况。
    发表于 12-16 07:06