0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

目标检测的后处理:NMS vs WBF

颖脉Imgtec 2023-07-31 23:44 次阅读

作者:Ching (Chingis)编译:ronghuaiyang来源:AI公园

导读

对目标检测后处理中的NMS和WBF的解释和对比。目前,计算机视觉在许多地方都有重要的应用,例如自动驾驶汽车、监控系统和图像识别。计算机视觉的主要挑战之一是目标检测,它涉及识别和定位图像和视频中的目标。为了提高目标检测系统的性能,研究人员和从业者开发了各种技术,例如模型集成和测试时增强(TTA)。

模型集成是组合多个模型的预测以提高系统整体性能的过程。这可以通过对多个模型的预测求平均值,或使用更复杂的方法(如加权框融合 (WBF))来组合预测来完成。集成方法可以通过减少过拟合的影响并提高系统的鲁棒性来显著提高目标检测系统的性能。

测试时增强 (TTA) 是另一种用于提高目标检测系统性能的技术。它在测试期间将各种数据增强技术(例如旋转、缩放和翻转)应用于输入图像。这可以通过使系统对输入数据的微小变化更加不变来帮助提高系统的鲁棒性。TTA还可以通过提供额外的数据供检测器学习来帮助提高系统的性能。

在本文中,我们将探索和比较非最大抑制 (NMS) 和加权框融合 (WBF) 以提高目标检测系统的性能。


非最大值抑制

非极大值抑制 (NMS) 是一种后处理技术,用于去除目标检测器生成的重叠框。它常用于计算机视觉中的目标检测任务,例如人脸检测、目标跟踪以及图像和视频中的目标检测。

NMS 背后的基本思想是选择置信度得分最高的框,然后删除与其显著重叠的其他框。重复此过程,直到考虑了所有框。这有助于减少目标检测中的误报数量,因为目标检测器通常会生成对同一目标的多次检测。

计算两个边界框之间重叠的最常见方法是使用交并比 (IoU) 指标。

IoU(A,B) = (A ∩ B) / (A ∪ B)

其中 A 和 B 是边界框的面积,A ∩ B 是它们相交的面积。通常,为 IoU 度量设置一个阈值,任何 IoU 大于该阈值的边界框都被认为是重复检测并被删除。


加权框融合

加权框融合(WBF)是一种提高目标检测系统性能的强大技术。它是一种将多个边界框或感兴趣区域 (ROI) 的结果组合成一个更准确、更稳定的结果的方法。当使用多个模型或算法来检测图像或视频中的目标并且需要组合结果以提高整体性能时,该技术特别有用。

从本质上讲,WBF 是一种通过根据各种标准为每个边界框分配权重来组合多个目标检测器结果的方法。然后使用这些权重将边界框组合成一个更稳健的结果。

WBF算法的工作步骤如下:

  1. 每个模型的每个预测框(或通过 TTA 获得的预测)都会添加到单个列表 B 中,然后按置信度分数 C 的降序排序。
  2. 分别为框组和融合框实例化新的空列表 L 和 F。因此,列表L中的每个元素都是由于重叠而形成的一组框,而F中的每个位置仅包含一个框,即融合框。
  3. 在一个循环中迭代 B 中的预测框,并检查列表 F 中的匹配框(IoU > THR)。
  4. 如果未找到匹配项,则将 B 中的框添加到列表 L 和 F 的末尾作为新条目;继续进行 B 中的下一个框。
  5. 如果找到匹配,则将此框添加到列表L中与F中的匹配框对应的位置处。
  6. 使用框组 L[pos]中的所有内容重新计算 F[pos]中的框坐标和置信度得分。将置信度得分设置为 L[pos]中所有框的平均置信度。融合框的坐标是形成它的框的坐标的加权和,其中权重是对应框的置信度分数。最终 ROI = Σ (权重 i * ROIi) / Σ 权重 i。其中 ROIi 是第 i 个边界框,weighti 是分配给该边界框的权重,并且对正在考虑进行融合的所有边界框进行求和。最终的 ROI 是计算得出的组合边界框。
  7. 最后,重新调整 F 列表中的置信度分数:将其乘以组中的框数(定义为下面的 T),然后除以模型数 N。如果组中的框数量较少,则可能意味着只有少数模型可以预测它。因此,我们需要降低此类情况的置信度分数。

1b724aa4-2fb9-11ee-bbcf-dac502259ad0.png

WBF 可以成为提高目标检测系统性能的强大工具,并且越来越多地被广泛应用于自动驾驶汽车、监控系统和计算机视觉的许多其他领域。通过集成WBF技术,目标检测系统可以变得更加鲁棒和准确,并且即使在存在噪声和遮挡的情况下也可以表现得更好。


NMS vs WBF1b7efa38-2fb9-11ee-bbcf-dac502259ad0.png加权框融合(WBF)和非极大值抑制(NMS)都是用于提高目标检测系统性能的技术。然而,它们的使用方式不同,并且具有不同的权衡。NMS 是一种后处理技术,用于删除目标检测器生成的重叠边界框。它的工作原理是选择置信度得分最高的边界框,然后删除与其显着重叠的任何其他边界框。重复此过程,直到考虑了所有边界框。NMS 是一种简单、快速且有效的方法,可减少目标检测中的误报数量。

另一方面,WBF 是一种用于组合多个边界框(或感兴趣区域)的技术,以产生更准确和稳定的结果。它通常用于使用多个模型或算法来检测图像或视频中的对象,并且需要组合结果以提高整体性能的情况。WBF 的工作原理是根据检测置信度、与其他边界框的重叠或其他标准等因素为每个边界框分配权重。然后使用这些权重将边界框组合成一个更稳健的结果。


实验评估2个不同模型的集成1b8c9364-2fb9-11ee-bbcf-dac502259ad0.png表 1 显示了两个模型的 MS COCO 验证集的结果。使用四种不同的技术组合预测:NMS、Soft NMS、NMW 和 WBF。我们看到,在不同的设置下,WBF 方法明显优于其他方法,带来了更大的改进。测试时增强集成1bac2206-2fb9-11ee-bbcf-dac502259ad0.png

在上表中我们看到作者还提供了通过 TTA 组合预测的实验。他们使用在 COCO 数据集上训练的 EfficientNetB7 模型。对于 TTA,他们只采用水平翻转。同样,我们看到 WBF 的性能明显优于 NMS、Soft-NMS 和 NMW 等其他方法。


最后使用加权框融合 (WBF) 的动机是通过将多个边界框或感兴趣区域 (ROI) 的结果组合成一个更准确和稳定的结果来提高目标检测系统的性能。这在使用多个模型或算法来检测图像或视频中的目标并且需要组合结果以提高整体性能的情况下特别有用。使用 WBF 有益的原因有以下几个:

  • 鲁棒性:物体检测器可能会受到杂波、遮挡和背景噪声等因素的影响。WBF可以通过结合多个检测器的结果来帮助提高物体检测系统的鲁棒性,从而可以减少这些因素的影响。
  • 准确性:WBF 可以通过组合同一物体的多次检测来帮助提高物体检测系统的准确性。这在图像或视频中目标部分被遮挡或仅部分可见的情况下特别有用。
  • 稳定性:WBF 可以通过减少误报和漏报的影响来帮助提高目标检测系统的稳定性。这在感兴趣的物体很小或难以检测的情况下特别有用。

灵活性:WBF可以与非极大值抑制(NMS)等其他技术结合使用,以进一步提高目标检测系统的性能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 测试
    +关注

    关注

    8

    文章

    4448

    浏览量

    125123
  • 检测
    +关注

    关注

    5

    文章

    4083

    浏览量

    90745
  • AI
    AI
    +关注

    关注

    87

    文章

    26443

    浏览量

    264045
收藏 人收藏

    评论

    相关推荐

    开发者手机 AI - 目标识别 demo

    %。 Init、DeInit 为Native的初始化和去初始化实现,主要对模型进行创建、编译以及销毁。 Process为异步NAPI接口,主要完成目标识别的功能。实现包括前处理、推理和后处理3个部分。前
    发表于 04-11 16:14

    TLE9850x控制器能否通过设置阈值将ADC1后处理通道0用于ADC1-CH13?

    我目前使用的是 TLE9850x 控制器,能否通过设置阈值将 ADC1 后处理通道 0 用于 ADC1-CH13?
    发表于 03-05 08:04

    Canny双阈值边缘检测和弱边缘连接详解

    在上一篇FPGA图像处理--Canny边缘检测(一)里介绍了Canny边缘检测NMS计算,这里就介绍一下双阈值边缘检测和弱边缘连接。
    的头像 发表于 11-18 17:07 1005次阅读

    基于LPC2214+VS1003的音频处理方案

    电子发烧友网站提供《基于LPC2214+VS1003的音频处理方案.rar》资料免费下载
    发表于 11-10 10:47 0次下载
    基于LPC2214+<b class='flag-5'>VS</b>1003的音频<b class='flag-5'>处理</b>方案

    用于视觉检测的线扫远心镜头VS-LTC系列

    VS-LTC 系列线扫远心镜头,支持大靶面芯片相机;适用于半导体,基板以及 Mini LED等行业的视觉检测
    的头像 发表于 09-12 16:31 839次阅读
    用于视觉<b class='flag-5'>检测</b>的线扫远心镜头<b class='flag-5'>VS</b>-LTC系列

    MATLAB的行人目标检测的方法有哪些?

    MATLAB的行人目标检测的方法有哪些,就是主要的方法,基于背景的,基于目标的,还有其他的。都有哪些?
    发表于 08-23 16:30

    目标检测后处理NMS vs WBF

    作者:Ching (Chingis) 编译 : ronghuaiyang 来源: AI公园 导读 对目标检测后处理中的NMSWBF的解释和
    的头像 发表于 07-26 10:25 440次阅读
    <b class='flag-5'>目标</b><b class='flag-5'>检测</b>的<b class='flag-5'>后处理</b>:<b class='flag-5'>NMS</b> <b class='flag-5'>vs</b> <b class='flag-5'>WBF</b>

    如何区分图像分类和目标检测技术

    目标检测的问题定义是确定目标在给定图像中的位置,如目标定位,以及每个目标属于哪个类别,即目标分类
    发表于 07-11 12:50 348次阅读

    基于 FPGA 的目标检测网络加速电路设计

    ; Function Description 本项目针对DAC2019 System Design Contest测试集,计划采用PYNQ-Z2开发板加速目标 检测网络,综合考虑数据访问、存储、并行计算等问题进行优化处理
    发表于 06-20 19:45

    全面介绍小目标检测的各种解决方案

    目标检测广义是指在图像中检测和识别尺寸较小、面积较小的目标物体。通常来说,小目标的定义取决于具体的应用场景,但一般可以认为小
    发表于 06-19 12:32 2473次阅读
    全面介绍小<b class='flag-5'>目标</b><b class='flag-5'>检测</b>的各种解决方案

    VS-05-C-2-0双轴传感器的主要应用

    轮辋检测仪采用VS-05-C-2-0倾角传感器,单片机处理系统和简单稳定的机械结构,可以方便、准确地连续快速测量几何状态参数,实现参数化。比如轮辋的高度和轮辋的厚度,数字化VS
    的头像 发表于 06-08 15:38 285次阅读
    <b class='flag-5'>VS</b>-05-C-2-0双轴传感器的主要应用

    ARP2600滞后处理器克隆开源分享

    电子发烧友网站提供《ARP2600滞后处理器克隆开源分享.zip》资料免费下载
    发表于 06-08 15:09 0次下载
    ARP2600滞<b class='flag-5'>后处理</b>器克隆开源分享

    Mastercam后处理机器定义说明

    Mastercam后处理在开发5轴后处理的时候,始终绕不开的一个就是机器的定义,由于机器的结构种类繁多,各个厂家生产不同结构的5轴机器,那么在开发5轴后处理时,比如要定义机器各轴的结构类型,否则
    的头像 发表于 05-26 17:40 2648次阅读
    Mastercam<b class='flag-5'>后处理</b>机器定义说明

    目标检测的相关知识

    目标检测共有以下四个核心问题:(1)目标可能出现在图像的任何位置;(2)目标有各种不同的大小;(3)目标有各种不同的形状;(4)光照、遮挡等
    的头像 发表于 05-22 09:43 912次阅读
    <b class='flag-5'>目标</b><b class='flag-5'>检测</b>的相关知识

    「顾大局,识大体」,Nullmax BEV障碍物检测的超级视野

    一方面,传统算法普遍首先基于深度学习在图像视角完成目标检测,然后通过复杂的后处理将其转换至三维BEV视角。这不仅让整个流程变得复杂,消耗更多算力,而且对场景的应对能力也存在不足。
    的头像 发表于 05-18 14:43 427次阅读
    「顾大局,识大体」,Nullmax BEV障碍物<b class='flag-5'>检测</b>的超级视野