0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

目标检测的后处理:NMS vs WBF

Dbwd_Imgtec 来源:未知 2023-07-26 10:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:Ching (Chingis)编译ronghuaiyang来源:AI公园

导读

对目标检测后处理中的NMS和WBF的解释和对比。目前,计算机视觉在许多地方都有重要的应用,例如自动驾驶汽车、监控系统和图像识别。计算机视觉的主要挑战之一是目标检测,它涉及识别和定位图像和视频中的目标。为了提高目标检测系统的性能,研究人员和从业者开发了各种技术,例如模型集成和测试时增强(TTA)。

模型集成是组合多个模型的预测以提高系统整体性能的过程。这可以通过对多个模型的预测求平均值,或使用更复杂的方法(如加权框融合 (WBF))来组合预测来完成。集成方法可以通过减少过拟合的影响并提高系统的鲁棒性来显著提高目标检测系统的性能。

测试时增强 (TTA) 是另一种用于提高目标检测系统性能的技术。它在测试期间将各种数据增强技术(例如旋转、缩放和翻转)应用于输入图像。这可以通过使系统对输入数据的微小变化更加不变来帮助提高系统的鲁棒性。TTA还可以通过提供额外的数据供检测器学习来帮助提高系统的性能。

在本文中,我们将探索和比较非最大抑制 (NMS) 和加权框融合 (WBF) 以提高目标检测系统的性能。
非最大值抑制

非极大值抑制 (NMS) 是一种后处理技术,用于去除目标检测器生成的重叠框。它常用于计算机视觉中的目标检测任务,例如人脸检测、目标跟踪以及图像和视频中的目标检测。

NMS 背后的基本思想是选择置信度得分最高的框,然后删除与其显著重叠的其他框。重复此过程,直到考虑了所有框。这有助于减少目标检测中的误报数量,因为目标检测器通常会生成对同一目标的多次检测。

计算两个边界框之间重叠的最常见方法是使用交并比 (IoU) 指标。

IoU(A,B) = (A ∩ B) / (A ∪ B)

其中 A 和 B 是边界框的面积,A ∩ B 是它们相交的面积。通常,为 IoU 度量设置一个阈值,任何 IoU 大于该阈值的边界框都被认为是重复检测并被删除。


加权框融合

加权框融合(WBF)是一种提高目标检测系统性能的强大技术。它是一种将多个边界框或感兴趣区域 (ROI) 的结果组合成一个更准确、更稳定的结果的方法。当使用多个模型或算法来检测图像或视频中的目标并且需要组合结果以提高整体性能时,该技术特别有用。

从本质上讲,WBF 是一种通过根据各种标准为每个边界框分配权重来组合多个目标检测器结果的方法。然后使用这些权重将边界框组合成一个更稳健的结果。

WBF算法的工作步骤如下:

  1. 每个模型的每个预测框(或通过 TTA 获得的预测)都会添加到单个列表 B 中,然后按置信度分数 C 的降序排序。
  2. 分别为框组和融合框实例化新的空列表 L 和 F。因此,列表L中的每个元素都是由于重叠而形成的一组框,而F中的每个位置仅包含一个框,即融合框。
  3. 在一个循环中迭代 B 中的预测框,并检查列表 F 中的匹配框(IoU > THR)。
  4. 如果未找到匹配项,则将 B 中的框添加到列表 L 和 F 的末尾作为新条目;继续进行 B 中的下一个框。
  5. 如果找到匹配,则将此框添加到列表L中与F中的匹配框对应的位置处。
  6. 使用框组 L[pos]中的所有内容重新计算 F[pos]中的框坐标和置信度得分。将置信度得分设置为 L[pos]中所有框的平均置信度。融合框的坐标是形成它的框的坐标的加权和,其中权重是对应框的置信度分数。最终 ROI = Σ (权重 i * ROIi) / Σ 权重 i。其中 ROIi 是第 i 个边界框,weighti 是分配给该边界框的权重,并且对正在考虑进行融合的所有边界框进行求和。最终的 ROI 是计算得出的组合边界框。
  7. 最后,重新调整 F 列表中的置信度分数:将其乘以组中的框数(定义为下面的 T),然后除以模型数 N。如果组中的框数量较少,则可能意味着只有少数模型可以预测它。因此,我们需要降低此类情况的置信度分数。
wKgZomToHbyAffQ2AAAVTLBpKgk243.png

WBF 可以成为提高目标检测系统性能的强大工具,并且越来越多地被广泛应用于自动驾驶汽车、监控系统和计算机视觉的许多其他领域。通过集成WBF技术,目标检测系统可以变得更加鲁棒和准确,并且即使在存在噪声和遮挡的情况下也可以表现得更好。


NMS vs WBFwKgZomToHbyADrUgAAC6PcAkzSs236.png加权框融合(WBF)和非极大值抑制(NMS)都是用于提高目标检测系统性能的技术。然而,它们的使用方式不同,并且具有不同的权衡。NMS 是一种后处理技术,用于删除目标检测器生成的重叠边界框。它的工作原理是选择置信度得分最高的边界框,然后删除与其显着重叠的任何其他边界框。重复此过程,直到考虑了所有边界框。NMS 是一种简单、快速且有效的方法,可减少目标检测中的误报数量。

另一方面,WBF 是一种用于组合多个边界框(或感兴趣区域)的技术,以产生更准确和稳定的结果。它通常用于使用多个模型或算法来检测图像或视频中的对象,并且需要组合结果以提高整体性能的情况。WBF 的工作原理是根据检测置信度、与其他边界框的重叠或其他标准等因素为每个边界框分配权重。然后使用这些权重将边界框组合成一个更稳健的结果。


实验评估2个不同模型的集成wKgZomToHbyAYfNSAADgRfdAtv8570.png表 1 显示了两个模型的 MS COCO 验证集的结果。使用四种不同的技术组合预测:NMS、Soft NMS、NMW 和 WBF。我们看到,在不同的设置下,WBF 方法明显优于其他方法,带来了更大的改进。测试时增强集成wKgZomToHbyALNiKAAB8aWbTHI4275.png

在上表中我们看到作者还提供了通过 TTA 组合预测的实验。他们使用在 COCO 数据集上训练的 EfficientNetB7 模型。对于 TTA,他们只采用水平翻转。同样,我们看到 WBF 的性能明显优于 NMS、Soft-NMS 和 NMW 等其他方法。


最后使用加权框融合 (WBF) 的动机是通过将多个边界框或感兴趣区域 (ROI) 的结果组合成一个更准确和稳定的结果来提高目标检测系统的性能。这在使用多个模型或算法来检测图像或视频中的目标并且需要组合结果以提高整体性能的情况下特别有用。使用 WBF 有益的原因有以下几个:
  • 鲁棒性:物体检测器可能会受到杂波、遮挡和背景噪声等因素的影响。WBF可以通过结合多个检测器的结果来帮助提高物体检测系统的鲁棒性,从而可以减少这些因素的影响。
  • 准确性:WBF 可以通过组合同一物体的多次检测来帮助提高物体检测系统的准确性。这在图像或视频中目标部分被遮挡或仅部分可见的情况下特别有用。
  • 稳定性:WBF 可以通过减少误报和漏报的影响来帮助提高目标检测系统的稳定性。这在感兴趣的物体很小或难以检测的情况下特别有用。
  • 灵活性:WBF可以与非极大值抑制(NMS)等其他技术结合使用,以进一步提高目标检测系统的性能。

英文原文:https://medium.com/deem-blogs/object-detection-explained-nms-vs-wbf-4526d58e7e34

END

欢迎加入Imagination GPU人工智能交流2群

wKgZomToHbyAIsRuAABN8aBfIqc747.jpg

入群请加小编微信:eetrend89

(添加请备注公司名和职称)

推荐阅读 对话Imagination中国区董事长:以GPU为支点加强软硬件协同,助力数字化转型 下载白皮书 | 通过Photon架构创建身临其境的图形体验

Imagination Technologies是一家总部位于英国的公司,致力于研发芯片和软件知识产权(IP),基于Imagination IP的产品已在全球数十亿人的电话、汽车、家庭和工作 场所中使用。获取更多物联网、智能穿戴、通信汽车电子、图形图像开发等前沿技术信息,欢迎关注 Imagination Tech!


原文标题:目标检测的后处理:NMS vs WBF

文章出处:【微信公众号:Imagination Tech】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • imagination
    +关注

    关注

    1

    文章

    617

    浏览量

    63083

原文标题:目标检测的后处理:NMS vs WBF

文章出处:【微信号:Imgtec,微信公众号:Imagination Tech】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    智锐通 CDM-2U01,为内窥镜 AI 后处理打造专属硬件平台

    智锐通 CDM-2U01,以精准设计回应医疗场景挑战,为内窥镜 AI 后处理系统提供稳定、高效、可嵌入的硬件支撑
    的头像 发表于 10-24 17:55 2181次阅读
    智锐通 CDM-2U01,为内窥镜 AI <b class='flag-5'>后处理</b>打造专属硬件平台

    【产品介绍】Altair HyperView用于仿真和CAE分析的后处理和数据可视化

    AltairHyperView通过用于仿真和CAE分析的高级后处理和数据可视化解锁工程洞察力AltairHyperView是用于高保真后处理的CAE分析软件。HyperView专为工程师打造,可促进
    的头像 发表于 09-19 17:02 523次阅读
    【产品介绍】Altair HyperView用于仿真和CAE分析的<b class='flag-5'>后处理</b>和数据可视化

    【BPI-CanMV-K230D-Zero开发板体验】AI 算法模型(人脸检测、躯干检测、车牌识别)

    self.nms_threshold = nms_threshold# NMS(非极大值抑制)阈值 self.anchors = anchors# 锚点数据,用于目标
    发表于 07-05 00:52

    【BPI-CanMV-K230D-Zero开发板体验】03 摄像头调用+AI人脸检测

    进行人脸检测,并在屏幕上实时标注检测结果。 整个流程包括: 摄像头图像采集; 图像预处理(padding、resize); 人脸检测模型推理; 后处
    发表于 07-01 22:43

    【BPI-CanMV-K230D-Zero开发板体验】人脸检测、手势识别、车牌识别

    =confidence_threshold # nms阈值 self.nms_threshold=nms_threshold # 锚框,目标检测
    发表于 06-30 20:44

    【BPI-CanMV-K230D-Zero开发板体验】人体关键点检测

    ]]) # 自定义当前任务的后处理 def postprocess(self,results): with ScopedTiming(\"postprocess\"
    发表于 06-28 13:18

    YOLOv8水果检测示例代码换成640输入图像出现目标框绘制错误的原因 ?

    \",中的best.kmodel替换为640输入图像,model_input_size=[640,640],就会出现目标检测目标框位置混乱,目标框的位置完全是错的,但是
    发表于 06-18 06:37

    基于LockAI视觉识别模块:C++目标检测

    (float score_threshold = 0.5, float nms_threshold = 0.3); 作用: 设置目标检测的置信度阈值和NMS阈值。 参数: scor
    发表于 06-06 14:43

    基于LockAI视觉识别模块:C++目标检测

    本文档基于瑞芯微RV1106的LockAI凌智视觉识别模块,通过C++语言做的目标检测实验。本文档展示了如何使用lockzhiner_vision_module::PaddleDet类进行目标
    的头像 发表于 06-06 13:56 605次阅读
    基于LockAI视觉识别模块:C++<b class='flag-5'>目标</b><b class='flag-5'>检测</b>

    COMSOL Multiphysics V4.x操作手册丛书后处理用户指南

    电子发烧友网站提供《COMSOL Multiphysics V4.x操作手册丛书后处理用户指南.pdf》资料免费下载
    发表于 04-22 15:36 1次下载

    labview调用yolo目标检测、分割、分类、obb

    labview调用yolo目标检测、分割、分类、obb、pose深度学习,支持CPU和GPU推理,32/64位labview均可使用。 (yolov5~yolov12)
    发表于 03-31 16:28

    轩辕智驾红外目标检测算法在汽车领域的应用

    在 AI 技术蓬勃发展的当下,目标检测算法取得了重大突破,其中红外目标检测算法更是在汽车行业掀起了波澜壮阔的变革,从根本上重塑着汽车的安全性能、驾驶体验与产业生态。
    的头像 发表于 03-27 15:55 734次阅读

    K230运行报错ValueError: array is too big,为什么?

    : 照着它给的解决方案加了一个判断条件, 虽然报错解决了, 但是又出现了画面左上角一直会绘制目标框,然后想正常检测目标又不会绘制出目标框的问题。 实际效果图片: 软硬件版本信息 实
    发表于 02-08 08:52

    选择DSP处理器的考虑因素(ADSP-2115 vs. TMS320C5x)

    电子发烧友网站提供《选择DSP处理器的考虑因素(ADSP-2115 vs. TMS320C5x).pdf》资料免费下载
    发表于 01-13 15:55 0次下载
    选择DSP<b class='flag-5'>处理</b>器的考虑因素(ADSP-2115 <b class='flag-5'>vs</b>. TMS320C5x)

    AI模型部署边缘设备的奇妙之旅:目标检测模型

    里面包含什么类别的目标。 (2)定位-Location:解决“在哪里?”的问题,即定位出这个目标的的位置。 (3)检测-Detection:解决“在哪里?是什么?”的问题,即定位出这个目标
    发表于 12-19 14:33