0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为什么mAP已成为目标检测的首选指标?

新机器视觉 来源:小白学视觉 2023-04-10 09:50 次阅读

计算机视觉界已经集中在度量 mAP 上,来比较目标检测系统的性能。在这篇文章中,我们将深入了解平均精度均值 (mAP) 是如何计算的,以及为什么 mAP 已成为目标检测的首选指标。

目标检测的快速概述

在我们考虑如何计算平均精度均值之前,我们将首先定义它正在测量的任务。目标检测模型试图识别图像中相关对象的存在,并将这些对象划分为相关类别。例如,在医学图像中,我们可能希望能够计算出血流中的红细胞 (RBC)、白细胞 (WBC) 和血小板的数量,为了自动执行此操作,我们需要训练一个对象检测模型来识别这些对象并对其进行正确分类。

f6de048e-d6e0-11ed-bfe3-dac502259ad0.gif

EfficientDet(绿色)与 YOLOv3(黄色)的示例输出

这两个模型都预测了图片中细胞周围的边界框,然后他们为每个边界框分配一个类。对于每个任务,网络都会对其预测的置信度进行建模,可以在此处看到我们共有三个类别(RBC、WBC 和Platelets)。

我们应该如何决定哪个模型更好?查看图像,看起来 EfficientDet(绿色)绘制了过多的 RBC 框,并且在图像边缘漏掉了一些细胞。这当然是从事物表面来看——但是我们可以相信图像和直觉吗?

如果我们能够直接量化每个模型在测试集中的图像、类和不同置信阈值下的表现,那就太好了。要理解平均精度均值,我们必须花一些时间来研究精度-召回曲线。

精确-召回曲线

精确是“模型猜测它正确猜测的次数?” 的一个衡量标准,召回是一种衡量“模型每次应该猜到的时候都猜到了吗?” 。假设一个具有有 10 个红细胞的图像,模型只找到这 10 个中正确标记的一个,因为“RBC”具有完美的精度(因为它做出的每一个猜测都是正确的),但并不同时具有完美的召回(仅发现十个 RBC 细胞中的一个)。

包含置信元素的模型可以通过调整进行预测所需的置信水平来权衡召回的精确度。也就是,如果模型处于避免假阳性(当细胞是白细胞时说明存在红细胞)比避免假阴性更重要的情况下,它可以将其置信阈值设置得更高,以鼓励模型只产生以降低其覆盖率(召回)为代价的高精度预测。

精度-召回曲线是绘制模型精度和以召回率作为模型置信阈值函数的过程。它是向下倾斜的,因为随着置信度的降低,会做出更多的预测,进而预测的准确性会降低(影像精确度)。

f7408046-d6e0-11ed-bfe3-dac502259ad0.png

一个 NLP 项目中不同模型的精度、召回率和置信度

随着模型越来越不稳定,曲线向下倾斜,如果模型具有向上倾斜的精度和召回曲线,则该模型的置信度估计可能存在问题。

人工智能研究人员偏向于指标,并且可以在单个指标中捕获整个精确召回曲线。第一个也是最常见的是 F1,它结合了精度和召回措施,以找到最佳置信度阈值,其中精度和召回率产生最高的 F1 值。接下来是 AUC(曲线下面积),它集成了精确性和召回曲线下的绘图量。

f761ce40-d6e0-11ed-bfe3-dac502259ad0.png

精确召回汇总指标图

最终的精确-召回曲线指标是平均精度 (AP),它被计算为在每个阈值处实现的精度的加权平均值,并将前一个阈值的召回率增加用作权重。

AUC 和 AP 都捕获了精确-召回曲线的整个形状,选择一个或另一个进行目标检测是一个选择问题,研究界已经将注意力集中在AP 的可解释性上。

通过并集上的交点测量正确性

目标检测系统根据边界框和类标签进行预测。

f77863e4-d6e0-11ed-bfe3-dac502259ad0.png

真正的目标检测图

在实践中,X1、X2、Y1、Y2 坐标中预测的边界框肯定会偏离地面真实标签(即使稍微偏离)。我们知道如果边界框预测是错误的类,我们应该将其视为不正确的,但是我们应该在哪里绘制边界框重叠的线?

Intersection over Union (IoU) 提供了一个度量来设置这个边界,与地面真实边界框重叠的预测边界框的数量除以两个边界框的总面积。

f78bab34-d6e0-11ed-bfe3-dac502259ad0.png 

真正对 IoU 指标的图形描述。

为 IoU 指标选择正确的单个阈值似乎是任意的,一位研究人员可能会证明 60% 的重叠是合理的,而另一位则认为 75% 似乎更合理,那么为什么不在一个指标中考虑所有阈值呢?

绘制mAP精度-召回曲线

为了计算 mAP,我们绘制了一系列具有不同难度级别的 IoU 阈值的精确-召回曲线。

f79ab746-d6e0-11ed-bfe3-dac502259ad0.png

我们真正绘制的 mAP 精确召回曲线图

在上图中,红色绘制的是对 IoU 的最高要求(可能是 90%),橙色线绘制的是对 IoU 的最低要求(可能是 10%),要绘制的线数通常由挑战设置。例如,COCO 挑战设置了十个不同的 IoU 阈值,从 0.5 开始,以 0.05 的步长增加到 0.95。

最后,我们为按类型划分的数据集绘制这些精度-召回曲线。

f7b243e8-d6e0-11ed-bfe3-dac502259ad0.png

由我们真正按对象类别划分的 mAP 图

该指标在所有 IoU 阈值上单独计算每个类的平均精度 (AP),然后该指标对所有类别的 mAP 进行平均以得出最终估计值。

在实验中使用平均精度均值(mAP)

我最近在一篇文章中使用了mAP,比较了最先进的EfficientDet和YOLOv3检测模型,我想看看哪个模型在识别血液中的细胞表现更好。

在对测试集中的每个图像进行推理后,我导入了一个 python 包来计算Colab笔记本中的mAP,结果如下!

EfficientDet 对细胞物体检测的评价:

78.59% = Platelets AP 
77.87% = RBC AP 
96.47% = WBC AP 
mAP = 84.31%

YOLOv3对细胞物体检测的评价:

72.15% = Platelets AP 
74.41% = RBC AP 
95.54% = WBC AP 
mAP = 80.70%

因此,与本文开头的单一推断图片相反,事实证明EfficientDet在建模细胞目标检测方面做得更好!我们还将注意该指标是按对象类划分的,这告诉我们,白细胞比血小板和红细胞更容易检测,这是有道理的,因为它们比其他细胞大得多,并且不同。

地图也经常被分成小、中、大对象,这有助于识别模型(和/或数据集)可能出现错误的地方。





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • MAP
    MAP
    +关注

    关注

    0

    文章

    47

    浏览量

    15029
  • 计算机视觉
    +关注

    关注

    8

    文章

    1601

    浏览量

    45639
  • AUC
    AUC
    +关注

    关注

    0

    文章

    9

    浏览量

    6610
  • nlp
    nlp
    +关注

    关注

    1

    文章

    464

    浏览量

    21830

原文标题:什么是目标检测中的平均精度均值(mAP)?

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    诺基亚没落 传成为收购目标

    诺基亚首席执行官斯蒂芬·埃洛普(Stephen Elop)否认了有关公司因在1个月内三次遭下调评级后,已成为收购目标的传闻
    发表于 06-10 09:25 1327次阅读

    电子信息产业已成为我国的国民经济支柱产业

      电子信息产业已成为我国的国民经济支柱产业,如今电子制造业的六大亮点:总体规模逐步扩大,企业实力增强;产业集中度不断提升;区域集中效应日益显现;结构调整取得较大的进展,高端产品在
    发表于 07-02 16:40

    公众WiFi服务已成为商家的“标配”

    已成为普通市民日常生活中,必不可少的一部分。商家纷纷提供免费wifi服务,应对顾客对无线上网的需求。既能够向顾客提供高质量的wifi免费服务,还能同时提升商家的品牌形象,通过短信关怀和营销、微信微博营销
    发表于 04-10 10:44

    雷达回波发生器的主要技术指标有什么?

    难以在完全真实的环境中进行。因此,通过数字模拟的方法真实地模拟雷达回波信号很有意义。雷达回波发生器是数字仿真技术和雷达技术相结合的产物,它通过仿真模拟的方法产生目标和环境信息的回波信号。利用这种回波信号对雷达信号处理机进行调试、分析和*估,已成为现代雷达信号处理机研制和生
    发表于 08-21 06:33

    目标检测和图像语义分割领域性能评价指标

    目标检测和图像语义分割领域的性能评价指标
    发表于 05-13 09:57

    一种基于Kalman滤波器的运动目标检测和跟踪算法

    视频或图像序列中的运动目标检测与跟踪已成为计算机视觉领域研究的重要方向之一。本文实现了视频序列中的运动目标检测,使用了背景差法和帧间差分法
    发表于 10-09 16:01 78次下载

    Alignment已成为Inphi公司在中国的授权厂家代表

    Alignment已成为Inphi公司在中国的授权厂家代表 Alignment (缘隆)宣布,Alignment已成为Inphi公司在中国的授权厂家代表。 Inphi公司是一家美国高速模拟半导体公司。
    发表于 09-07 07:04 1173次阅读

    区块链技术已成为电商的新风口

    区块链技术俨然已成为电商的新风口,其先进性也毋庸置疑,但也因为落地场景不多而显得不够“接地气”。而跨境电商与区块链技术能否有效进行结合、成功落地,业内认为还尚待观察。
    发表于 01-14 14:13 573次阅读

    中国移动已成为全球5G发展的核心力量

    “中国移动已成为全球5G发展的核心力量”水波表示,中国移动是5G需求目标的“定义者”、技术标准的“引领者”、端到端产业的“构建者”和5G赋能各行业的“开拓者”。
    发表于 11-07 08:54 1189次阅读

    海信75L9S激光电视成销冠 激光电视已成为消费者的大屏首选

    消费者正在“用脚投票”证明:激光电视已成为消费者的大屏首选。中怡康第49周(12月2-8日)监测数据显示,刚上市一周的海信75L9S全色激光电视,就登顶畅销榜首。而海信80L5也持续热销,稳坐年度第一位置。
    发表于 12-12 10:30 1734次阅读

    VPN已成为了攻击入口,安全访问该何去何从

    在过去十多年,SSL VPN已成为众多企业的IT基础设施。近期利用SSL VPN设备发起的APT攻击事件并非孤案。
    发表于 04-13 17:37 1977次阅读

    日经亚洲:中国已成为新兴技术制定国际规则的核心参与者

    日经亚洲评论称,中国已成为新兴技术制定国际规则的核心参与者,特别是5G。
    发表于 07-26 11:35 722次阅读

    天翼云领跑政务云驶入快车道,独特优势成为政府上云首选

    当前,上云已成为普遍共识。在众多的云服务商中,天翼云何以脱颖而出,成为政务上云的首选
    的头像 发表于 12-09 14:09 2238次阅读

    全屋定制已成为了年轻消费群体家装的首选

    随着80、90后承载家居市场主流消费群体,“个性”成为其中显眼的主题。近两年,全屋定制广为流传,个性时尚、省心省力、功能强大这些都是全屋定制的标签,全屋定制出现给很多家庭装修带来很多方便,也就成了
    的头像 发表于 01-21 10:09 1445次阅读

    深度学习与缺陷检测中常用的性能指标及计算方法

    在深度学习领域,通过以精度、召回率、平均精度均值(Mean Average Precision,mAP)和FPS等指标评价目标检测算法的有效性,在图像分割中则主要采用平均像素准确率、平
    的头像 发表于 08-02 10:08 5826次阅读