分类问题统计指标入门：混淆矩阵、召回、误检率、AUROC-电子发烧友网

缩写

AUC曲线下面积（Area Under the Curve）

AUROC接受者操作特征曲线下面积（Area Under the Receiver Operating Charac teristic curve）

大多数时候，AUC都是指AUROC，这是一个不好地做法，正如Marc Claesen指出的那样，AUC有歧义（可能是任何曲线），而AUROC没有歧义。

AUROC解释

AUROC有一些等价的解释：

均匀抽取的随机阳性样本排名在均匀抽取的随机阴性样本之前的期望

阳性样本排名在均匀抽取的随机阴性样本之前的期望比例

若排名在一个随机抽取的随机阴性样本前分割，期望的真阳性率

阴性样本排名在均匀抽取的随机阳性样本之后和期望比例

若排名在一个均匀抽取的随机阳性样本后分割，期望的假阳性率

更多阅读：如何推导AUROC的概率解释（https://stats.stackexchange.com/questions/180638/how-to-derive-the-probabilistic-interpretation-of-the-auc/277721#277721）

AUROC计算

假设我们有一个概率二元分类器，比如逻辑回归。

在讨论ROC曲线（接受者操作特征曲线）之前，我们需要理解混淆矩阵（confusion matrix）的概念。一个二元预测可能有4个结果：

我们预测0，而真实类别是0：这被称为真阴性（True Negative），即，我们正确预测类别为阴性（0）。比如，杀毒软件没有将一个无害的文件识别为病毒。

我们预测0，而真实类别是1：这被称为假阴性（False Negative），即，我们错误预测类别为阴性（0）。比如，杀毒软件没有识别出一个病毒。

我们预测1，而真实类别是0：这被称为假阳性（False Positive），即，我们错误预测类别为阳性（1）。比如，杀毒软件将一个无害的文件识别为病毒。

我们预测1，而真实类别是1：这被称为真阳性（True Positive），即，我们正确预测类别为阳性（1）。比如，杀毒软件正确地识别出一个病毒。

我们统计模型做出的预测，数一下这四种结果各自出现了多少次，可以得到混淆矩阵：

在上面的混淆矩阵示例中，在分类的50个数据点中，45个分类正确，5个分类错误。

当比较两个不同模型的时候，使用单一指标常常比使用多个指标更方便，下面我们基于混淆矩阵计算两个指标，之后我们会将这两个指标组合成一个：

真阳性率（TPR），即，灵敏度、命中率、召回，定义为TP/(TP+FN)。从直觉上说，这一指标对应被正确识别为阳性的阳性数据点占所有阳性数据点的比例。换句话说，TPR越高，我们遗漏的阳性数据点就越少。

假阳性率（FPR），即，误检率，定义为FP/(FP+TN)。从直觉上说，这一指标对应被误认为阳性的阴性数据点占所有阴性数据点的比例。换句话说，FPR越高，我们错误分类的阴性数据点就越多。

为了将FPR和TPR组合成一个指标，我们首先基于不同的阈值（例如：0.00; 0.01, 0.02, …, 1.00）计算前两个指标的逻辑回归，接着将它们绘制为一个图像，其中FPR值为横轴，TPR值为纵轴。得到的曲线为ROC曲线，我们考虑的指标是该曲线的AUC，称为AUROC。

下图展示了AUROC的图像：

在上图中，蓝色区域对应接受者操作特征曲线（AUROC）。对角虚线为随机预测器的ROC曲线：AUROC为0.5. 随机预测器通常用作基线，以检验模型是否有用。

如果你希望得到一些第一手的经验：

Python:http://scikit-learn.org/stable/auto_examples/model_selection/plot_roc.html

MATLAB:http://www.mathworks.com/help/stats/perfcurve.html

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

矩阵

矩阵

+关注

关注
0

文章
406

浏览量
34246

原文标题：分类问题统计指标入门：混淆矩阵、召回、误检率、AUROC

文章出处：【微信号：jqr_AI，微信公众号：论智】欢迎添加关注！文章转载请注明出处。

什么是误码率和误符号率？

什么是误码率和误符号率？它们用于衡量系统可靠性。误码率或误比特率(BER：bit error ratio)是指在经过系统传输后，送给用户的接收码流中发生错误的比特数占信源发送的原始码

发表于 05-30 15:52

电能质量指标运行合格率的标准

以及用户用电特性等因素，各项电能质量指标运行合格率标准为：（1）连续运行统计期（年、季、月）内电网频率合格率应不低于99.5%（2）连续运行统计

发表于 10-22 16:34

谁有关于 memory用LDPC 的校检矩阵？

请问哪位好心人有关于 memory用LDPC 的校检矩阵，可以给一个吗或者 code rate 是15/16的校检矩阵！！！！

发表于 10-11 19:17

使用单值评估指标进行优化

，又译作召回率）的组合并不能作为单值评估指标，因为它给出了两个值来对你的分类器进行评估。3多值评估指标提高了在算法之间进行优劣比较的难度，假

发表于 12-12 11:33

优化指标和满意度指标

下面我们来了解一下组合多个评估指标的另一种方法。假设你既关心学习算法的准确率（accuracy），又在意其运行时间（running time），请从下面的三个分类器中做出选择

发表于 12-13 13:58

清洗误标注的开发集和测试集样本

，则有可能在评估中引入偏差。假设你有 1000 个开发集样本，同时分类准确率为 98%，那么检查20 个误分类的样本会比检查 980 个正确分类

发表于 12-19 09:48

BPSK调制通信系统的误比特率仿真

clc a=round(rand(1,1000))%生成消息码f=2;%假设载波频率为2for SNR=0:15%给出信噪比范围，求误比特率 cp=[];%存储BPSK映射后的消息序列 sigma

发表于 10-15 15:47

EMC常见模块分类和测试选择矩阵？

EMC是什么？EMC常见模块分类和测试选择矩阵？

发表于 11-15 07:22

GPRS端到端测试办法及系统侧性能统计指标

GPRS端到端测试办法及系统侧性能统计指标:KPI理论值和期望值测试办法系统侧的性能统计指标 KPI 协议层统计项目

发表于 07-27 22:07 •29次下载

分类器的分类性能评价指标

通过具体应用实例，指出目前普遍使用的正确率和错误率评价指标在不平衡数据集、语义相关多分、不同错分代价等分类问题中评价分类器性能时存在的缺陷。为了解决这一问题，根据

发表于 05-03 16:51 •0次下载

一文搞懂深度学习的精密率和召回率

这里，我们将讨论两个重要的度量指标，即精度和召回率，它们被用于度量分类模型（即分类器）的性能。特别地，我们将讨论如何用这两个指标来评估决策树

发表于 07-06 09:54 •4126次阅读

基于区域RGB统计数据的图像粗分类方法

在构建交通标志颜色矩阵的基础上，进行颜色标准化映射分析，确定交通标志颜色标准化的映射目标颜色集合。分析交通标志三角中心区域和环状区域RGB分量统计数据，提出一种基于区域RGB统计数据的图像粗分

发表于 03-23 15:19 •17次下载

矩阵键盘-单片机入门课件

矩阵键盘-单片机入门课件

发表于 03-18 11:12 •0次下载

模型任务的评价指标体系

全面了解一个任务的评价指标体系。在二分类任务评价指标（上）中，我们已经学习了如何利用混淆矩阵来计算二分

发表于 01-11 10:10 •574次阅读

协方差矩阵和相关系数矩阵的转化

协方差矩阵和相关系数矩阵是统计学中常用的概念，在多变量统计分析中起着至关重要的作用。在进行多变量统计分析时，我们通常会涉及多个变量之间的关

发表于 01-12 11:02 •514次阅读

搜索历史

分类问题统计指标入门：混淆矩阵、召回、误检率、AUROC

评论

什么是误码率和误符号率？

电能质量指标运行合格率的标准

谁有关于 memory用LDPC 的校检矩阵？

使用单值评估指标进行优化

优化指标和满意度指标

清洗误标注的开发集和测试集样本

BPSK调制通信系统的误比特率仿真

EMC常见模块分类和测试选择矩阵？

GPRS端到端测试办法及系统侧性能统计指标

分类器的分类性能评价指标

一文搞懂深度学习的精密率和召回率

基于区域RGB统计数据的图像粗分类方法

矩阵键盘-单片机入门课件

模型任务的评价指标体系

协方差矩阵和相关系数矩阵的转化