0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于有效样本的类别不平衡损失

自然语言处理爱好者 来源:AI公园 作者:Sik-Ho Tsang 2021-08-16 11:14 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

导读

使用每个类的有效样本数量来重新为每个类的Loss分配权重,效果优于RetinaNet中的Focal Loss。

本文综述了康奈尔大学、康奈尔科技、谷歌Brain和Alphabet公司的基于有效样本数的类平衡损失(CB损失)。在本文中,设计了一种重新加权的方案,利用每个类的有效样本数来重新平衡损失,称为类别平衡损失。

1. 类别平衡问题

假设有像上面那样的不平衡的类。head:对于索引小的类,这些类有较多的样本。Tail:对于大索引的类,这些类的样本数量较少。黑色实线:直接在这些样本上训练的模型偏向于优势类。红色虚线:通过反向类频率来重新加权损失可能会在具有高类不平衡的真实数据上产生较差的性能。蓝虚线:设计了一个类平衡项,通过反向有效样本数来重新加权损失。

2. 有效样本数量

2.1. 定义

6f483fc4-fd9a-11eb-9bcf-12bb97331649.png

数据间信息重叠,左:特征空间S,中:1个样本数据的单位体积,右:数据间信息重叠

直觉上,数据越多越好。但是,由于数据之间存在信息重叠,随着样本数量的增加,模型从数据中提取的边际效益会减少

左:给定一个类,将该类的特征空间中所有可能数据的集合表示为S。假设S的体积为N且N≥1。中:S子集中的每个样本的单位体积为1,可能与其他样本重叠。Right:从S中随机抽取每个子集,覆盖整个S集合。采样的数据越多,S的覆盖率就越好。期望的采样数据总量随着样本数量的增加而增加,以N为界。

因此,将有效样本数定义为样本的期望体积。

这个想法是通过使用一个类的更多数据点来捕捉边际效益的递减。由于现实世界数据之间的内在相似性,随着样本数量的增加,新添加的样本极有可能是现有样本的近重复。另外,cnn是用大量的数据增广来训练的,所有的增广实例也被认为与原始实例相同。对于一个类,N可以看作是唯一原型的数量。

2.2. 数学公式

En表示样本的有效数量(期望体积)。为了简化问题,不考虑部分重叠的情况。也就是说,一个新采样的数据点只能以两种方式与之前的采样数据交互:完全在之前的采样数据集中,概率为p,或完全在原来的数据集之外,的概率为1- p。

有效数字:En = (1−β^n)/(1−β),其中,β = (N− 1)/N,这个命题可以用数学归纳法证明。当E1 = 1时,不存在重叠,E1 =(1−β^1)/(1−β) = 1成立。假设已经有n−1个样本,并且即将对第n个样本进行采样,现在先前采样数据的期望体积为En −1,而新采样的数据点与先前采样点重叠的概率为 p = E(n−1)/N。因此,第n个实例采样后的期望体积为:

6f8b26a4-fd9a-11eb-9bcf-12bb97331649.png

此时:

我们有:

6fc6da32-fd9a-11eb-9bcf-12bb97331649.png

上述命题表明有效样本数是n的指数函数。超参数β∈[0,1)控制En随着n的增长有多快。

3. 类别平衡 Loss (CB Loss)

类别平衡(CB)loss可以写成:

6fe31a80-fd9a-11eb-9bcf-12bb97331649.png

其中,ny是类别y的ground-truth的数量。β = 0对应没有重新加权, β → 1对应于用反向频率进行加权。

提出的有效样本数的新概念使我们能够使用一个超参数β来平滑地调整无重权和反向类频率重权之间的类平衡项。

所提出的类平衡项是模型不可知的和损失不可知的,因为它独立于损失函数L和预测类概率p的选择。

3.1. 类别平衡的 Softmax 交叉熵损失

给定一个标号为y的样本,该样本的softmax交叉熵(CE)损失记为:

6ff9c546-fd9a-11eb-9bcf-12bb97331649.png

假设类y有ny个训练样本,类平衡(CB)softmax交叉熵损失为:

70271b54-fd9a-11eb-9bcf-12bb97331649.png

3.2. 类别平衡的 Sigmoid 交叉熵损失

当对多类问题使用sigmoid函数时,网络的每个输出都执行一个one-vs-all分类,以预测目标类在其他类中的概率。在这种情况下,Sigmoid不假定类之间的互斥性。由于每个类都被认为是独立的,并且有自己的预测器,所以sigmoid将单标签分类和多标签预测统一起来。这是一个很好的属性,因为现实世界的数据通常有多个语义标签。sigmoid交叉熵(CE)损失可以写成:

7032cd82-fd9a-11eb-9bcf-12bb97331649.png

类平衡(CB) sigmoid交叉熵损失为:

709d0724-fd9a-11eb-9bcf-12bb97331649.png

3.3. 类别平衡 Focal Loss

Focal loss (FL)是在RetinaNet中提出的,可以减少分类很好的样本的损失,聚焦于困难的样本。

类别平衡的 (CB) Focal Loss为:

70d554f8-fd9a-11eb-9bcf-12bb97331649.png

4. 实验结果

4.1. 数据集

试验了CIFAR-10和CIFAR-100的5个不平衡系数分别为10、20、50、100和200的长尾版本。iNaturalist 和ILSVRC是天然的类别不平衡数据集。

上面显示了每个类具有不同不平衡因素的图像数量。

4.2. CIFAR 数据集

loss类型的超参数搜索空间为{softmax, sigmoid, focal}, [focal loss]的超参数搜索空间为β∈{0.9,0.99,0.999,0.9999},γ∈{0.5,1.0,2.0}。在CIFAR-10上,最佳的β一致为0.9999。但在CIFAR-100上,不同不平衡因子的数据集往往有不同且较小的最优β。

718c16f2-fd9a-11eb-9bcf-12bb97331649.png

有和没有类平衡项时的分类错误率

在CIFAR-10上,根据β = 0.9999重新加权后,有效样本数与样本数接近。这意味着CIFAR-10的最佳重权策略与逆类频率重权类似。在CIFAR-100上,使用较大的β的性能较差,这表明用逆类频率重新加权不是一个明智的选择,需要一个更小的β,具有更平滑的跨类权重。例如,一个特定鸟类物种的独特原型数量应该小于一个一般鸟类类的独特原型数量。由于CIFAR-100中的类比CIFAR-10更细粒度,因此CIFAR-100的N比CIFAR-10小。

4.3. 大规模数据集

721263ba-fd9a-11eb-9bcf-12bb97331649.png

在所有数据集验证集上,使用不同损失函数训练的大规模数据集上的Top-1和Top-5分类错误率

使用了类平衡的Focal Loss,因为它具有更大的灵活性,并且发现β = 0.999和γ = 0.5在所有数据集上都获得了合理的良好的性能。值得注意的是,使用了类别平衡的Focal Loss来代替Softmax交叉熵,ResNet-50能够达到和ResNet-152相应的性能。

以上数字显示类平衡的Focal Loss损失经过60个epochs的训练后,开始显示其优势。

英文原文:https://medium.com/nerd-for-tech/review-cb-loss-class-balanced-loss-based-on-effective-number-of-samples-image-classification-3056a1a1a001

作者:Sik-Ho Tsang

编译:ronghuaiyang(AI公园)

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6271

    浏览量

    112183
  • 数据集
    +关注

    关注

    4

    文章

    1242

    浏览量

    26298
  • cnn
    cnn
    +关注

    关注

    3

    文章

    356

    浏览量

    23588

原文标题:CB Loss:基于有效样本的类别不平衡损失

文章出处:【微信号:NLP_lover,微信公众号:自然语言处理爱好者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    绕线式电机转子三相不平衡的主要原因

    绕线式电机转子三相不平衡是电机运行中常见的故障现象,可能导致振动加剧、温升异常甚至烧毁绕组。这种现象的成因复杂多样,需从设计、制造、安装、运行维护等多方面综合分析。
    的头像 发表于 03-02 17:24 911次阅读

    高精度CT在测量电流不平衡度中具体是如何工作的?

    高精度 CT(电流互感器)在电流不平衡度测量中,是通过 电磁感应实现大电流信号的精准变换 ,并依托自身优异的精度、一致性和抗干扰特性,为后续不平衡度计算提供可靠原始数据,其具体工作流程可分为 5 个
    的头像 发表于 12-05 16:37 1078次阅读
    高精度CT在测量电流<b class='flag-5'>不平衡</b>度中具体是如何工作的?

    电能质量在线监测装置电流不平衡度能测吗?

    无论是常规工业场景还是电网关口、风电 / 充电桩等特殊场景,现代电能质量在线监测装置(尤其 A 类精度产品)均能精准测量电流不平衡度,且完全符合 GB/T 19862-2016、IEC
    的头像 发表于 11-27 15:50 1475次阅读
    电能质量在线监测装置电流<b class='flag-5'>不平衡</b>度能测吗?

    电能质量在线监测装置三相不平衡度实时显吗?

    一、三相不平衡度显示能力确认 所有现代电能质量在线监测装置 (无论 A/B/C 类精度) 均 标配三相不平衡度实时监测功能 ,具体表现为: 显示形式 :液晶屏幕 (LCD/TFT) 直接显示数值
    的头像 发表于 11-25 17:48 782次阅读
    电能质量在线监测装置三相<b class='flag-5'>不平衡</b>度实时显吗?

    电能质量在线监测装置能测电流不平衡度吗?

    是的,所有等级的电能质量在线监测装置均支持电流不平衡度测量,其核心技术方案和精度特性如下: 一、测量原理与实现方式 基础算法 采用对称分量法,通过快速傅里叶变换(FFT)将三相电流分解为正序、负序
    的头像 发表于 11-07 15:07 1501次阅读

    电流不平衡度的测量误差范围是多少?

    电流不平衡度的测量误差范围由国家标准严格规定,具体数值根据设备等级、硬件性能、算法设计及应用场景有所差异。以下是核心误差范围及影响因素的详细解析: 一、国标规定的基础误差范围 根据《GB/T
    的头像 发表于 11-06 09:38 1343次阅读

    电流不平衡度测量精度受谐波影响吗?

    是的,电流不平衡度的测量精度 会显著受谐波影响 。这是因为电流不平衡度基于 “对称分量法” 计算(分解正序、负序、零序分量),而谐波会改变三相电流的基波和谐波分量分布,导致序分量计算偏差,进而
    的头像 发表于 11-05 16:08 1343次阅读

    电能质量在线监测装置的电流不平衡度测量精度能达到多少?

    电能质量在线监测装置的电流不平衡度测量精度 取决于设备等级、硬件性能、算法设计及应用场景 ,其核心指标符合国家标准(GB/T 15543-2019)和国际规范(IEC 61000-4-30)。以下
    的头像 发表于 11-05 15:50 711次阅读

    半导体缺陷检测升级:机器学习(ML)攻克类别不平衡难题,小数据也能精准判,降本又提效!

    一、引言机器学习(ML)在半导体制造领域的应用,正面临传统算法难以突破的核心瓶颈。尽管行业能产生海量生产数据,但两大关键问题始终未能有效解决:一是极端类别不平衡,二是初始生产阶段训练数据集匮乏
    的头像 发表于 11-05 11:38 809次阅读
    半导体缺陷检测升级:机器学习(ML)攻克<b class='flag-5'>类别</b><b class='flag-5'>不平衡</b>难题,小数据也能精准判,降本又提效!

    电能质量在线监测装置三相不平衡度能实时算吗?

    是的,现代电能质量在线监测装置能够实时计算三相不平衡度,且精度和响应速度已达到工程实用水平。以下从技术实现、标准规范、硬件支撑和实际应用四个维度展开分析: 一、核心算法与动态响应能力 对称分量法
    的头像 发表于 10-15 16:22 753次阅读

    三相不平衡度的国标是怎样规定电能质量在线监测装置的监测精度的?

    根据现行国家标准 GB/T 15543-2008《电能质量 三相电压不平衡》 及相关配套规范(如 GB/T 19862-2016《电能质量监测设备通用要求》 ),电能质量在线监测装置对三相不平衡
    的头像 发表于 10-11 16:31 2346次阅读
    三相<b class='flag-5'>不平衡</b>度的国标是怎样规定电能质量在线监测装置的监测精度的?

    变频器输出不平衡及对策

    变频器输出不平衡是工业自动化领域中常见的问题,它可能导致电机运行异常、设备损坏甚至生产事故。本文将深入分析变频器输出不平衡的原因,并提出相应的解决方案,帮助工程师和技术人员有效应对这一挑战。 一
    的头像 发表于 08-23 17:09 2805次阅读
    变频器输出<b class='flag-5'>不平衡</b>及对策

    无轴承异步电机的不平衡振动补偿控制

    异步电机转子的不平衡振动位移幅度,在稳态下能基本消除不平衡振动激振力对轴心轨迹的影响,从而有效提高转子的悬浮运行控制精度。所给不平衡振动补偿控制策略是
    发表于 07-14 17:37

    ANSNP中线安防保护器让谐波和不平衡无处可逃!

    和装置的使用以及三相不平衡等问题的存在会导致中性线电流过大,容易造成中性线绝缘层老化起火从而引发火灾,存在较大的安全隐患。 1、中性线的危害 在三相四线制或五线制供电系统运行过程中,中性线引发火灾事故主要通过三种途径
    的头像 发表于 06-10 22:42 733次阅读
    ANSNP中线安防保护器让谐波和<b class='flag-5'>不平衡</b>无处可逃!

    轮毂电机不平衡电磁力对车轮定位参数的影响

    [摘要] 轮毂电机驱动电动汽车将电机、减速机构和制动器等高度集成于车轮内。不同路面激励下的轮胎跳动、载荷不均和轴承磨损等造成电机气隙沿圆周分布不均,其所产生的不平衡电磁力将会通过减速机构或直接传递
    发表于 06-10 13:17