0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于有效样本的类别不平衡损失

自然语言处理爱好者 来源:AI公园 作者:Sik-Ho Tsang 2021-08-16 11:14 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

导读

使用每个类的有效样本数量来重新为每个类的Loss分配权重,效果优于RetinaNet中的Focal Loss。

本文综述了康奈尔大学、康奈尔科技、谷歌Brain和Alphabet公司的基于有效样本数的类平衡损失(CB损失)。在本文中,设计了一种重新加权的方案,利用每个类的有效样本数来重新平衡损失,称为类别平衡损失。

1. 类别平衡问题

假设有像上面那样的不平衡的类。head:对于索引小的类,这些类有较多的样本。Tail:对于大索引的类,这些类的样本数量较少。黑色实线:直接在这些样本上训练的模型偏向于优势类。红色虚线:通过反向类频率来重新加权损失可能会在具有高类不平衡的真实数据上产生较差的性能。蓝虚线:设计了一个类平衡项,通过反向有效样本数来重新加权损失。

2. 有效样本数量

2.1. 定义

6f483fc4-fd9a-11eb-9bcf-12bb97331649.png

数据间信息重叠,左:特征空间S,中:1个样本数据的单位体积,右:数据间信息重叠

直觉上,数据越多越好。但是,由于数据之间存在信息重叠,随着样本数量的增加,模型从数据中提取的边际效益会减少

左:给定一个类,将该类的特征空间中所有可能数据的集合表示为S。假设S的体积为N且N≥1。中:S子集中的每个样本的单位体积为1,可能与其他样本重叠。Right:从S中随机抽取每个子集,覆盖整个S集合。采样的数据越多,S的覆盖率就越好。期望的采样数据总量随着样本数量的增加而增加,以N为界。

因此,将有效样本数定义为样本的期望体积。

这个想法是通过使用一个类的更多数据点来捕捉边际效益的递减。由于现实世界数据之间的内在相似性,随着样本数量的增加,新添加的样本极有可能是现有样本的近重复。另外,cnn是用大量的数据增广来训练的,所有的增广实例也被认为与原始实例相同。对于一个类,N可以看作是唯一原型的数量。

2.2. 数学公式

En表示样本的有效数量(期望体积)。为了简化问题,不考虑部分重叠的情况。也就是说,一个新采样的数据点只能以两种方式与之前的采样数据交互:完全在之前的采样数据集中,概率为p,或完全在原来的数据集之外,的概率为1- p。

有效数字:En = (1−β^n)/(1−β),其中,β = (N− 1)/N,这个命题可以用数学归纳法证明。当E1 = 1时,不存在重叠,E1 =(1−β^1)/(1−β) = 1成立。假设已经有n−1个样本,并且即将对第n个样本进行采样,现在先前采样数据的期望体积为En −1,而新采样的数据点与先前采样点重叠的概率为 p = E(n−1)/N。因此,第n个实例采样后的期望体积为:

6f8b26a4-fd9a-11eb-9bcf-12bb97331649.png

此时:

我们有:

6fc6da32-fd9a-11eb-9bcf-12bb97331649.png

上述命题表明有效样本数是n的指数函数。超参数β∈[0,1)控制En随着n的增长有多快。

3. 类别平衡 Loss (CB Loss)

类别平衡(CB)loss可以写成:

6fe31a80-fd9a-11eb-9bcf-12bb97331649.png

其中,ny是类别y的ground-truth的数量。β = 0对应没有重新加权, β → 1对应于用反向频率进行加权。

提出的有效样本数的新概念使我们能够使用一个超参数β来平滑地调整无重权和反向类频率重权之间的类平衡项。

所提出的类平衡项是模型不可知的和损失不可知的,因为它独立于损失函数L和预测类概率p的选择。

3.1. 类别平衡的 Softmax 交叉熵损失

给定一个标号为y的样本,该样本的softmax交叉熵(CE)损失记为:

6ff9c546-fd9a-11eb-9bcf-12bb97331649.png

假设类y有ny个训练样本,类平衡(CB)softmax交叉熵损失为:

70271b54-fd9a-11eb-9bcf-12bb97331649.png

3.2. 类别平衡的 Sigmoid 交叉熵损失

当对多类问题使用sigmoid函数时,网络的每个输出都执行一个one-vs-all分类,以预测目标类在其他类中的概率。在这种情况下,Sigmoid不假定类之间的互斥性。由于每个类都被认为是独立的,并且有自己的预测器,所以sigmoid将单标签分类和多标签预测统一起来。这是一个很好的属性,因为现实世界的数据通常有多个语义标签。sigmoid交叉熵(CE)损失可以写成:

7032cd82-fd9a-11eb-9bcf-12bb97331649.png

类平衡(CB) sigmoid交叉熵损失为:

709d0724-fd9a-11eb-9bcf-12bb97331649.png

3.3. 类别平衡 Focal Loss

Focal loss (FL)是在RetinaNet中提出的,可以减少分类很好的样本的损失,聚焦于困难的样本。

类别平衡的 (CB) Focal Loss为:

70d554f8-fd9a-11eb-9bcf-12bb97331649.png

4. 实验结果

4.1. 数据集

试验了CIFAR-10和CIFAR-100的5个不平衡系数分别为10、20、50、100和200的长尾版本。iNaturalist 和ILSVRC是天然的类别不平衡数据集。

上面显示了每个类具有不同不平衡因素的图像数量。

4.2. CIFAR 数据集

loss类型的超参数搜索空间为{softmax, sigmoid, focal}, [focal loss]的超参数搜索空间为β∈{0.9,0.99,0.999,0.9999},γ∈{0.5,1.0,2.0}。在CIFAR-10上,最佳的β一致为0.9999。但在CIFAR-100上,不同不平衡因子的数据集往往有不同且较小的最优β。

718c16f2-fd9a-11eb-9bcf-12bb97331649.png

有和没有类平衡项时的分类错误率

在CIFAR-10上,根据β = 0.9999重新加权后,有效样本数与样本数接近。这意味着CIFAR-10的最佳重权策略与逆类频率重权类似。在CIFAR-100上,使用较大的β的性能较差,这表明用逆类频率重新加权不是一个明智的选择,需要一个更小的β,具有更平滑的跨类权重。例如,一个特定鸟类物种的独特原型数量应该小于一个一般鸟类类的独特原型数量。由于CIFAR-100中的类比CIFAR-10更细粒度,因此CIFAR-100的N比CIFAR-10小。

4.3. 大规模数据集

721263ba-fd9a-11eb-9bcf-12bb97331649.png

在所有数据集验证集上,使用不同损失函数训练的大规模数据集上的Top-1和Top-5分类错误率

使用了类平衡的Focal Loss,因为它具有更大的灵活性,并且发现β = 0.999和γ = 0.5在所有数据集上都获得了合理的良好的性能。值得注意的是,使用了类别平衡的Focal Loss来代替Softmax交叉熵,ResNet-50能够达到和ResNet-152相应的性能。

以上数字显示类平衡的Focal Loss损失经过60个epochs的训练后,开始显示其优势。

英文原文:https://medium.com/nerd-for-tech/review-cb-loss-class-balanced-loss-based-on-effective-number-of-samples-image-classification-3056a1a1a001

作者:Sik-Ho Tsang

编译:ronghuaiyang(AI公园)

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6244

    浏览量

    110250
  • 数据集
    +关注

    关注

    4

    文章

    1230

    浏览量

    26044
  • cnn
    cnn
    +关注

    关注

    3

    文章

    355

    浏览量

    23247

原文标题:CB Loss:基于有效样本的类别不平衡损失

文章出处:【微信号:NLP_lover,微信公众号:自然语言处理爱好者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    电能质量在线监测装置电流不平衡度能测吗?

    无论是常规工业场景还是电网关口、风电 / 充电桩等特殊场景,现代电能质量在线监测装置(尤其 A 类精度产品)均能精准测量电流不平衡度,且完全符合 GB/T 19862-2016、IEC
    的头像 发表于 11-27 15:50 646次阅读
    电能质量在线监测装置电流<b class='flag-5'>不平衡</b>度能测吗?

    电能质量在线监测装置三相不平衡度实时显吗?

    一、三相不平衡度显示能力确认 所有现代电能质量在线监测装置 (无论 A/B/C 类精度) 均 标配三相不平衡度实时监测功能 ,具体表现为: 显示形式 :液晶屏幕 (LCD/TFT) 直接显示数值
    的头像 发表于 11-25 17:48 351次阅读
    电能质量在线监测装置三相<b class='flag-5'>不平衡</b>度实时显吗?

    电流不平衡度的测量误差范围是多少?

    电流不平衡度的测量误差范围由国家标准严格规定,具体数值根据设备等级、硬件性能、算法设计及应用场景有所差异。以下是核心误差范围及影响因素的详细解析: 一、国标规定的基础误差范围 根据《GB/T
    的头像 发表于 11-06 09:38 522次阅读

    电流不平衡度测量精度受谐波影响吗?

    是的,电流不平衡度的测量精度 会显著受谐波影响 。这是因为电流不平衡度基于 “对称分量法” 计算(分解正序、负序、零序分量),而谐波会改变三相电流的基波和谐波分量分布,导致序分量计算偏差,进而
    的头像 发表于 11-05 16:08 947次阅读

    电能质量在线监测装置的电流不平衡度测量精度能达到多少?

    电能质量在线监测装置的电流不平衡度测量精度 取决于设备等级、硬件性能、算法设计及应用场景 ,其核心指标符合国家标准(GB/T 15543-2019)和国际规范(IEC 61000-4-30)。以下
    的头像 发表于 11-05 15:50 252次阅读

    半导体缺陷检测升级:机器学习(ML)攻克类别不平衡难题,小数据也能精准判,降本又提效!

    一、引言机器学习(ML)在半导体制造领域的应用,正面临传统算法难以突破的核心瓶颈。尽管行业能产生海量生产数据,但两大关键问题始终未能有效解决:一是极端类别不平衡,二是初始生产阶段训练数据集匮乏
    的头像 发表于 11-05 11:38 201次阅读
    半导体缺陷检测升级:机器学习(ML)攻克<b class='flag-5'>类别</b><b class='flag-5'>不平衡</b>难题,小数据也能精准判,降本又提效!

    三相不平衡度的国标是怎样规定电能质量在线监测装置的监测精度的?

    根据现行国家标准 GB/T 15543-2008《电能质量 三相电压不平衡》 及相关配套规范(如 GB/T 19862-2016《电能质量监测设备通用要求》 ),电能质量在线监测装置对三相不平衡
    的头像 发表于 10-11 16:31 937次阅读
    三相<b class='flag-5'>不平衡</b>度的国标是怎样规定电能质量在线监测装置的监测精度的?

    变频器输出不平衡及对策

    变频器输出不平衡是工业自动化领域中常见的问题,它可能导致电机运行异常、设备损坏甚至生产事故。本文将深入分析变频器输出不平衡的原因,并提出相应的解决方案,帮助工程师和技术人员有效应对这一挑战。 一
    的头像 发表于 08-23 17:09 1461次阅读
    变频器输出<b class='flag-5'>不平衡</b>及对策

    无轴承异步电机的不平衡振动补偿控制

    异步电机转子的不平衡振动位移幅度,在稳态下能基本消除不平衡振动激振力对轴心轨迹的影响,从而有效提高转子的悬浮运行控制精度。所给不平衡振动补偿控制策略是
    发表于 07-14 17:37

    轮毂电机不平衡电磁力对车轮定位参数的影响

    [摘要] 轮毂电机驱动电动汽车将电机、减速机构和制动器等高度集成于车轮内。不同路面激励下的轮胎跳动、载荷不均和轴承磨损等造成电机气隙沿圆周分布不均,其所产生的不平衡电磁力将会通过减速机构或直接传递
    发表于 06-10 13:17

    伺服电机三相不平衡原因及解决方法

    伺服电机作为现代工业自动化系统中的核心执行元件,其稳定运行直接关系到生产效率和设备寿命。然而在实际应用中,三相电流不平衡问题频发,轻则导致电机发热、效率下降,重则引发设备停机甚至绕组烧毁。本文将
    的头像 发表于 05-06 07:40 1344次阅读
    伺服电机三相<b class='flag-5'>不平衡</b>原因及解决方法

    3A325薄型平衡不平衡变压器Anaren

    3A325薄型平衡不平衡变压器Anaren 3A325 是一款由 Anaren Microwave 生产的表面贴装(SMD)巴伦变压器(Balun Transformer),适用于无线通信和射频
    发表于 03-11 09:31

    伺服电子变压器输出电压不平衡的原因及相应的解决方案

    伺服电子变压器在工业自动化系统中也是至关重要的,它们负责将输入的交流电压转换成不同级别的交流电压,以精确驱动和控制伺服电机。然而,在实际应用中,伺服电子变压器输出电压不平衡的问题时有发生,这不
    的头像 发表于 02-23 12:19 1282次阅读
    伺服电子变压器输出电压<b class='flag-5'>不平衡</b>的原因及相应的解决方案

    B0430J50100AHF超小型不平衡平衡变压器

    B0430J50100AHF超小型不平衡平衡变压器B0430J50100AHF是Anaren推出的一款超小型、低成本且低轮廓的不平衡平衡变压器,专为满足新一代A/D和D/A转换器I
    发表于 02-08 09:26

    平衡电阻器可以改为不平衡

    在电子电路中,平衡电阻器与不平衡电阻器各自扮演着重要的角色。平衡电阻器主要用于实现电路的平衡和稳定性,减少噪音和干扰,提高信号质量。而不平衡
    的头像 发表于 01-30 14:31 1730次阅读