0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于有效样本的类别不平衡损失

自然语言处理爱好者 来源:AI公园 作者:Sik-Ho Tsang 2021-08-16 11:14 次阅读

导读

使用每个类的有效样本数量来重新为每个类的Loss分配权重,效果优于RetinaNet中的Focal Loss。

本文综述了康奈尔大学、康奈尔科技、谷歌Brain和Alphabet公司的基于有效样本数的类平衡损失(CB损失)。在本文中,设计了一种重新加权的方案,利用每个类的有效样本数来重新平衡损失,称为类别平衡损失。

1. 类别平衡问题

假设有像上面那样的不平衡的类。head:对于索引小的类,这些类有较多的样本。Tail:对于大索引的类,这些类的样本数量较少。黑色实线:直接在这些样本上训练的模型偏向于优势类。红色虚线:通过反向类频率来重新加权损失可能会在具有高类不平衡的真实数据上产生较差的性能。蓝虚线:设计了一个类平衡项,通过反向有效样本数来重新加权损失。

2. 有效样本数量

2.1. 定义

6f483fc4-fd9a-11eb-9bcf-12bb97331649.png

数据间信息重叠,左:特征空间S,中:1个样本数据的单位体积,右:数据间信息重叠

直觉上,数据越多越好。但是,由于数据之间存在信息重叠,随着样本数量的增加,模型从数据中提取的边际效益会减少

左:给定一个类,将该类的特征空间中所有可能数据的集合表示为S。假设S的体积为N且N≥1。中:S子集中的每个样本的单位体积为1,可能与其他样本重叠。Right:从S中随机抽取每个子集,覆盖整个S集合。采样的数据越多,S的覆盖率就越好。期望的采样数据总量随着样本数量的增加而增加,以N为界。

因此,将有效样本数定义为样本的期望体积。

这个想法是通过使用一个类的更多数据点来捕捉边际效益的递减。由于现实世界数据之间的内在相似性,随着样本数量的增加,新添加的样本极有可能是现有样本的近重复。另外,cnn是用大量的数据增广来训练的,所有的增广实例也被认为与原始实例相同。对于一个类,N可以看作是唯一原型的数量。

2.2. 数学公式

En表示样本的有效数量(期望体积)。为了简化问题,不考虑部分重叠的情况。也就是说,一个新采样的数据点只能以两种方式与之前的采样数据交互:完全在之前的采样数据集中,概率为p,或完全在原来的数据集之外,的概率为1- p。

有效数字:En = (1−β^n)/(1−β),其中,β = (N− 1)/N,这个命题可以用数学归纳法证明。当E1 = 1时,不存在重叠,E1 =(1−β^1)/(1−β) = 1成立。假设已经有n−1个样本,并且即将对第n个样本进行采样,现在先前采样数据的期望体积为En −1,而新采样的数据点与先前采样点重叠的概率为 p = E(n−1)/N。因此,第n个实例采样后的期望体积为:

6f8b26a4-fd9a-11eb-9bcf-12bb97331649.png

此时:

我们有:

6fc6da32-fd9a-11eb-9bcf-12bb97331649.png

上述命题表明有效样本数是n的指数函数。超参数β∈[0,1)控制En随着n的增长有多快。

3. 类别平衡 Loss (CB Loss)

类别平衡(CB)loss可以写成:

6fe31a80-fd9a-11eb-9bcf-12bb97331649.png

其中,ny是类别y的ground-truth的数量。β = 0对应没有重新加权, β → 1对应于用反向频率进行加权。

提出的有效样本数的新概念使我们能够使用一个超参数β来平滑地调整无重权和反向类频率重权之间的类平衡项。

所提出的类平衡项是模型不可知的和损失不可知的,因为它独立于损失函数L和预测类概率p的选择。

3.1. 类别平衡的 Softmax 交叉熵损失

给定一个标号为y的样本,该样本的softmax交叉熵(CE)损失记为:

6ff9c546-fd9a-11eb-9bcf-12bb97331649.png

假设类y有ny个训练样本,类平衡(CB)softmax交叉熵损失为:

70271b54-fd9a-11eb-9bcf-12bb97331649.png

3.2. 类别平衡的 Sigmoid 交叉熵损失

当对多类问题使用sigmoid函数时,网络的每个输出都执行一个one-vs-all分类,以预测目标类在其他类中的概率。在这种情况下,Sigmoid不假定类之间的互斥性。由于每个类都被认为是独立的,并且有自己的预测器,所以sigmoid将单标签分类和多标签预测统一起来。这是一个很好的属性,因为现实世界的数据通常有多个语义标签。sigmoid交叉熵(CE)损失可以写成:

7032cd82-fd9a-11eb-9bcf-12bb97331649.png

类平衡(CB) sigmoid交叉熵损失为:

709d0724-fd9a-11eb-9bcf-12bb97331649.png

3.3. 类别平衡 Focal Loss

Focal loss (FL)是在RetinaNet中提出的,可以减少分类很好的样本的损失,聚焦于困难的样本。

类别平衡的 (CB) Focal Loss为:

70d554f8-fd9a-11eb-9bcf-12bb97331649.png

4. 实验结果

4.1. 数据集

试验了CIFAR-10和CIFAR-100的5个不平衡系数分别为10、20、50、100和200的长尾版本。iNaturalist 和ILSVRC是天然的类别不平衡数据集。

上面显示了每个类具有不同不平衡因素的图像数量。

4.2. CIFAR 数据集

loss类型的超参数搜索空间为{softmax, sigmoid, focal}, [focal loss]的超参数搜索空间为β∈{0.9,0.99,0.999,0.9999},γ∈{0.5,1.0,2.0}。在CIFAR-10上,最佳的β一致为0.9999。但在CIFAR-100上,不同不平衡因子的数据集往往有不同且较小的最优β。

718c16f2-fd9a-11eb-9bcf-12bb97331649.png

有和没有类平衡项时的分类错误率

在CIFAR-10上,根据β = 0.9999重新加权后,有效样本数与样本数接近。这意味着CIFAR-10的最佳重权策略与逆类频率重权类似。在CIFAR-100上,使用较大的β的性能较差,这表明用逆类频率重新加权不是一个明智的选择,需要一个更小的β,具有更平滑的跨类权重。例如,一个特定鸟类物种的独特原型数量应该小于一个一般鸟类类的独特原型数量。由于CIFAR-100中的类比CIFAR-10更细粒度,因此CIFAR-100的N比CIFAR-10小。

4.3. 大规模数据集

721263ba-fd9a-11eb-9bcf-12bb97331649.png

在所有数据集验证集上,使用不同损失函数训练的大规模数据集上的Top-1和Top-5分类错误率

使用了类平衡的Focal Loss,因为它具有更大的灵活性,并且发现β = 0.999和γ = 0.5在所有数据集上都获得了合理的良好的性能。值得注意的是,使用了类别平衡的Focal Loss来代替Softmax交叉熵,ResNet-50能够达到和ResNet-152相应的性能。

以上数字显示类平衡的Focal Loss损失经过60个epochs的训练后,开始显示其优势。

英文原文:https://medium.com/nerd-for-tech/review-cb-loss-class-balanced-loss-based-on-effective-number-of-samples-image-classification-3056a1a1a001

作者:Sik-Ho Tsang

编译:ronghuaiyang(AI公园)

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    5861

    浏览量

    103263
  • 数据集
    +关注

    关注

    4

    文章

    1178

    浏览量

    24353
  • cnn
    cnn
    +关注

    关注

    3

    文章

    327

    浏览量

    21301

原文标题:CB Loss:基于有效样本的类别不平衡损失

文章出处:【微信号:NLP_lover,微信公众号:自然语言处理爱好者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    三相四线负荷不平衡影响计量吗为什么

    三相四线负荷不平衡是指三相电源接线不平衡导致三相电流不相等的情况。负荷不平衡会对电力计量产生一定的影响,包括电能计量的准确性以及电力系统的稳定性。下面将详细介绍三相四线负荷不平衡对计量
    的头像 发表于 03-29 15:50 241次阅读

    三相不平衡调节装置 三相不平衡会造成什么后果

    三相不平衡调节装置是一种用于解决三相电力系统中三相电压或电流不平衡问题的设备。在本文中,我们将探讨三相不平衡的原因、后果和解决方案,并详细介绍三相不平衡调节装置的工作原理和应用。 引言
    的头像 发表于 02-06 10:14 368次阅读

    三相不平衡最佳解决办法 三相不平衡多少范围内是合理的

    三相不平衡最佳解决办法 在电力系统中,三相不平衡是指三个相之间电压或电流不相等的现象。当三相不平衡的情况发生时,可能会导致线路过载、设备寿命缩短、电能损耗增加等问题。因此,解决三相不平衡
    的头像 发表于 02-06 10:07 530次阅读

    三相电流不平衡是指什么?三相电流不平衡允许范围是多少

    三相电流不平衡是指什么?三相电流不平衡允许范围是多少  三相电流不平衡是指三相电路中三个相位电流的大小不相等或相位角不相等的情况。在理想的三相电路中,三个相位电流应当相等,相位角差120度。 然而
    的头像 发表于 02-02 17:34 931次阅读

    AD9288输出不平衡跟Vref有关系吗?

    最近在用AD9288作为采样芯片,发现很奇怪的问题,同样的信号幅度输入,两路AD采样数值不一样,一路基本平衡,另一路不平衡比较严重,采样值-91~+100;另一块同样的PCB板,两路都不平衡,比如
    发表于 12-15 06:24

    三相电压不平衡对电路的影响

    对电路的影响主要包括以下几个方面: 1. 功率损失:在三相电压不平衡的情况下,电力系统中的三相负载也会出现不平衡,导致三相电流不平衡不平衡
    的头像 发表于 12-11 17:16 775次阅读

    三相用电不平衡的危害?

    三相用电不平衡的危害? 三相用电不平衡是指三相电网中的三个相电压或三个相电流之间存在不平衡的情况。不平衡的三相用电可能会导致一系列的危害,以下是详尽、详实、细致的关于三相用电
    的头像 发表于 11-10 14:35 1109次阅读

    I/Q不平衡的来源 IQ信道之间的不平衡会造成什么影响呢?

    I/Q不平衡的来源 IQ信道之间的不平衡会造成什么影响呢? I/Q不平衡是指在I(即“In-phase”)和Q(即“Quadrature-phase”)信道的输出之间存在不平衡的状态。
    的头像 发表于 10-31 09:34 710次阅读

    三相电压不平衡是什么原因造成的?三相不平衡会跳闸吗?

    三相电压不平衡是什么原因造成的?三相不平衡会跳闸吗?三相不平衡度允许范围  三相电压不平衡是指三相电源电压之间的差异,通常是由电源系统出现故障或不良设计引起的。
    的头像 发表于 09-25 17:36 2717次阅读

    三相不平衡是什么意思?三相电压不平衡怎么处理?

    三相不平衡是什么意思?三相电压不平衡怎么处理?  三相不平衡是指三相电压或电流的幅度或相位不同,这会导致电力系统的不稳定、效率低下、设备寿命短等问题。在三相电力系统中,三相电压应该相等且相位差
    的头像 发表于 09-25 17:36 2459次阅读

    三相电用电不平衡会有什么影响

    某些电气设备仅适于单相用电,如果将其接在三相供电系统中,一旦安排不合理,就会造成三相电流不平衡不平衡电流在系统的各相中将产生不同的电压降,导致电网三相电压不平衡。而三相电压不平衡将造
    发表于 09-25 11:06 1311次阅读

    为什么要治理三相不平衡

    三相不平衡是指三相电路中,三个相电流或相电压不平衡的现象。在电力系统中,三相不平衡是一个常见而严重的问题,它会导致许多不良影响,因此需要进行治理。
    的头像 发表于 09-18 09:36 368次阅读

    三相电流不平衡是什么原因引起的?三相电流不平衡的危害

    三相电流不平衡是什么原因引起的?三相电流不平衡的危害  三相电流不平衡是当三相电源中的电流不等时发生的一种现象。这种现象会影响到电力系统的正常工作。三相电流不平衡的原因有很多种,如噪声
    的头像 发表于 08-31 16:46 4780次阅读

    电机转子不平衡对电机质量的影响大吗

    转子不平衡对电机质量的影响有哪些?小编将分析转子机械不平衡产生的振动和噪声问题。
    发表于 08-30 10:51 313次阅读

    如何判断三相不平衡

    一是测三相线电流,三相线电流相等就说明三相平衡,三相线电流不相等,就说明三相不平衡,而且最大一相线电流与最小一相线电流差值越大,说明三相不平衡程度越严重。
    的头像 发表于 06-15 14:08 1758次阅读