一种新型解决方案：将表征学习和分类器学习分开-电子发烧友网

在图像分类任务中类别不均衡问题一直是个难点，在实际应用中大部分的分类样本很可能呈现长尾分布。新加坡国立大学和 Facebook AI 的研究者提出了一种新型解决方案：将表征学习和分类器学习分开，从而寻找合适的表征来最小化长尾样本分类的负面影响。该论文已被 ICLR 2020 接收。

图像分类一直是深度学习领域中非常基本且工业应用广泛的任务，然而如何处理待分类样本中存在的类别不均衡问题是长期困扰学界与工业界的一个难题。相对来说，学术研究提供的普通图像分类数据集维持了较为均衡的不同类别样本分布；然而在实际应用中，大部分的分类样本很可能呈现长尾分布（long-tail distribution），这很有可能导致分类模型效果偏差：对于尾部的类别分类准确率不高。针对长尾分布的图像识别任务，目前的研究和实践提出了大致几种解决思路，比如分类损失权重重分配（loss re-weighting）、数据集重采样、尾部少量样本过采样、头部过多样本欠采样，或者迁移学习。在 ICLR 2020 会议上，新加坡国立大学与 Facebook AI 合著了一篇论文《Decoupling Representation and classifier for long-tailed recognition》，提出了一个新颖的解决角度：在学习分类任务的过程中，将通常默认为联合起来学习的类别特征表征与分类器解耦（decoupling），寻求合适的表征来最小化长尾样本分类的负面影响。

论文链接：https://openreview.net/pdf?id=r1gRTCVFvB

GitHub 链接：https://github.com/facebookresearch/classifier-balancing

该研究系统性地探究了不同的样本均衡策略对长尾型数据分类的影响，并进行了详实的实验，结果表明：a) 当学习到高质量的类别表征时，数据不均衡很可能不会成为问题；b) 在学得上述表征后，即便应用最简单的样本均衡采样方式，也一样有可能在仅调整分类器的情况下学习到非常鲁棒的长尾样本分类模型。该研究将表征学习和分类器学习分离开来，分别进行了延伸探究。表征学习对于表征学习来说，理想情况下好的类别表征能够准确识别出各种待分类类别。目前针对长尾类型数据分类任务，不同的采样策略、损失权重重分配，以及边界正则化（margin regularization）都可用于改善类别不均。假设 p_j 为样本来自类别 j 中的概率，则 p_j 可用如下公式表示：

其中 n 为训练样本总数，C 为训练类别总数，而 q 为 [0,1] 其中一个值。采样策略包含以下几种常用采样方式：

样本均衡采样（Instance-balanced sampling）：该方法最为常见，即每一个训练样本都有均等的机会概率被选中，即上述公式中 q=1 的情况。

类别均衡采样（Class-balanced sampling）：每个类别都有同等的概率被选中，即公平地选取每个类别，然后再从类别中进行样本选取，即上述公式中 q=0 的情况。

平方根采样（Square-root sampling）：本质上是之前两种采样方式的变种，通常是将概率公式中的 q 定值为 0.5。

渐进式均衡采样（Progressively-balanced sampling）：根据训练中的迭代次数 t（epoch）同时引入样本均衡（IB）与类别均衡（CB）采样并进行适当权重调整的一种新型采样模式，公式为

其中 T 为数据集训练迭代总数。分类器学习该研究也针对单独拆分出来的分类器训练进行了调研和分类概括：

重训练分类器（Classifier Re-training, cRT）：保持表征固定不变，随机重新初始化分类器并进行训练。

最近类别平均分类器（Nereast Class Mean classifier, NCM）：首先计算学习到的每个类别特征均值，然后执行最近邻搜索来确定类别。

τ-归一化分类器（τ-normalized classifier）：作者提出使用该方法对分类器中的类别边界进行重新归一化，以取得均衡。

实验结果通过以上观察和学习拆分，该研究在几个公开的长尾分类数据集上重新修改了头部类别和尾部类别的分类决策边界，并且搭配不同的采样策略进行交叉训练实验。训练出的不同分类器之间的对比结果如下图所示：

同时，在 Places-LT、Imagenet-LT 和 iNaturalist2018 三个公开标准数据集上，该研究提出的策略也获得了同比更高的分类准确率，实现了新的 SOTA 结果：

通过各类对比实验，该研究得到了如下观察： 1. 解耦表征学习与分类为两个过程均取得了非常好的效果，并且打破了人们对长尾分类固有的「样本均衡采样学习效果最好，拥有最具泛化性的特征表示」这一经验之谈。 2. 重新调整分类边界对于长尾分布的物体识别来说是非常有效的。 3. 将该研究提出的解耦学习规则应用到传统网络（如 ResNeXt）中，仍能取得很好的效果，这说明该策略确实对长尾分类具备一定指导意义。该研究针对业界和学界频繁遇到的长尾样本分类难题，提出解构传统的「分类器表征联合学习」范式，从另一个角度提供了新思路：调整它们在表征空间的分类边界或许是更加高效的方法。该研究思路比较新颖，实验结果也具有一定的代表性。对于研究长尾分类的学者或者业界工程师而言，这在传统采样方式下「面多了加水，水多了加面」的经验之外，提供了额外思路。目前该研究的相关代码已在 GitHub 上开源，感兴趣的读者可以下载进行更多的尝试。代码实现研究者在 GitHub 项目中提供了对应的训练代码和必要的训练步骤。代码整体是相对基本的分类训练代码，比较容易实现。具体到复现模型训练，作者也给出了几点注意事项。 1. 表征学习阶段

学习过程中保持网络结构（比如 global pooling 之后不需要增加额外的全连接层）、超参数选择、学习率和 batch size 的关系和正常分类问题一致（比如 ImageNet），以确保表征学习的质量。

类别均衡采样：采用多 GPU 实现的时候，需要考虑使得每块设备上都有较为均衡的类别样本，避免出现样本种类在卡上过于单一，从而使得 BN 的参数估计不准。

渐进式均衡采样：为提升采样速度，该采样方式可以分两步进行。第一步先从类别中选择所需类别，第二步从对应类别中随机选择样本。

2. 分类器学习阶段

重新学习分类器（cRT）：重新随机初始化分类器或者继承特征表示学习阶段的分类器，重点在于保证学习率重置到起始大小并选择 cosine 学习率。

τ-归一化（tau-normalization）：τ 的选取在验证集上进行，如果没有验证集可以从训练集模仿平衡验证集，可参考原论文附录 B.5。

可学习参数放缩（LWS）：学习率的选择与 cRT 一致，学习过程中要保证分类器参数固定不变，只学习放缩因子。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

图像分类

图像分类

+关注

关注
0

文章
87

浏览量
11838
深度学习

深度学习

+关注

关注
73

文章
5236

浏览量
119896

原文标题：ICLR 2020 | 如何解决图像分类中的类别不均衡问题？不妨试试分开学习表征和分类器

文章出处：【微信号：tyutcsplab，微信公众号：智能感知与物联网技术研究所】欢迎添加关注！文章转载请注明出处。

深度学习与度量学习融合的综述

如今，机器学习的应用广泛，包括人脸识别、医疗诊断等，为复杂问题和大量数据提供解决方案。机器学习算法能基于数据产生成功的分类模型，但每个数据都有其问题，需定义区别特征进行正确

发表于 04-24 09:49 •100次阅读

深度<b class='flag-5'>学习</b>与度量<b class='flag-5'>学习</b>融合的综述

FPGA在深度学习应用中或将取代GPU

，这使其在 AI 应用中面临着一些挑战。 Larzul 表示，想要解决这些问题的解决方案便是实现现场可编程门阵列 (FPGA)，这也是他们公司的研究领域。FPGA 是一种处理器，可以

发表于 03-21 15:19

Sentry ND网络防御：实时无监督机器学习解决方案

电子发烧友网站提供《Sentry ND网络防御：实时无监督机器学习解决方案.pdf》资料免费下载

发表于 09-13 10:19 •0次下载

Sentry ND网络防御：实时无监督机器<b class='flag-5'>学习</b><b class='flag-5'>解决方案</b>

电机控制应用中的人工智能解决方案

在STM32上简单轻松地实现机器学习• 直接在STM32内部运行的智能解决方案• 无需云连接• 对于异常检测无需训练数据集• 无监督的自主学习• 解决异常检测和分类问题

发表于 09-08 06:18

机器学习模型类型分类

。Y = f (X)，训练数据通常是(n×x,y)的形式，其中n代表训练样本的大小，x和y分别是变量X和Y的样本值。有监督学习可以被分为两类：分类问题：预测某一样本所属的类别（离散的）。比如判断性别，是否健康等。回归问题：预测某一样本的所对应的实数输出（连续的）。

发表于 09-05 11:45 •1337次阅读

机器<b class='flag-5'>学习</b>模型类型<b class='flag-5'>分类</b>

机器学习的定义、分类及应用

机器学习（Machine Learning）是一种人工智能的技术，它是一种让计算机通过对大量数据进行分析和学习，从而可以自动进行预测和决策的技术。其核心思想是利用算法和统计学的方法来让

发表于 08-22 17:39 •3005次阅读

深度学习的定义和特点深度学习典型模型介绍

深度学习（Deep Learning）是一种基于人工神经网络的机器学习算法，其主要特点是模型由多个隐层组成，可以自动地学习特征，并进行预测或分类

发表于 08-21 18:22 •1270次阅读

机器学习有哪些算法？机器学习分类算法有哪些？机器学习预判有哪些算法？

机器学习有哪些算法？机器学习分类算法有哪些？机器学习预判有哪些算法？机器学习是一种人工智能技术

发表于 08-17 16:30 •1389次阅读

机器学习算法总结机器学习算法是什么机器学习算法优缺点

机器学习算法总结机器学习算法是什么?机器学习算法优缺点? 机器学习算法总结机器学习算法是一种

发表于 08-17 16:11 •1066次阅读

机器学习算法汇总机器学习算法分类机器学习算法模型

机器学习算法汇总机器学习算法分类机器学习算法模型机器学习是人工智能的分支之一，它通过分析和识别数据模式，

发表于 08-17 16:11 •722次阅读

什么是深度学习算法？深度学习算法的应用

什么是深度学习算法？深度学习算法的应用深度学习算法被认为是人工智能的核心，它是一种模仿人类大脑神经元的计算模型。深度学习是机器

发表于 08-17 16:03 •1470次阅读

机器学习和深度学习的区别

　　机器学习是一种方法，利用算法来让机器可以自我学习和适应，而且不需要明确地编程。在许多应用中，需要机器使用历史数据训练模型，然后使用该模型来对新数据进行预测或分类

发表于 08-02 17:36 •387次阅读

如何使用Arm CMSIS-DSP实现经典机器学习库

通常，当开发人员谈论机器学习(ML)时，他们指的是神经网络(nn)。神经网络的巨大优势在于，你不需要成为一个领域专家，而且可以迅速找到一个可行的解决方案。神经网络的缺点是它们通常需要

发表于 08-02 07:12

机器学习之新功能对象分类

电子发烧友网站提供《机器学习之新功能对象分类.zip》资料免费下载

发表于 06-19 15:45 •0次下载

智造之眼丨深度学习应用

智造之眼®科学设计深度学习各应用流程，在尽量简化前期准备工作的基础上为客户提供稳定且准确的深度学习解决方案。

发表于 05-04 16:55 •464次阅读

搜索历史

一种新型解决方案：将表征学习和分类器学习分开

评论

深度学习与度量学习融合的综述

FPGA在深度学习应用中或将取代GPU

Sentry ND网络防御：实时无监督机器学习解决方案

电机控制应用中的人工智能解决方案

机器学习模型类型分类

机器学习的定义、分类及应用

深度学习的定义和特点深度学习典型模型介绍

机器学习有哪些算法？机器学习分类算法有哪些？机器学习预判有哪些算法？

机器学习算法总结机器学习算法是什么机器学习算法优缺点

机器学习算法汇总机器学习算法分类机器学习算法模型

什么是深度学习算法？深度学习算法的应用

机器学习和深度学习的区别

如何使用Arm CMSIS-DSP实现经典机器学习库

机器学习之新功能对象分类

智造之眼丨深度学习应用