0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于多标签学习的新趋势

智能感知与物联网技术研究所 来源:通信信号处理研究所 作者:通信信号处理研究 2021-01-05 14:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

这里大家带来一篇武大刘威威老师、南理工沈肖波老师和 UTS Ivor W. Tsang 老师合作的 2020 年多标签最新的 Survey,我也有幸参与其中,负责了一部分工作。

上半年在知乎上看到有朋友咨询多标签学习是否有新的 Survey,我搜索了一下,发现现有的多标签 Survey 基本在 2014 年之前,主要有以下几篇:

Tsoumakas 的《Multi-label classification: An overview》(2007)

周志华老师的《A review on multi-label learning algorithms》(2013)

一篇比较小众的,Gibaja 《Multi‐label learning: a review of the state of the art and ongoing research》2014

时过境迁,从 2012 年起,AI 领域已经发生了翻天覆地的变化,Deep Learning 已经占据绝对的主导地位,我们面对的问题越来越复杂,CV 和 NLP 朝着各自的方向前行。模型越来越强,我们面对的任务的也越来越复杂,其中,我们越来越多地需要考虑高度结构化的输出空间。多标签学习,作为一个传统的机器学习任务,近年来也拥抱变化,有了新的研究趋势。因此,我们整理了近年多标签学习在各大会议的工作,希望能够为研究者们提供更具前瞻性的思考。

关于单标签学习和多标签学习的区别,这里简单给个例子:传统的图片单标签分类考虑识别一张图片里的一个物体,例如 ImageNet、CIFAR10 等都是如此,但其实图片里往往不会只有一个物体,大家随手往自己的桌面拍一张照片,就会有多个物体,比如手机电脑、笔、书籍等等。在这样的情况下,单标签学习的方法并不适用,因为输出的标签可能是结构化的、具有相关性的(比如键盘和鼠标经常同时出现),所以我们需要探索更强的多标签学习算法来提升学习性能。

本文的主要内容有六大部分:

Extreme Multi-Label Classification

Multi-Label with Limited Supervision

Deep Multi-Label Classification

Online Multi-Label Classification

Statistical Multi-Label Learning

New Applications

接下去我们对这些部分进行简单的介绍,更多细节大家也可以进一步阅读 Survey 原文。另外,由于现在的论文迭代很快,我们无法完全 Cover 到每篇工作。我们的主旨是尽量保证收集的工作来自近年已发表和录用的、高质量的期刊或会议,保证对当前工作的整体趋势进行把握。如果读者有任何想法和意见的话,也欢迎私信进行交流。 1. Extreme Multi-Label Learning (XML) 在文本分类,推荐系统,Wikipedia,Amazon 关键词匹配 [1] 等等应用中,我们通常需要从非常巨大的标签空间中召回标签。比如,很多人会 po 自己的自拍到 FB、Ins 上,我们可能希望由此训练一个分类器,自动识别谁出现在了某张图片中。

对 XML 来说,首要的问题就是标签空间、特征空间都可能非常巨大,例如 Manik Varma 大佬的主页中给出的一些数据集[2],标签空间的维度甚至远高于特征维度。其次,由于如此巨大的标签空间,可能存在较多的 Missing Label(下文会进一步阐述)。最后,标签存在长尾分布[3],绝大部分标签仅仅有少量样本关联。现有的 XML 方法大致可以分为三类,分别为:Embedding Methods、Tree-Based Methods、One-vs-All Methods。近年来,也有很多文献使用了深度学习技术解决 XML 问题,不过我们将会在 Section 4 再进行阐述。XML 的研究热潮大概从 2014 年开始,Varma 大佬搭建了 XML 的 Repository 后,已经有越来越多的研究者开始关注,多年来 XML 相关的文章理论和实验结果并重,值得更多的关注。

2. Multi-Label with Limited Supervision 相比于传统学习问题,对多标签数据的标注十分困难,更大的标签空间带来的是更高的标注成本。随着我们面对的问题越来越复杂,样本维度、数据量、标签维度都会影响标注的成本。因此,近年多标签的另一个趋势是开始关注如何在有限的监督下构建更好的学习模型。本文将这些相关的领域主要分为三类: MLC with Missing Labels(MLML):多标签问题中,标签很可能是缺失的。例如,对 XML 问题来说,标注者根本不可能遍历所有的标签,因此标注者通常只会给出一个子集,而不是给出所有的监督信息。文献中解决该问题的技术主要有基于图的方法、基于标签空间(或 Latent 标签空间)Low-Rank 的方法、基于概率图模型的方法。

Semi-Supervised MLC:MLML 考虑的是标签维度的难度,但是我们知道从深度学习需要更多的数据,在样本量上,多标签学习有着和传统 AI 相同的困难。半监督 MLC 的研究开展较早,主要技术和 MLML 也相对接近,在这一节,我们首先简要回顾了近年半监督 MLC 的一些最新工作。但是,近年来,半监督 MLC 开始有了新的挑战,不少文章开始结合半监督 MLC 和 MLML 问题。毕竟对于多标签数据量来说,即使标注少量的 Full Supervised 数据,也是不可接受的。因此,许多文章开始研究一类弱监督多标签问题[4](Weakly-Supervised MLC,狭义),也就是数据集中可能混杂 Full labeled/missing labels/unlabeled data。我们也在文中重点介绍了现有的一些 WS-MLC 的工作。

Partial Multi-Label Learning(PML):PML 是近年来多标签最新的方向,它考虑的是一类 “难以标注的问题”。比如,在我们标注下方的图片(Zhang et. al. 2020[5])的时候,诸如 Tree、Lavender 这些标签相对是比较简单的。但是有些标签到底有没有,是比较难以确定的,对于某些标注者,可能出现:“这张图片看起来是在法国拍的,好像也可能是意大利?”。这种情况称之为 Ambiguous。究其原因,一是有些物体确实难以辨识,第二可能是标注者不够专业(这种多标签的情况,标注者不太熟悉一些事物也很正常)。但是,很多情况下,标注者是大概能够猜到正确标签的范围,比如这张风景图所在国家,很可能就是 France 或者 Italy 中的一个。我们在不确定的情况下,可以选择不标注、或者随机标注。但是不标注意味着我们丢失了所有信息,随机标注意味着可能带来噪声,对学习的影响更大。所以 PML 选择的是让标注者提供所有可能的标签,当然加了一个较强的假设:所有的标签都应该被包含在候选标签集中。在 Survey 中,我们将现有的 PML 方法划分为 Two-Stage Disambiguation 和 End-to-End 方法(我们 IJCAI 2019 的论文 DRAMA[6] 中,就使用了前者)。关于 PML 的更多探讨,我在之前的知乎回答里面也已经叙述过,大家也可以在我们的 Survey 中了解更多。

Other Settings:前文说过,多标签学习的标签空间纷繁复杂,因此很多研究者提出了各种各样不同的学习问题,我们也简单摘要了一些较为前沿的方向:

MLC with Noisy Labels (Noisy-MLC)。

MLC with Unseen Labels. (Streaming Labels/Zero-Shot/Few-Shot Labels)

Multi-Label Active Learning (MLAL)。

MLC with Multiple Instances (MIML)。

3. Deep Learning for MLC 相信这一部分是大家比较关心的内容,随着深度学习在越来越多的任务上展现了自己的统治力,多标签学习当然也不能放过这块香饽饽。不过,总体来说,多标签深度学习的模型还没有十分统一的框架,当前对 Deep MLC 的探索主要分为以下一些类别: Deep Embedding Methods:早期的 Embedding 方法通常使用线性投影,将 PCA、Compressed Sensing 等方法引入多标签学习问题。一个很自然的问题是,线性投影真的能够很好地挖掘标签之间的相关关系吗?同时,在 SLEEC[3]的工作中也发现某些数据集并不符合 Low-Rank 假设。因此,在 2017 年的工作 C2AE[7]中,Yeh 等将 Auto-Encoder 引入了多标签学习中。由于其简单易懂的架构,很快有许多工作 Follow 了该方法,如 DBPC[8]等。

4a376d00-4458-11eb-8b86-12bb97331649.png

Deep Learning for Challenging MLC:深度神经网络强大的拟合能力使我们能够有效地处理更多更困难的工作。因此我们发现近年的趋势是在 CV、NLP 和 ML 几大 Community,基本都会有不同的关注点,引入 DNN 解决 MLC 的问题,并根据各自的问题发展出自己的一条线。 1. XML 的应用:对这个方面的关注主要来自与数据挖掘和 NLP 领域,其中比较值得一提的是 Attention(如 AttentionXML[9])机制、Transformer-Based Models(如 X-Transformer[10])成为了最前沿的工作。

2. 弱监督 MLC 的应用:这一部分和我们弱监督学习的部分相对交叉,特别的,CVPR 2019 的工作 [11] 探索了多种策略,在 Missing Labels 下训练卷积神经网络。 DL for MLC with unseen labels:这一领域的发展令人兴奋,今年 ICML 的工作 DSLL[12]探索了流标签学习,也有许多工作 [13] 将 Zero-Shot Learning 的架构引入 MLC。 3. Advanced Deep Learning for MLC:有几个方向的工作同样值得一提。首先是 CNN-RNN[14]架构的工作,近年有一个趋势是探索 Orderfree 的解码器 [15]。除此之外,爆火的图神经网络 GNN 同样被引入 MLC,ML-GCN[16] 也是备受关注。特别的,SSGRL[17]是我比较喜欢的一篇工作,结合了 Attention 机制和 GNN,motivation 比较强,效果也很不错。 总结一下,现在的 Deep MLC 呈现不同领域关注点和解决的问题不同的趋势:

从架构上看,基于Embedding、CNN-RNN、CNN-GNN的三种架构受到较多的关注。

从任务上,在XML、弱监督、零样本的问题上,DNN 大展拳脚。

从技术上,Attention、Transformer、GNN在 MLC 上的应用可能会越来越多。

4. Online Multi-Label Learning 面对当前这么复杂而众多的学习问题,传统的全数据学习的方式已经很难满足我们现实应用的需求了。因此,我们认为 Online Multi-Label Learning 可能是一个十分重要,也更艰巨的问题。当前 Off-line 的 MLC 模型一般假设所有数据都能够提前获得,然而在很多应用中,或者对大规模的数据,很难直接进行全量数据的使用。一个朴素的想法自然是使用 Online 模型,也就是训练数据序列地到达,并且仅出现一次。然而,面对这样的数据,如何有效地挖掘多标签相关性呢?本篇 Survey 介绍了一些已有的在线多标签学习的方法,如 OUC[18]、CS-DPP[19]等。在弱监督学习的部分,我们也回顾了近年一些在线弱监督多标签的文章[20](在线弱监督学习一直是一个很困难的问题)。

Online MLC 的工作不多,但是已经受到了越来越多的关注,想要设计高效的学习算法并不简单,希望未来能够有更多研究者对这个问题进行探索。 5. Statistical Multi-Label Learning 近年,尽管深度学习更强势,但传统的机器学习理论也在稳步发展,然而,多标签学习的许多统计性质并没有得到很好的理解。近年 NIPS、ICML 的许多文章都有探索多标签的相关性质。一些值得一提的工作例如,缺失标签下的低秩分类器的泛化误差分析 [21]、多标签代理损失的相合性质[22]、稀疏多标签学习的 Oracle 性质[23] 等等。相信在未来,会有更多工作探索多标签学习的理论性质。

6. New Applications 讲了这么多方法论,但追溯其本源,这么多纷繁复杂的问题依然是由任务驱动的,正是有许许多多现实世界的应用,要求我们设计不同的模型来解决尺度更大、监督更弱、效果更强、速度更快、理论性质更强的 MLC 模型。因此,在文章的最后一部分,我们介绍了近年多标签领域一些最新的应用,如 Video Annotation、Green Computing and 5G Applications、User Profiling 等。在 CV 方向,一个趋势是大家开始探索多标签领域在视频中的应用 [24]。在 DM 领域,用户画像受到更多关注,在我们今年的工作 CMLP[25] 中(下图),就探索了对刷单用户进行多种刷单行为的分析。不过,在 NLP 领域,似乎大家还是主要以文本分类为主,XML-Repo[2]中的应用还有较多探索的空间,所以我们没有花额外的笔墨。

4a74a828-4458-11eb-8b86-12bb97331649.png

总结 写这篇文章的过程中,我跟着几位老师阅读了很多文章,各个领域和方向的工作都整理了不少,尽管无法 cover 到所有工作,但是我们尽可能地把握了一些较为重要的探索的方向,也在文中较为谨慎地给出了一些我们的思考和建议,希望能够给想要了解多标签学习领域的研究者一点引领和思考。

原文标题:多标签学习的新趋势(2020 Survey)

文章出处:【微信公众号:通信信号处理研究所】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4827

    浏览量

    106803
  • AI
    AI
    +关注

    关注

    89

    文章

    38121

    浏览量

    296709
  • 深度学习
    +关注

    关注

    73

    文章

    5590

    浏览量

    123912

原文标题:多标签学习的新趋势(2020 Survey)

文章出处:【微信号:tyutcsplab,微信公众号:智能感知与物联网技术研究所】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    超高频(UHF)标签RFID读取器(面向项目落地的深度指南)

    超高频(UHF)标签RFID读取器:一次能读多张,怎么做到?怎么用好?(面向工程与落地的深度指南)这篇文章把“原理、设备要点、部署细节”都说清楚了,既有技术维度,也有落地建议。
    的头像 发表于 11-01 11:37 175次阅读
    超高频(UHF)<b class='flag-5'>多</b><b class='flag-5'>标签</b>RFID读取器(面向项目落地的深度指南)

    发布元服务配置应用分类、标签和资质信息

    “分类标签和资质管理”菜单选择元服务归属的类别和标签,同时将所需的资质文件提交给华为运营人员审核。资质文件审核通过后,您选择的标签才能生效,之后才可选择生效标签进行配置。
    发表于 10-29 16:47

    炸裂!香港电子展揭秘AI PC与消费电子新趋势

    家人们!我以行业老炮的身份刚从香港环球资源电子展上“杀”回来,这一趟探展,简直像坐了趟科技过山车,刺激得我脑瓜子嗡嗡的。PC行业和消费电子行业的新趋势、新玩法,简直要把我CPU干烧了(不对!我
    的头像 发表于 10-21 12:13 172次阅读
    炸裂!香港电子展揭秘AI PC与消费电子<b class='flag-5'>新趋势</b>

    超声波清洗机的环保性如何?探讨绿色清洁新趋势

    走向一个环保的新趋势。本文将深入探讨超声波清洗机的环保性以及它在现代清洁技术中的地位。一、超声波清洗机的基本原理及优势超声波清洗机的工作原理是利用超声波在液体中传
    的头像 发表于 10-08 16:24 218次阅读
    超声波清洗机的环保性如何?探讨绿色清洁<b class='flag-5'>新趋势</b>

    iPhone 17爆了!今年下半年看什么新技术、新趋势

    iPhone 17爆了!今年下半年看什么新技术、新趋势
    的头像 发表于 09-23 10:48 265次阅读
    iPhone 17爆了!今年下半年看什么新技术、<b class='flag-5'>新趋势</b>?

    PCB抗金属标签的应用

    PCB抗金属标签是一种专门设计用于在金属表面或靠近金属环境使用的RFID标签。它通过特殊的天线设计和材料选择,克服了传统RFID标签在金属环境中无法正常工作的难题。PCB抗金属标签具有
    的头像 发表于 08-06 16:11 550次阅读
    PCB抗金属<b class='flag-5'>标签</b>的应用

    友商跟进,共创一体化直流电能表新趋势

    实现分流器和电能表整体封印,提高稳定性及准确度,是直流电能表发展新趋势
    的头像 发表于 06-19 13:13 581次阅读
    友商跟进,共创一体化直流电能表<b class='flag-5'>新趋势</b>

    云里物里推出全新按键仓储标签

    在工业仓储场景中,同一物料需响应多个工单并行拣货是常见的作业模式,但传统纸质标签或单一交互设备常面临信息更新滞后、操作繁琐、设备管理复杂等难题,导致拣货效率低下、人工成本攀升。云里物里基于对工业场景的深度洞察,推出全新按键仓储标签
    的头像 发表于 05-26 15:37 642次阅读

    NXP eIQ Time Series Studio 工具使用攻略(九)-数据标签

    其中"Data Labeling",数据标签工具使用户能够通过可视化界面将相应的数据标签(如电弧或无电弧)应用于当前数据图形的不同部分,从而对导入的原始数据进行分类。然后,该工具根据标签对原始数据进行细分,并创建用于训练机器
    的头像 发表于 05-22 09:51 1370次阅读
    NXP eIQ Time Series Studio 工具使用攻略(九)-数据<b class='flag-5'>标签</b>

    佛瑞亚谈汽车产业发展的新趋势与新机遇

    全球汽车科技供应商FORVIA佛瑞亚集团以创新之姿闪耀2025上海车展,圆满收官此次行业盛会!佛瑞亚集团首席执行官马启元(Martin FISCHER)亲临展会现场,与全球行业精英共话未来出行。今天,让我们透过他的视角,解码汽车产业发展的新趋势与新机遇。
    的头像 发表于 05-14 15:17 787次阅读

    2025车展,电机新趋势

    上展现出来的,关于电机的几个趋势。首先是结构升级,扁线电机、发卡绕组,已经成为主流,我们就不讨论了,新型结构主要体现在绕组形式,博世、中车、五菱推出X-pin绕组方
    的头像 发表于 05-02 08:50 1124次阅读
    2025车展,电机<b class='flag-5'>新趋势</b>

    美能光伏亮相 SolarEX Istanbul 2025 共探光伏检测技术新趋势

    土耳其伊斯坦布尔,与全球光伏行业专家共同探讨光伏检测技术发展新趋势。创新技术亮相,共探光伏未来MillennialSolar美能光伏向全球观众全方位展示了其先进且全
    的头像 发表于 04-15 09:03 899次阅读
    美能光伏亮相 SolarEX Istanbul 2025 共探光伏检测技术<b class='flag-5'>新趋势</b>

    IPC2221简略学习笔记

    关于IPC2221的学习笔记。
    发表于 03-14 18:07 7次下载

    智慧路灯综合杆:赋能低空经济, 解锁无人机场,化身低空雷达,护航“空中卫士”引领智慧城市新趋势

    【案例分享】智慧路灯综合杆:赋能低空经济, 解锁无人机场,化身低空雷达,护航“空中卫士”引领智慧城市新趋势
    的头像 发表于 12-10 13:56 1202次阅读
    智慧路灯综合杆:赋能低空经济, 解锁无人机场,化身低空雷达,护航“空中卫士”引领智慧城市<b class='flag-5'>新趋势</b>

    2024世界物联网大会:IOT研发的新趋势和PLM系统使用

    盘点世界物联网大会上的IOT新趋势,云PLM为IOT设备的研发提供了更多可能
    的头像 发表于 12-09 17:48 889次阅读