0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

PiCO核心点—对比学习引入PLL

深度学习自然语言处理 来源:圆圆的算法笔记 作者:圆圆的算法笔记 2022-08-22 11:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

今天给大家介绍ICLR 2022最佳论文PICO: CONTRASTIVE LABEL DISAMBIGUATION FOR PARTIAL LABEL LEARNING,这篇文章解决的是Partial Label Learning(PLL)问题,即训练数据中一个图像不是一个确定的label,而是一组可能的label集合,需要预测出每个样本的真实label。

2e372fe2-21c8-11ed-ba43-dac502259ad0.png

下载地址:https://openreview.net/pdf?id=EhYjZy6e1gJ

1什么是Partial Label Learning(PLL)

有监督学习是最常见的一种机器学习问题,给定一个输入样本,预测该样本的label是什么。Partial Label Learning(PLL)问题也是预测一个样本对应的label,但是和有监督学习问题的差异是,PLL问题的训练数据中,一个输入样本对应多个候选label,真正的label是候选label中的一个。

为什么会有PLL这样的问题呢?因为在现实问题中,label来自于人工标注,而有的样本人工标注比较困难,只标注一个label会造成噪声较大的问题。例如下面的例子中,比较难区分这张狗对应的类别是哈士奇、雪橇犬还是萨摩耶,强行让人工标注成一个确定的label容易在数据中引入噪声。PLL放宽了这种限制,在标注的label中可以引入一些不确定性,给一个样本赋予多个候选label,模型学习从这些label中预测ground-truth对应的那个label。

poYBAGMC-4eAYRYNAACACdSoxmk001.png

2PLL问题的难点

PLL的效果目前和有监督学习还有一定差距。PLL问题的难点在于标签消歧,也就是从候选label集合中预测出样本的真实label。业内一般的解法是学习样本高质量的表示,然后根据在特征空间中距离近的样本更可能属于同一类别这个假设,实现标签消歧。

然而,这种方法的问题在于,当label是一个不确定的集合而不是一个确定值时,这种不确定性也会对表示学习的过程造成负面影响。表示学习效果不好,又会对标签消歧的效果造成负面影响。

为了解决这个问题,ICLR 2022的最佳论文提出了基于对比学习的PLL问题求解方法。利用对比学习提升表示学习的效果,再利用良好的表示对label进行消歧,消歧后的label又有助于进一步生成良好的样本表征,形成良性循环,提升整体效果。

这篇文章提出的Partial label learning with COntrastive label disambiguation (PiCO) framework主要包括利用对比学习提升表示生成质量,以及基于聚类的label消歧两个核心模块。下面,我们走进这篇最佳论文,理解其背后的思想。

3PiCO核心点1—对比学习引入PLL

第一个核心点是为了提升PLL中的表示生成效果,作者将对比学习的方法引入到PLL问题中。对比学习在有监督问题上已经取得广泛的应用,但是在PLL问题上目前还没有相关研究。将对比学习应用到PLL的一个最主要的问题是正样本对如何构造。在有监督学习中,每个样本都有其对应的确定性label,天然可以构造出正样本。而PLL问题中,每个样本的label是不确定的,无法直接获取正样本对。

为了解决上述问题,本文提出利用分类器对样本的预测结果作为样本真实label(也就是伪标签persudo label),根据这个label构造正样本对。在得到正样本对后,利用MoCo对比学习框架进行表示学习,将样本的两种view分别输入两个参数共享的Encoder,其中key侧的Encoder使用动量更新的方式减小计算开销。对比学习loss作为一个辅助任务和主任务联合学习。对MoCo等对比学习框架不了解的同学,可以参考我之前的文章:对比学习中的4种经典训练模式。利用对比学习,可以让样本在特征空间形成类簇,这也为后续的标签消歧奠定了基础。

2e652a6e-21c8-11ed-ba43-dac502259ad0.png

4PiCO核心点2—标签消歧

本文采用了一种类似EM算法的思路实现标签消歧。首先,对于每个类别维护一个embedding向量u,它可以视为类的类簇中心。对于每个样本的label,在PLL中也用一个N维向量表示s,N代表类别数量,表示了该样本属于每个类别的概率。接下来为了实现标签消歧,在训练过程中不断更新s,更新方法是看样本表示和哪个类别向量最近,就用滑动平均的方式对s的那一维进行更新,公式可以表示为:

2e78dd8e-21c8-11ed-ba43-dac502259ad0.png

相应的,类别向量u也利用滑动平均的方式进行更新,公式如下:

2e83af52-21c8-11ed-ba43-dac502259ad0.png

通过这两个步骤的迭代进行,逐步实验标签消歧。这其实和Kmean以及Kmeans++这种方法类似,本质上就是一个聚类过程。从PiCO框架整体来看,对比学习提升表示学习效果,表示质量的提升又促进了下游基于聚类的标签消歧效果,标签的确定性增加又进一步提升了表示生成的质量,形成了良性循环。

5实验结果

本文进行了大量实验从多个角度验证了PiCO解决PLL问题的效果。在样本表示的学习上,从下面的t-SNE向量可视化分析图可以看出,PiCO生成不用类别的向量表示非常清晰,类内的内聚性和类间的差异性相比其他方法都是更好的。

2e92e1a2-21c8-11ed-ba43-dac502259ad0.png

下面的实验结果对比了PiCO和和其他方法在PLL问题上的效果,可以看出PiCO要比其他方法效果有非常显著的提升。

2ea22838-21c8-11ed-ba43-dac502259ad0.png

6总结

本文介绍了ICLR 2022的最佳论文,在Partial Label Learning问题上的解决方法。通过这篇文章,核心是理解顶会最佳论文的设计思路,本文用的求解方法比较优雅,背后的设计思路也非常清晰,背后的思考非常值得学习。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • pll
    pll
    +关注

    关注

    6

    文章

    976

    浏览量

    137587
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136233

原文标题:ICLR2022最佳论文解读:对比学习解决Partial Label Learning问题

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    蓝牙室内定位核心技术解析:RSSI 与 AOA 的测距原理对比与精度升级逻辑

    本文解析蓝牙室内定位核心技术,对比RSSI与AOA的测距原理,深入探讨从RSSI到AOA在精度、误差控制和硬件适配方面的升级逻辑,揭示两者如何互补满足不同场景需求。
    的头像 发表于 11-24 17:47 1211次阅读

    ESB 故障排查的核心

    对于ESB驱动方面,通信失败,是否有信息可以显示出来是没发送成功还是对方没接收呢?有ACK应答的设置,只能通过应答来判断吗? 这个问题切中了 ESB 故障排查的核心核心结论是:能区分 “未发
    发表于 11-17 15:43

    PLL1708双PLL多时钟发生器技术文档总结

    PLL1707成本低、锁相 环路 (PLL) 多时钟发生器。PLL1707和 PLL1708可以从 27 MHz 生成四个系统时钟 参考输入频率。的时钟输出
    的头像 发表于 09-22 14:01 576次阅读
    <b class='flag-5'>PLL</b>1708双<b class='flag-5'>PLL</b>多时钟发生器技术文档总结

    PLL1707/PLL1708 双PLL多时钟发生器技术文档总结

    PLL1707成本低、锁相 环路 (PLL) 多时钟发生器。PLL1707和 PLL1708可以从 27 MHz 生成四个系统时钟 参考输入频率。的时钟输出
    的头像 发表于 09-22 13:57 516次阅读
    ‌<b class='flag-5'>PLL</b>1707/<b class='flag-5'>PLL</b>1708 双<b class='flag-5'>PLL</b>多时钟发生器技术文档总结

    WLAN/WiMAX 时钟选型:TCXO/VCXO/OCXO 如何影响 EVM/CFO(含两张对比图)

    “相噪积分带宽”“目标 MCS EVM”“温漂-CFO”占比占坑位。 4) 两张关键「对比曲线」在哪里看? 论坛不一定支持内嵌 SVG,给你直达锚(可放大查看): 相噪对比(TCXO/VCXO
    发表于 08-25 14:25

    易灵思 FPGA TJ375的PLL的动态配置

    TJ375已经支持PLL的动态配置。打开PLL在Advance Settings中的Dynamic Reconfiguration中勾选Enable就可以了。最大可以支持85组配置参数。动态配置框图
    的头像 发表于 07-14 18:14 2993次阅读
    易灵思 FPGA TJ375的<b class='flag-5'>PLL</b>的动态配置

    智多晶PLL使用注意事项

    在FPGA设计中,PLL(锁相环)模块作为核心时钟管理单元,通过灵活的倍频、分频和相位调整功能,为系统提供多路高精度时钟信号。它不仅解决了时序同步问题,还能有效消除时钟偏移,提升系统稳定性。本文将深入探讨智多晶PLL在实际应用中
    的头像 发表于 06-13 16:37 1264次阅读
    智多晶<b class='flag-5'>PLL</b>使用注意事项

    PLL用法

    易灵思的FPGA在生成PLL的方式与别的厂家稍有区别,这与其的core和interface架构是相对应的。对于易灵思的FPGA来讲,PLL,GPIO,MIPI,LVDS和DDR相对于core部分都是
    的头像 发表于 06-07 16:18 1034次阅读
    <b class='flag-5'>PLL</b>用法

    别再用钥匙啦!树莓派Pico教你用RFID“刷”门禁~

    获得读卡器,再搭配4美元的树莓派Pico,即可读取卡片/标签的ID信息。在本教程中,我们将学习如何使用MFRC522读卡器和树莓派Pico读取RFID标签和卡片。
    的头像 发表于 04-23 16:03 1150次阅读
    别再用钥匙啦!树莓派<b class='flag-5'>Pico</b>教你用RFID“刷”门禁~

    锁相环(PLL)电路设计与应用(全9章)

    、实用的PLL频率合成器的设计与制作、可编程分频器的种类与工作原理以及电压控制振荡器等。 纯分享贴,有需要可以直接下载附件获取文档! (如果内容有帮助可以关注、赞、评论支持一下哦~)
    发表于 04-18 15:34

    蓝牙5.4与蓝牙6.0的核心区别及技术特性对比

    蓝牙5.4与蓝牙6.0的核心区别及技术特性对比
    的头像 发表于 04-02 15:55 5.7w次阅读
    蓝牙5.4与蓝牙6.0的<b class='flag-5'>核心</b>区别及技术特性<b class='flag-5'>对比</b>

    Pico 2 RP2350 独立开发:跳过 Pico SDK ,直接上手!

    RaspberryPi推出了搭载全新RP2350微控制器的Pico2。RP2350是一款有趣的微控制器单元(MCU)。它拥有两个核心,这两个核心中的一个或两个都可以配置为ArmCortex-M33或
    的头像 发表于 03-25 09:39 1351次阅读
    <b class='flag-5'>Pico</b> 2 RP2350 独立开发:跳过 <b class='flag-5'>Pico</b> SDK ,直接上手!

    树莓派 Pico 2040 的“速度狂飙”:时钟速度几乎翻倍!

    树莓派Pico2040的“超能力”升级如果你手头有一个树莓派Pico2040,但总觉得它的性能还没完全发挥出来,那么恭喜你,现在机会来了!树莓派Pico2040的最新SDK更新,就像给它注入了一剂
    的头像 发表于 03-25 09:25 925次阅读
    树莓派 <b class='flag-5'>Pico</b> 2040 的“速度狂飙”:时钟速度几乎翻倍!

    树莓派 Pico SDK 2.1.1 版本发布!

    RaspberryPiPicoSDK2.1.1最新版本现已发布,更新了多个内容。RaspberryPiRP2040获官方200MHz时钟支持自2021年RaspberryPiRP2040与Pico
    的头像 发表于 03-25 09:20 1343次阅读
    树莓派 <b class='flag-5'>Pico</b> SDK 2.1.1 版本发布!

    小而精!Pico-ITX主板IB2-281轻松破解智能终端空间难题

    着顾客的购买欲望。这台自动售货机内部搭载了杰和科技最新推出的Pico-ITX主板IB2-281,作为核心硬件产品,它确保了智能售货机、智能收银机、餐机等智能终端
    的头像 发表于 12-26 10:33 1081次阅读
    小而精!<b class='flag-5'>Pico</b>-ITX主板IB2-281轻松破解智能终端空间难题