0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

半监督学习最基础的3个概念

深度学习自然语言处理 来源:深度学习自然语言处理 作者:Neeraj varshney 2020-11-02 16:14 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

导读

今天给大家介绍半监督学习中的3个最基础的概念:一致性正则化,熵最小化和伪标签,并介绍了两个经典的半监督学习方法。

没看一的点这里哈:半监督学习入门基础(一)

半监督学习 (SSL) 是一种非常有趣的方法,用来解决机器学习中缺少标签数据的问题。SSL利用未标记的数据和标记的数据集来学习任务。SSL的目标是得到比单独使用标记数据训练的监督学习模型更好的结果。这是关于半监督学习的系列文章的第2部分,详细介绍了一些基本的SSL技术。

一致性正则化,熵最小化,伪标签

SSL的流行方法是在训练期间往典型的监督学习中添加一个新的损失项。通常使用三个概念来实现半监督学习,即一致性正则化、熵最小化和伪标签。在进一步讨论之前,让我们先理解这些概念。

一致性正则化强制数据点的实际扰动不应显著改变预测器的输出。简单地说,模型应该为输入及其实际扰动变量给出一致的输出。我们人类对于小的干扰是相当鲁棒的。例如,给图像添加小的噪声(例如改变一些像素值)对我们来说是察觉不到的。机器学习模型也应该对这种扰动具有鲁棒性。这通常通过最小化对原始输入的预测与对该输入的扰动版本的预测之间的差异来实现。

模型对输入x及其扰动x^的一致性度量

d(.,.) 可以是均方误差或KL散度或任何其他距离度量。

一致性正则化是利用未标记数据找到数据集所在的平滑流形的一种方法。这种方法的例子包括π模型、Temporal Ensembling,Mean Teacher,Virtual Adversarial Training等。

熵最小化鼓励对未标记数据进行更有信心的预测,即预测应该具有低熵,而与ground truth无关(因为ground truth对于未标记数据是未知的)。让我们从数学上理解下这个。

熵的计算

这里,K是类别的数量,是模型对x预测是否属于类别k的置信度。

此外,输入示例中所有类的置信度之和应该为1。这意味着,当某个类的预测值接近1,而其他所有类的预测值接近0时,熵将最小化。因此,这个目标鼓励模型给出高可信度的预测。

理想情况下,熵的最小化将阻止决策边界通过附近的数据点,否则它将被迫产生一个低可信的预测。请参阅下图以更好地理解此概念。

由不同的半监督学习方法生成的决策边界

伪标签是实现半监督学习最简单的方法。一个模型一开始在有标记的数据集上进行训练,然后用来对没有标记的数据进行预测。它从未标记的数据集中选择那些具有高置信度(高于预定义的阈值)的样本,并将其预测视为伪标签。然后将这个伪标签数据集添加到标记数据集,然后在扩展的标记数据集上再次训练模型。这些步骤可以执行多次。这和自训练很相关。

在现实中视觉和语言上扰动的例子

视觉:

翻转,旋转,裁剪,镜像等是图像常用的扰动。

语言

反向翻译是语言中最常见的扰动方式。在这里,输入被翻译成不同的语言,然后再翻译成相同的语言。这样就获得了具有相同语义属性的新输入。

NLP中的反向翻译

半监督学习方法

π model:

这里的目标是一致性正则化。

π模型鼓励模型对两个相同的输入(即同一个输入的两个扰动变量)输出之间的一致性。

π模型有几个缺点,首先,训练计算量大,因为每个epoch中单个输入需要送到网络中两次。第二,训练目标zĩ是有噪声的。

Temporal Ensembling:

这个方法的目标也是一致性正则化,但是实现方法有点不一样。

众所周知,与单一模型相比,模型集成通常能提供更好的预测。通过在训练期间使用单个模型在不同训练时期的输出来形成集成预测,这一思想得到了扩展。

简单来说,不是比较模型的相同输入的两个扰动的预测(如π模型),模型的预测与之前的epoch中模型对该输入的预测的加权平均进行比较。

这种方法克服了π模型的两个缺点。它在每个epoch中,单个输入只进入一次,而且训练目标zĩ 的噪声更小,因为会进行滑动平均。

这种方法的缺点是需要存储数据集中所有的zĩ 。

英文原文:https://medium.com/analytics-vidhya/a-primer-on-semi-supervised-learning-part-2-803f45edac2

责任编辑:xj

原文标题:半监督学习入门基础(二):最基础的3个概念

文章出处:【微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • SSL
    SSL
    +关注

    关注

    0

    文章

    132

    浏览量

    26637
  • 半监督
    +关注

    关注

    0

    文章

    5

    浏览量

    6440
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136216
  • 深度学习
    +关注

    关注

    73

    文章

    5590

    浏览量

    123890

原文标题:半监督学习入门基础(二):最基础的3个概念

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    分享一嵌入式开发学习路线

    拓展期(3-4月) 学习嵌入式操作系统(RTOS)和物联网通信技术,能开发“多任务、联网”的复杂项目,理解企业级嵌入式开发的“架构思维”。这一阶段的学习需要一定的自律和毅力,但与学
    发表于 12-04 11:01

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战课(11大系列课程,共5000+分钟)

    趋势: 无监督学习普及 当前工业场景中80%的缺陷检测项目面临\"OK样本充足而NG样本稀缺\"的困境,传统监督学习方案难以落地。课程第11系列(无监督缺陷检测篇)提供无需标注即可
    发表于 12-04 09:28

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战可(11大系列课程,共5000+分钟)

    (覆盖10+主流品牌),避免采购踩坑 3)稀缺技能强化 无监督学习应用:无需NG样本的缺陷检测方案,解决工业数据标注难题 多模态融合技术:PaddleOCR+YOLOv8联动方案,实现\"文字
    发表于 12-03 13:50

    自动驾驶中常提的“强化学习”是啥?

    下,就是一智能体在环境里行动,它能观察到环境的一些信息,并做出一动作,然后环境会给出一反馈(奖励或惩罚),智能体的目标是把长期得到的奖励累积到最大。和监督学习不同,强化
    的头像 发表于 10-23 09:00 321次阅读
    自动驾驶中常提的“强化<b class='flag-5'>学习</b>”是<b class='flag-5'>个</b>啥?

    学习物联网怎么入门?

    随着物联网技术的不断发展,越来越多的人开始关注学习这一领域。但是对于初学者来说,物联网似乎是一庞杂的概念学习起来很困难。因此,从哪里开始学习
    发表于 10-14 10:34

    XM3桥电源模块系列CREE

    XM3桥电源模块系列是 Wolfspeed(原CREE)推出的高功率碳化硅(SiC)电源模块平台,专为电动汽车、工业电源和牵引驱动等高要求应用设计。XM3桥电源模块系列采用第三代
    发表于 09-11 09:48

    【「Yocto项目实战教程:高效定制嵌入式Linux系统」阅读体验】+基础概念学习理解

    是 Yocto 项目的核心部分之一,书中对元数据的概念、文件、语法以及菜谱和层的相关内容进行了详细阐述。通过学习这部分内容,我了解到元数据在 Yocto 项目中的重要性,它定义了构建系统的各个方面,包括
    发表于 08-04 22:29

    ARM入门学习方法分享

    的官方文档,了解ARM架构的细节,并参考一些在线教程和博客来学习其他开发者的经验和技巧。 总的来说,学习ARM需要一定的耐心和实践。通过掌握基本概念学习汇编语言、使用开发工具、进行
    发表于 07-23 10:21

    任正非说 AI已经确定是第四次工业革命 那么如何从容地加入进来呢?

    的基本理论。了解监督学习、无监督学习和强化学习的基本原理。例如,在监督学习中,理解如何通过标注数据来训练模型进行分类或回归任务,像通过大量的猫和狗的图片标注数据来训练一
    发表于 07-08 17:44

    使用MATLAB进行无监督学习

    监督学习是一种根据未标注数据进行推断的机器学习方法。无监督学习旨在识别数据中隐藏的模式和关系,无需任何监督或关于结果的先验知识。
    的头像 发表于 05-16 14:48 1160次阅读
    使用MATLAB进行无<b class='flag-5'>监督学习</b>

    新品 | 桥1200V CoolSiC™ MOSFET EconoDUAL™ 3模块

    新品桥1200VCoolSiCMOSFETEconoDUAL3模块采用EconoDUAL3封装的1200V/1.4mΩ桥模块。芯片为SiCMOSFETM1H增强型1代、集成NTC温
    的头像 发表于 04-17 17:05 721次阅读
    新品 | <b class='flag-5'>半</b>桥1200V CoolSiC™ MOSFET EconoDUAL™ <b class='flag-5'>3</b>模块

    NX-HB-GAN3R2-BSC桥评估板

    电子发烧友网站提供《NX-HB-GAN3R2-BSC桥评估板.pdf》资料免费下载
    发表于 02-18 17:29 2次下载
    NX-HB-GAN<b class='flag-5'>3</b>R2-BSC<b class='flag-5'>半</b>桥评估板

    桥LLC谐振电路的工作原理与模态分析

    自己写一篇比较详细的介绍做参考。作为一初学AC-DC电源的工程师,在整理和学习的过程中难免有一些疏忽和错误,如发现问题,欢迎大家在评论区指出和讨论。 1、桥LLC拓扑 如图是桥L
    的头像 发表于 02-12 11:03 7451次阅读
    <b class='flag-5'>半</b>桥LLC谐振电路的工作原理与模态分析

    人工智能和机器学习以及Edge AI的概念与应用

    与人工智能相关各种技术的概念介绍,以及先进的Edge AI(边缘人工智能)的最新发展与相关应用。 人工智能和机器学习是现代科技的核心技术 人工智能(AI)和机器学习(ML)是现代科技的核心技术之一,且已经在许多领域中得到广泛应用
    的头像 发表于 01-25 17:37 1571次阅读
    人工智能和机器<b class='flag-5'>学习</b>以及Edge AI的<b class='flag-5'>概念</b>与应用

    自然语言处理与机器学习的关系 自然语言处理的基本概念及步骤

    Learning,简称ML)是人工智能的一核心领域,它使计算机能够从数据中学习并做出预测或决策。自然语言处理与机器学习之间有着密切的关系,因为机器学习提供了一种强大的工具,用于从大
    的头像 发表于 12-05 15:21 2540次阅读