0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

小样本学习领域的研究进展

5b9O_deeplearni 来源:未知 作者:胡薇 2018-06-15 09:11 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

编者按:子曰:“举一隅不以三隅反,则不复也”。

人类从少量样本中去思考,还能用这个做什么;而机器则是见到了上亿的数据,却希望下一个与之前的相似。

机器学习领域中,随着更多应用场景的涌现,我们越来越面临着样本数量不足的问题。因此,如何通过举一反三的方式进行小样本学习,成为了一个重要的研究方向。

本文中,复旦大学的付彦伟教授,将介绍过去一年中小样本学习领域的研究进展。

文末,大讲堂提供文中提到参考文献的下载链接。

本次报告主要回顾one-shot learning,也可以称为few-shot learning或low-shot learning领域最近的进展。

首先,one-shot learning产生的动机大家都比较了解。现在在互联网,我们主要用large-scale方法处理数据,但真实情况下,大部分类别我们没有数据积累,large-scale方法不完全适用。所以我们希望在学习了一定类别的大量数据后,对于新的类别,我们只需要少量的样本就能快速学习。

存在的问题一方面是知识缺失,另一方面是需要大量的训练样本。第一点在本文中不做讨论。

对于第二点,目前考虑的解决方法主要有两个:

第一个是人能够识别一个从没有见过的物体,也就是zero-shot learning;

第二个是从已有任务中学习知识,将其应用到未来模型训练中,可以认为是一个迁移学习的问题。

那么我们如何定义one-shot learning呢? 它的目的是从一个或几个图像样本中学习类别信息。但我们这里的one-shot learning并不限于一般图像,也可以在文本,医疗图像等特殊图像,或者物理化学中的扫描图像上进行应用。

One-shot learning的研究主要分为如下几类:

第一类方法是直接基于有监督学习的方法,这是指没有其他的数据源,不将其作为一个迁移学习的问题看待,只利用这些小样本,在现有信息上训练模型,然后做分类;

第二个是基于迁移学习的方法,是指有其他数据源时,利用这些辅助数据集去做迁移学习。这是我今年一篇综述里提到的模型分类。

对于第一类直接进行有监督学习的方法,可以做基于实例的学习,比如KNN,以及非参数方法。

而基于迁移学习的one-shot learning,首先是基于属性的学习,比如我们最早在做zero-shot learning的时候,会顺便做one-shot learning,把特征投影到一个属性空间,然后在这个属性空间中既可以做one-shot learning,又可以做zero-shot learning,但是每个类别都需要属性标注,也就是需要额外的信息。最近的机器学习领域里,所讨论one-shot learning一般不假设我们知道这些额外信息,大体上可以被分为meta-learning,或者metric-learning。 Meta-learning从数据中学习一种泛化的表示,这种泛化的表示可以被直接用于目标数据上,小样本的类别学习过程。Metric-learning从数据源中构建一个空间。但是本质上meta-learning和metric-learning还是有很多相似的地方。

接下来是数据增强,这其实是很重要也很容易被忽视的一点,可以有很多方法来实现:

第一,利用流信息学习one-shot模型,常见的有半监督学习和transductive learning,探讨的是如何用无标签数据去做one-shot learning。

第二,在有预训练模型时,用这些预训练模型进行数据增强。

第三,从相近的类别借用数据,来增强训练数据集。

第四,合成新的有标签训练数据,用一些遥感里的方法,可以合成一些图像,或者3d物体。

第五,用GAN来学习合成模型,比如最近用GAN来做personal ID和人脸相关研究。

第六,属性引导的增强方法。具体大家可以在文章里进行详细了解。

首先基于迁移学习的方法,我们目前的实验结果显示:大部分已经发表的one-shot learning方法在miniImageNet数据集上的结果,比不过resnet-18的结果,这也是很微妙的一点。我们的代码已经放到github上,大家有兴趣可以看一下。(如果我们的实验在什么地方有问题,欢迎大家给我发邮件)

下面简单介绍相关文章。首先是Wang Yuxiong的文章Learning to Learn: Model Regression Networks for Easy Small Sample Learning,他们用原数据构建了很多模型库,然后目标数据直接回归这些模型库。具体就是在source class上训练一个regression network。对于大量样本我们可以得到一个比较好的分类器。对于少量样本我们可以得到一个没那么好的分类器。这个regression network的目的就是把没那么好的分类器映射成比较好的分类器。即,把一个分类器的权重映射到另一个分类器。

第二个是Matching Networks for One Shot Learning,这个文章很有意思,从标题中就能读出大概做了什么工作。对于一张图片,我们训练一个matching network来提取它的feature。然后用一个简单的数学公式来判断feature之间的距离。对于新的图片,根据它与已知图片的距离来进行分类。这篇文章精巧地设计了训练的过程,来使得这个过程与测试时的过程一致。

第三是MAML,是与模型无关的meta-learning的方法,它主要侧重于深度网络的快速适应。这篇文章的思想就是找到一个网络最好的初始位置,这个初始位置被定义为:经过几个小样本的调整后可以得到最好的表现。

第四个是Optimization as a model for few-shot learning,也是meta-learning的方法,将任务组织成一个最优化的问题。这篇文章将梯度下降的过程与LSTM的更新相对比,发现它们非常相似。所以可以用LSTM来学习梯度下降的过程,以此使用LSTM来做梯度下降的工作。

第五个是meta networks,也是meta-learning方法。其中利用了少量样本在基础网络中产生的梯度,来快速生成新的参数权重。

今年NIPS一篇prototypical network,主要是在matching networks的基础上做了一些更改。它们给每一个类一个原型,样本与类的距离就是样本与原型的距离。然后选用欧氏距离替代了matching network的余弦距离。

今年CVPR的Learning to compare: Relation network for few-shot learning。简单来说就是用embedding module来提取feature。然后用relation module来输出两个feature之间的距离。一次来通过距离进行分类选择。

关于on-shot learning,还有其他参考文献,可在文末的链接中下载。

下面简单介绍一下数据增强的相关文章。

上图是我们今年的提交到ECCV的一个工作,用左边的encoder-trinet把视觉特征映射到语义空间。因为语义空间上有更丰富的信息,可以在语义空间上做数据扩充(添加高斯噪声和寻找最近邻),再映射回视觉空间来得到更多的扩充样例。

ICCV2017这篇文章根据已有的图像去生成新的图像,然后做low-shot 视觉识别。具体来说,比如说你有三张图片:一张是鸟,一张是鸟站在树枝上,一张是猴子。那么你可以学习一个网络让它生成猴子站在树枝上的图片。本质上是,想把一个类的变化迁移到另一个类上,以此来做数据扩充。

这是去年在CVPR上发表的文章AGA,主要针对3D数据,把图像投影到一个属性空间做数据增强。这是一个few-shot learning方法。具体就是,给定几张距离观测者不同距离的桌子的照片,以及一张凳子的照片,让机器学会如何去生成不同距离的凳子的照片,以此来做数据扩充。

最后在 one-shot learning之上,我们还可能遇到一个问题,one-shot learning只关注目标类别上的分类问题,我们希望学习到的模型对源数据类别也适用,否则将带来一个问题,被称为灾难性遗忘。

发表在PNAS的文章提出EWC 模型来解决这个问题。灾难性遗忘往往源于我们学习任务B的时候更新网络,使得任务A做的没那么好了。EWC提供了一种方法来计算权重对于任务A的重要性,把重要性引入到损失函数中,来避免更改会影响A效果的权重。

还有learning without forgetting这篇文章,也是侧重于解决这个问题。简单来说就是拿到一个新任务后,我们会更新网络。我们希望在更新网络前后网络没有太大变化,所以我们添加一个loss来限制网络更新前后对于这个新的任务输出的特征不能有太大变化,也就是一个distill loss。

最后,小样本学习还有很多可以研究的东西。目前的成果主要还是基于把已知类别的一些信息迁移到新的类别上。可能未来可以尝试下更多的方向,比如利用无监督的信息或者是半监督的方法。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136236

原文标题:【领域报告】小样本学习年度进展|VALSE2018

文章出处:【微信号:deeplearningclass,微信公众号:深度学习大讲堂】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    多光谱图像颜色特征用于茶叶分类的研究进展

    多光谱成像技术结合颜色特征分析为茶叶分类提供了高效、非破坏性的解决方案。本文系统综述了该技术的原理、方法、应用案例及挑战,探讨了其在茶叶品质分级、品种识别和产地溯源中的研究进展,并展望了未来发展方向
    的头像 发表于 10-17 17:09 404次阅读
    多光谱图像颜色特征用于茶叶分类的<b class='flag-5'>研究进展</b>

    高光谱成像在作物病虫害监测的研究进展

    特性会发生显著变化,例如: 叶绿素含量下降 :导致可见光波段(400-700 nm)反射率异常 细胞结构破坏 :引起近红外波段(700-1300 nm)散射特征改变 水分与糖分异常 :影响短波红外波段(1300-2500 nm)吸收峰分布 研究进展与关键技术突破 (一)光谱特征提取方法 植被指数优
    的头像 发表于 10-16 15:53 329次阅读
    高光谱成像在作物病虫害监测的<b class='flag-5'>研究进展</b>

    模板驱动 无需训练数据 SmartDP解决小样本AI算法模型开发难题

    。但是这个平台不适用于小样本AI模型开发,特别是一些特殊行业,数据本来就不多,但又有着需求,因此陷于两难。面临这种市场困境,慧视光电推出了一个全新的AI平台Sma
    的头像 发表于 09-09 17:57 1170次阅读
    模板驱动  无需训练数据  SmartDP解决<b class='flag-5'>小样本</b>AI算法模型开发难题

    微双重驱动的新型直线电机研究

    摘罢:大行程、高精度,同时易于小型化的移动机构是先进制造业等领域要解决的关键问题之一,综述了现有宏/微双重驱动机构和直线超声电机的研究进展和存在问题,提出了一种宏微双重驱动新型直线压电电机,使其既能
    发表于 06-24 14:17

    氧化镓射频器件研究进展

    ,首先介绍了 Ga2O3在射频器件领域的优势和面临的挑战,然后综述了近年来 Ga2O3射频器件在体掺杂沟道、AlGaO/Ga2O3调制 掺杂异质结以及与高导热衬底异质集成方面取得的进展,并对研究结果进行了讨论,最后展望了未来 G
    的头像 发表于 06-11 14:30 1957次阅读
    氧化镓射频器件<b class='flag-5'>研究进展</b>

    一文详解水下机器人的产业发展现状及趋势分

    不久前,由上海交通大学、中国科学院深海科学与工程研究所、华大集团联合发起的马里亚纳海沟环境与生态研究计划(MEER计划)取得重大科研进展。该研究专题集中报道了马里亚纳海沟深渊
    的头像 发表于 03-14 10:12 2175次阅读
    一文详解水下机器人的产业发展现状及趋势分

    焊接电流精密控制技术研究进展

    焊接作为现代制造业中不可或缺的加工技术,在航空航天、汽车制造、船舶建造等领域有着广泛的应用。随着工业4.0概念的提出和智能制造技术的发展,焊接技术也在不断进步,特别是焊接电流的精密控制技术,成为了当
    的头像 发表于 02-27 09:43 617次阅读

    香港科技大学陈敬课题组揭示GaN与SiC材料的最新研究进展

    基于宽禁带半导体氮化镓,碳化硅的最新研究进展研究成果覆盖功率器件技术和新型器件技术: 高速且具备优越开关速度控制能力的3D堆叠式GaN/SiC cascode 功率器件 多年来,商业SiC
    的头像 发表于 02-19 11:23 1236次阅读
    香港科技大学陈敬课题组揭示GaN与SiC材料的最新<b class='flag-5'>研究进展</b>

    二极管泵浦高能激光的研究进展(1)

    质量这一总目标发展迅速。详细综述了国内外高平均功率块状固体激光、高功率可见光波段激光、高峰值功率激光、高功率光纤激光、碱金属蒸气激光等二极管泵浦高能激光的研究进展,并对其发展趋势进行了展望。
    的头像 发表于 02-18 15:46 873次阅读
    二极管泵浦高能激光的<b class='flag-5'>研究进展</b>(1)

    电磁屏蔽高分子材料的最新研究动态与进展

                              电磁屏蔽高分子材料 研究进展   高分子物理 目前,国家对太空环境的研究高度重视。其中木星探测面临极端辐射环境,传统屏蔽材料难以满足要求,需研发
    的头像 发表于 02-18 14:13 1480次阅读
    电磁屏蔽高分子材料的最新<b class='flag-5'>研究</b>动态与<b class='flag-5'>进展</b>

    石墨烯铅蓄电池研究进展、优势、挑战及未来方向

    石墨烯铅蓄电池是将石墨烯材料与传统铅酸电池技术相结合的研究方向,旨在提升铅酸电池的性能(如能量密度、循环寿命、快充能力等)。以下是该领域研究进展、优势、挑战及未来方向: 一、石墨烯在铅蓄电池
    的头像 发表于 02-13 09:36 2747次阅读

    中山大学:在柔性触觉传感电子皮肤研究进展

    研究内容】     中山大学衣芳教授团队在" 科学通报"期刊上发表了题为“ 柔性触觉传感电子皮肤研究进展”的最新论文。本文主要综述了近年来柔性触觉传感电子皮肤的研究进展, 重点归纳总结了上述三类
    的头像 发表于 02-12 17:03 1681次阅读
    中山大学:在柔性触觉传感电子皮肤<b class='flag-5'>研究进展</b>

    焊接电压波动分析仪的应用与研究进展

    焊缝成型不良、熔深不足等问题,还可能引发焊接缺陷,如气孔、裂纹等,严重影响产品的质量和安全性能。因此,对焊接电压波动的监测与控制成为焊接技术领域的一个重要研究方向。
    的头像 发表于 01-15 14:09 661次阅读

    电阻点焊热量智能控制技术研究进展

    电阻点焊作为金属连接的一种重要方法,在汽车制造、航空航天、电子工业等多个领域得到了广泛应用。随着科技的发展,传统的电阻点焊接技术逐渐暴露出一些问题,如焊接质量不稳定、能耗高、对操作人员技能要求高等
    的头像 发表于 12-18 10:02 825次阅读
    电阻点焊热量智能控制技术<b class='flag-5'>研究进展</b>

    定向石墨烯复合防腐涂层的研究进展

      近年来,由于石墨烯(Gr)制备技术的不断发展[1-2],石墨烯的生产成本逐渐降低,这使其在有机防腐涂层领域的应用成为了可能。研究人员在石墨烯复合防腐涂层的制备技术、修饰方法等方面开 展了大量
    的头像 发表于 12-17 17:31 1955次阅读
    定向石墨烯复合防腐涂层的<b class='flag-5'>研究进展</b>