0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于k近邻与高斯噪声的虚拟困难样本增强方法

深度学习自然语言处理 来源:YeungNLP 作者:荷风微摆 2022-05-12 11:31 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在本文中,我们将介绍亚马逊团队在ACL2022中的一篇论文VaSCL,该论文在SimCSE的基础上,提出了一种基于k近邻与高斯噪声的虚拟困难样本增强方法。作者在无监督训练中,进行困难样本增强,从而提高了模型的性能,并且超过了SimCSE。

6338e638-d19e-11ec-bce3-dac502259ad0.png

论文标题:

Virtual Augmentation Supported Contrastive Learning of Sentence Representations

论文链接:

https://arxiv.org/abs/2110.08552

01

引言

在ACL2021中,陈丹琦团队提出了使用Dropout进行正样本增强的对比学习方法SimCSE,该方法操作简单却十分有效,在无监督对比学习中取得了非常好的效果。在有监督SimCSE中,作者对困难负样本的作用进行了探究实验,实验结果证明,引入困难负样本后,有监督SimCSE的指标从84.9提升至86.2。这说明,在对比学习中,引入困难样本是能够提升模型效果的。

然而在无监督SimCSE中,作者仅使用dropout的方式进行了正样本增强,没有额外引入困难样本,这在一定程度上限制了模型的能力。基于这个动机,亚马逊提出了一种基于k近邻与高斯噪声的虚拟困难样本增强的无监督对比学习方法VaSCL。

02

论文解读

基于Dropout的对比损失

在介绍VaSCL模型之前,我们先简单回顾一下无监督SimCSE。假设训练时的batch size为N,将一个batch的数据记作,将同一个样本分别输入模型中两次,使用不同的dropout mask编码得到两个向量和。则在规模为N的batch中,与的InfoNCE损失为:

基于k近邻的虚拟增强对比损失

在无监督SimCSE的损失函数的基础上,作者还设计了一种基于k近邻的虚拟困难样本增强的损失函数。

将通过模型编码之后得到向量序列。

作者通过以下方式获得第i个句向量的虚拟困难样本:

正样本增强:对添加高斯噪声,得到,其中就是经过高斯增强后的正样本。

获得k近邻:获得在中距离最近的k个负样本,在本文中我们称之为k近邻,记作。

对于来说,是正样本,是负样本集合。则对于,k近邻虚拟增强的对比损失如下。分子表示拉近与的距离,分母表示拉远与负样本之间的距离。

在CV中,我们会为输入的图片添加高斯噪声以增加模型的泛化性。添加了高斯噪声的图片,肉眼能看出微小的区别,但不会影响整张图片的语义信息。所以为句向量添加合适的高斯噪声,理论上也不会对句向量的语义信息产生很大的改变。

在的k近邻中,存放的是距离最近的k个负样本,也就是与最相似的k个负样本。只要batch size足够大,我们可以近似认为,就是的困难负样本集合,同样也是的困难负样本集合。

如何获得上述的高斯噪声呢?最容易想到的做法便是随机生成一个高斯噪声,直接添加到句向量中。但是为了提高模型的训练难度,生成更高质量的高斯噪声,作者生成若干个候选高斯噪声,然后选出一个使得最大化的高斯噪声。

从上述操作可以看出,对于最优的高斯噪声,作者希望它增强后的正样本与的距离尽可能远,与负样本的距离尽可能近,作者希望这个高斯噪声能够对模型产生尽可能大的迷惑性。通过这个高斯噪声,我们就可以得到困难正样本,并且从某种意义来说,也使得与的距离尽可能拉近,达到了增强负样本难度的目的,做法确实挺巧妙。

VaSCL对比损失

63676d46-d19e-11ec-bce3-dac502259ad0.png

将上述两种对比损失进行组合,得到最终的VaSCL损失函数:

这个损失函数的含义如下:

对于每个句子,拉近同一个句子经过dropout之后的两个句向量之间的距离,拉远它们与其他句子的距离。

对于每个句子,拉近原句向量与高斯噪声增强之后的句向量的距离,拉远它们与k近邻负样本之间的距离。

03

实验结果

作者分别在STS任务、短文本聚类、意图识别等任务中进行了实验,实验结果如下表所示。可以看到,在三种任务中,绝大部分数据集上,VaSCL的表现都要优于SimCSE,这表明了基于k近邻与高斯噪声的困难样本增强的有效性。

6385a8ce-d19e-11ec-bce3-dac502259ad0.png

63c1165c-d19e-11ec-bce3-dac502259ad0.png

63d37914-d19e-11ec-bce3-dac502259ad0.png

04

总结

SimCSE通过dropout mask这种简单的方法,避免了人工进行正样本增强所带来的语义改变的问题,并且在无监督训练中取得了不错的效果。而VaSCL论文延续了SimCSE这种思想,引入了高斯噪声进行正样本增强,有着异曲同工之妙。

VaSCL在SimCSE的基础上,也进行了困难样本的增强。在进行高斯噪声增强时,使得增强的样本与原始样本尽可能不相似,与负样本尽可能相似,已达到【混淆视听】的效果。通过这种方式,VaSCL在绝大多数据集上的表现,也超过了SimCSE。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 噪声
    +关注

    关注

    13

    文章

    1164

    浏览量

    49514
  • 函数
    +关注

    关注

    3

    文章

    4423

    浏览量

    68036
  • 模型
    +关注

    关注

    1

    文章

    3873

    浏览量

    52338

原文标题:ACL'22 | VaSCL:基于k近邻与高斯噪声的困难样本增强的对比学习方法,超越SimCSE

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    [GLAD] GLAD应用:高斯光束的吸收和自聚焦效应

    的,这将使不同空间位置的光所经历的光程长度不同,即介质对入射光束的作用等价于光学透镜,从而导致光束的自行聚焦效果。 特别地,当入射光束强度沿垂直光轴的界面内呈高斯形时,且强度足够产生非线性效应的情况下
    发表于 05-15 08:08

    [OCAD] OCAD应用:双高斯照相物镜半部结构设计

    都可以优化出来一个优质照相镜头的,还必须了解该形式镜头的设计思想,各结构参数对系统像质的贡献,熟练地掌握系统内涵才便于得心应手的处理镜头优化工作。OCAD给出双高斯照相物镜初始设计的思路及方法就是为使
    发表于 05-07 08:06

    OCAD应用:双高斯照相物镜系统结构优化设计

    专利都可以优化出来一个优质照相镜头的,还必须了解该形式镜头的设计思想,各结构参数对系统像质的贡献,熟练地掌握系统内涵才便于得心应手的处理镜头优化工作。OCAD给出双高斯照相物镜初始设计的思路及方法就是为
    发表于 04-29 08:28

    VirtualLab Fusion光源的这些设置方法,你掌握了吗?

    ,本期将重点介绍四种方法方法一:Sources选项 在顶部的功能区菜单中选择Sources,可以看到VirtualLab Fusion提供了基础光源(包含高斯光束、平面波、像散波、球面波、超
    发表于 04-02 08:19

    VirtualLab:Ince高斯模式

    **摘要 ** 除了Hermite和Laguerre高斯模式之外,近轴波动方程还有第三种严格的正交解族,即所谓的Ince高斯模式。这些解在椭圆坐标中定义,并且通过椭圆参数允许在Hermite
    发表于 03-20 08:58

    VirtualLab:Ince高斯模式

    **摘要 ** 除了Hermite和Laguerre高斯模式之外,近轴波动方程还有第三种严格的正交解族,即所谓的Ince高斯模式。这些解在椭圆坐标中定义,并且通过椭圆参数允许在Hermite
    发表于 03-19 08:36

    山西大学在量子增强相位噪声滤波器研究中取得新进展

    图1.量子增强激光噪声稳定原理。(a) 量子增强振幅噪声稳定;(b) 量子增强相位噪声稳定;(c
    的头像 发表于 03-10 06:40 159次阅读
    山西大学在量子<b class='flag-5'>增强</b>相位<b class='flag-5'>噪声</b>滤波器研究中取得新进展

    NC203DO35噪声二极管现货库存

    NC203DO35噪声二极管现货库存NC203DO35是Noisecom公司NC-200系列里的一款宽带噪声二极管,采用DO-35玻璃封装,主要用于0.1 Hz-100 MHz频段的精密白高斯
    发表于 01-13 09:22

    NC407B噪声二极管现货库存

    NC407B是Noisecom公司推出的一款高性能硅基梁式引线(beam-lead)噪声二极管,采用超宽带设计,凭借其高稳定性、对称高斯噪声特性及军用级温度适应性,广泛应用于超宽带噪声
    发表于 11-24 09:07

    基于FPGA的CLAHE图像增强算法设计

    CLAHE图像增强算法又称为对比度有限的自适应直方图均衡算法,其算法原理是通过有限的调整图像局部对比度来增强有效信号和抑制噪声信号。
    的头像 发表于 10-15 10:14 895次阅读
    基于FPGA的CLAHE图像<b class='flag-5'>增强</b>算法设计

    噪声的测量方法详细干货

    随着近几年电路集成规模和信号频率的日益提高以及对低功耗的追求,导致信号环境日趋复杂,相对应测量小信号的精度要求不断提高,测量仪器的噪声大小成为重要的参数指标。而噪声是幅值很低的信号,观测需要有效的方法,本期介绍
    的头像 发表于 06-19 09:19 1733次阅读
    <b class='flag-5'>噪声</b>的测量<b class='flag-5'>方法</b>详细干货

    GLAD应用:高斯光束的吸收和自聚焦效应

    的,这将使不同空间位置的光所经历的光程长度不同,即介质对入射光束的作用等价于光学透镜,从而导致光束的自行聚焦效果。 特别地,当入射光束强度沿垂直光轴的界面内呈高斯形时,且强度足够产生非线性效应的情况下
    发表于 06-17 08:52

    嵌入式AI技术漫谈:怎么为训练AI模型采集样本数据

    Q 需要为嵌入式AI模型提供多少样本数据? 我在向客户介绍如何使用AI方法设计一款客户产品时,客户理解,AI嵌入式项目的开发都是围绕数据展开的,如此,我经常会被问到这样的问题:客户的工程师需要采集
    的头像 发表于 06-11 16:30 1656次阅读

    轮毂电机电磁噪声测试方法及特性分析

    设计了一种轮毂电机在负载扭矩作用下的电磁噪声测试方法,对不同转速和负载扭矩下的轮毂电机电磁噪声进行了测试,试验结果表明转速对电磁噪声影响较大,而负载扭短对其影响不明显。基于Ansoft
    发表于 06-10 13:19

    三维高斯泼溅大规模视觉SLAM系统解析

    近期兴起的神经辐射场(NeRF)与三维高斯泼溅(3DGS)技术在视觉SLAM中展现出令人鼓舞的突破性成果。然而,当前主流方法多依赖RGBD传感器,并且仅适用于室内环境。在大规模室外场景中的重建鲁棒性
    的头像 发表于 05-27 14:13 1942次阅读
    三维<b class='flag-5'>高斯</b>泼溅大规模视觉SLAM系统解析