0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于k近邻与高斯噪声的虚拟困难样本增强方法

深度学习自然语言处理 来源:YeungNLP 作者:荷风微摆 2022-05-12 11:31 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在本文中,我们将介绍亚马逊团队在ACL2022中的一篇论文VaSCL,该论文在SimCSE的基础上,提出了一种基于k近邻与高斯噪声的虚拟困难样本增强方法。作者在无监督训练中,进行困难样本增强,从而提高了模型的性能,并且超过了SimCSE。

6338e638-d19e-11ec-bce3-dac502259ad0.png

论文标题:

Virtual Augmentation Supported Contrastive Learning of Sentence Representations

论文链接:

https://arxiv.org/abs/2110.08552

01

引言

在ACL2021中,陈丹琦团队提出了使用Dropout进行正样本增强的对比学习方法SimCSE,该方法操作简单却十分有效,在无监督对比学习中取得了非常好的效果。在有监督SimCSE中,作者对困难负样本的作用进行了探究实验,实验结果证明,引入困难负样本后,有监督SimCSE的指标从84.9提升至86.2。这说明,在对比学习中,引入困难样本是能够提升模型效果的。

然而在无监督SimCSE中,作者仅使用dropout的方式进行了正样本增强,没有额外引入困难样本,这在一定程度上限制了模型的能力。基于这个动机,亚马逊提出了一种基于k近邻与高斯噪声的虚拟困难样本增强的无监督对比学习方法VaSCL。

02

论文解读

基于Dropout的对比损失

在介绍VaSCL模型之前,我们先简单回顾一下无监督SimCSE。假设训练时的batch size为N,将一个batch的数据记作,将同一个样本分别输入模型中两次,使用不同的dropout mask编码得到两个向量和。则在规模为N的batch中,与的InfoNCE损失为:

基于k近邻的虚拟增强对比损失

在无监督SimCSE的损失函数的基础上,作者还设计了一种基于k近邻的虚拟困难样本增强的损失函数。

将通过模型编码之后得到向量序列。

作者通过以下方式获得第i个句向量的虚拟困难样本:

正样本增强:对添加高斯噪声,得到,其中就是经过高斯增强后的正样本。

获得k近邻:获得在中距离最近的k个负样本,在本文中我们称之为k近邻,记作。

对于来说,是正样本,是负样本集合。则对于,k近邻虚拟增强的对比损失如下。分子表示拉近与的距离,分母表示拉远与负样本之间的距离。

在CV中,我们会为输入的图片添加高斯噪声以增加模型的泛化性。添加了高斯噪声的图片,肉眼能看出微小的区别,但不会影响整张图片的语义信息。所以为句向量添加合适的高斯噪声,理论上也不会对句向量的语义信息产生很大的改变。

在的k近邻中,存放的是距离最近的k个负样本,也就是与最相似的k个负样本。只要batch size足够大,我们可以近似认为,就是的困难负样本集合,同样也是的困难负样本集合。

如何获得上述的高斯噪声呢?最容易想到的做法便是随机生成一个高斯噪声,直接添加到句向量中。但是为了提高模型的训练难度,生成更高质量的高斯噪声,作者生成若干个候选高斯噪声,然后选出一个使得最大化的高斯噪声。

从上述操作可以看出,对于最优的高斯噪声,作者希望它增强后的正样本与的距离尽可能远,与负样本的距离尽可能近,作者希望这个高斯噪声能够对模型产生尽可能大的迷惑性。通过这个高斯噪声,我们就可以得到困难正样本,并且从某种意义来说,也使得与的距离尽可能拉近,达到了增强负样本难度的目的,做法确实挺巧妙。

VaSCL对比损失

63676d46-d19e-11ec-bce3-dac502259ad0.png

将上述两种对比损失进行组合,得到最终的VaSCL损失函数:

这个损失函数的含义如下:

对于每个句子,拉近同一个句子经过dropout之后的两个句向量之间的距离,拉远它们与其他句子的距离。

对于每个句子,拉近原句向量与高斯噪声增强之后的句向量的距离,拉远它们与k近邻负样本之间的距离。

03

实验结果

作者分别在STS任务、短文本聚类、意图识别等任务中进行了实验,实验结果如下表所示。可以看到,在三种任务中,绝大部分数据集上,VaSCL的表现都要优于SimCSE,这表明了基于k近邻与高斯噪声的困难样本增强的有效性。

6385a8ce-d19e-11ec-bce3-dac502259ad0.png

63c1165c-d19e-11ec-bce3-dac502259ad0.png

63d37914-d19e-11ec-bce3-dac502259ad0.png

04

总结

SimCSE通过dropout mask这种简单的方法,避免了人工进行正样本增强所带来的语义改变的问题,并且在无监督训练中取得了不错的效果。而VaSCL论文延续了SimCSE这种思想,引入了高斯噪声进行正样本增强,有着异曲同工之妙。

VaSCL在SimCSE的基础上,也进行了困难样本的增强。在进行高斯噪声增强时,使得增强的样本与原始样本尽可能不相似,与负样本尽可能相似,已达到【混淆视听】的效果。通过这种方式,VaSCL在绝大多数据集上的表现,也超过了SimCSE。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 噪声
    +关注

    关注

    13

    文章

    1154

    浏览量

    48899
  • 函数
    +关注

    关注

    3

    文章

    4406

    浏览量

    66841
  • 模型
    +关注

    关注

    1

    文章

    3649

    浏览量

    51713

原文标题:ACL'22 | VaSCL:基于k近邻与高斯噪声的困难样本增强的对比学习方法,超越SimCSE

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NC407B噪声二极管现货库存

    NC407B是Noisecom公司推出的一款高性能硅基梁式引线(beam-lead)噪声二极管,采用超宽带设计,凭借其高稳定性、对称高斯噪声特性及军用级温度适应性,广泛应用于超宽带噪声
    发表于 11-24 09:07

    基于FPGA的CLAHE图像增强算法设计

    CLAHE图像增强算法又称为对比度有限的自适应直方图均衡算法,其算法原理是通过有限的调整图像局部对比度来增强有效信号和抑制噪声信号。
    的头像 发表于 10-15 10:14 395次阅读
    基于FPGA的CLAHE图像<b class='flag-5'>增强</b>算法设计

    噪声的测量方法详细干货

    随着近几年电路集成规模和信号频率的日益提高以及对低功耗的追求,导致信号环境日趋复杂,相对应测量小信号的精度要求不断提高,测量仪器的噪声大小成为重要的参数指标。而噪声是幅值很低的信号,观测需要有效的方法,本期介绍
    的头像 发表于 06-19 09:19 892次阅读
    <b class='flag-5'>噪声</b>的测量<b class='flag-5'>方法</b>详细干货

    GLAD应用:高斯光束的吸收和自聚焦效应

    的,这将使不同空间位置的光所经历的光程长度不同,即介质对入射光束的作用等价于光学透镜,从而导致光束的自行聚焦效果。 特别地,当入射光束强度沿垂直光轴的界面内呈高斯形时,且强度足够产生非线性效应的情况下
    发表于 06-17 08:52

    轮毂电机电磁噪声测试方法及特性分析

    设计了一种轮毂电机在负载扭矩作用下的电磁噪声测试方法,对不同转速和负载扭矩下的轮毂电机电磁噪声进行了测试,试验结果表明转速对电磁噪声影响较大,而负载扭短对其影响不明显。基于Ansoft
    发表于 06-10 13:19

    GLAD应用:高斯光束的吸收和自聚焦效应

    的,这将使不同空间位置的光所经历的光程长度不同,即介质对入射光束的作用等价于光学透镜,从而导致光束的自行聚焦效果。 特别地,当入射光束强度沿垂直光轴的界面内呈高斯形时,且强度足够产生非线性效应的情况下
    发表于 05-16 08:47

    基于高斯的稠密视觉SLAM研究

    基于高斯的场景表示在新视角下会出现几何失真,这大大降低了基于高斯的跟踪方法的准确性。这些几何不一致主要源于高斯基元的深度建模以及在深度融合过程中表面之间的相互干扰。为了解决这些问题,我
    的头像 发表于 05-15 10:36 792次阅读
    基于<b class='flag-5'>高斯</b>的稠密视觉SLAM研究

    精选好文!噪声系数测量的三种方法

    本文介绍了测量噪声系数的三种方法:增益法、Y系数法和噪声系数测试仪法。这三种方法的比较以表格的形式给出。 在无线通信系统中,噪声系数(NF)
    发表于 05-07 10:18

    西门子伺服电机简明样本

    西门子伺服电机简明样本
    发表于 04-14 15:36 2次下载

    NC401-C50H噪声二极管Noisecom 现货库存

    NC401-C50H噪声二极管Noisecom 现货库存NC401-C50H 是 Noisecom 公司生产的噪声二极管,属于 Noisecom 的NC400系列噪声二极管,能产生对称的高斯
    发表于 04-08 10:01

    是德示波器噪声水平的优化方法

    有效信息。本文将结合是德示波器的技术特点,从噪声来源分析、硬件优化、软件技术等多个维度,系统阐述降低示波器噪声水平的方法,并提供实际案例以供参考。 一、示波器噪声的来源与分类 示波器的
    的头像 发表于 04-03 17:50 904次阅读
    是德示波器<b class='flag-5'>噪声</b>水平的优化<b class='flag-5'>方法</b>

    VirtualLab Fusion应用:通过热透镜聚焦不同类型的高斯模式

    的精确物理光学传播技术可以对焦点区域进行详细分析,尤其是对于不同类型的高斯模式和热透镜等复杂聚焦元件。 Ince高斯光束聚焦 此用例演示了热透镜对 Ince-Gaussian模式的聚焦,该透镜由
    发表于 02-17 09:55

    高斯计霍尔探头对磁场测量什么影响?

    根据[霍尔效应]原理制成的高斯计在测量磁场中,有着广泛的应用。高斯计对磁场测量的准确度一般在5%-0.1%,但不同的设备,或同型号的设备,不同的探头,或同一支探头的不同侧面,去测量同一磁体表面,同一
    的头像 发表于 02-08 08:55 758次阅读

    多功能三维高斯

    大家对高斯计都不陌生,高斯计是检测磁体磁感应强度的专用仪器,是磁性测量领域中用途最为广泛的测量仪器之一。目前市面上高斯计普遍配备的是单向的霍尔探头,即只能测量一个方向的磁场强度。今天小编给大家带来
    的头像 发表于 02-06 14:28 638次阅读
    多功能三维<b class='flag-5'>高斯</b>计

    开关电源纹波噪声产生原因和测试方法

    本文简述了开关电源纹波噪声测试方法及延伸,同时分享纹波噪声测试使用设备,以及给出纹波噪声测试的具体方法,供大家学习参考。
    的头像 发表于 12-20 09:39 4776次阅读
    开关电源纹波<b class='flag-5'>噪声</b>产生原因和测试<b class='flag-5'>方法</b>