0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

半监督算法DocRE的新组件

深度学习自然语言处理 来源:深度学习自然语言处理 作者:深度学习自然语言 2022-08-31 15:08 次阅读

今天给大家分享的是是ACL 2022上与实体关系抽取相关的部门论文范读笔记。其中有一些小喵自己也在学习,后续会推出精读笔记。

1. DocRE

论文概括:具有自适应焦点损失和知识蒸馏的文档级关系抽取

文档级关系抽取要同时从多个句子中提取关系。针对这个任务,本文提出了一个半监督算法 DocREDocRE 共有三个新组件:

第一,用轴向注意力模块学习实体对之间的依赖关系。

第二,提出了一个自适应的焦点损失来解决DocRE中类的不平衡问题。

最后,利用知识蒸馏来克服人工标注数据与远程监督数据之间的差异。

现有问题:现存的方法关注实体对的句法特征,而忽略了实体对之间的交互作用;目前还没有工作可以直接地解决类的不平衡问题。现存的工作仅仅关注阈值学习来平衡正例和负例,但正例内部的类不平衡问题并没有得到解决;关于将远程监督数据应用于DocRE任务的研究很少。

贡献点

轴向注意力:提升two-hop关系的推理能力;

自适应焦点损失:解决标签分配不平衡的问题,长尾类在总的损失中占比较多;

知识蒸馏:克服标注数据和远程监督数据之间的差异。

cdb08722-284d-11ed-ba43-dac502259ad0.pngDocRE

2. PL-Marker

论文名称:《Packed Levitated Marker for Entity and Relation Extraction》

论文链接:https://aclanthology.org/2022.acl-long.337.pdf

代码地址:https://github.com/thunlp/PL-Marker

论文概括:打包悬浮标记用于实体和关系抽取

最近的命名实体识别和关系抽取工作专注于研究如何从预训练模型中获得更好的span表示。然而,许多工作忽略了span之间的相互关系。本文提出了一种基于悬浮标记的span表示方法,在编码过程中通过特定策略打包标记来考虑span之间的相互关系。对于命名实体识别任务,提出了一种面向邻居span的打包策略,以更好地建模实体边界信息。对于关系抽取任务,设计了一种面向头实体的打包策略,将每个头实体以及可能的尾实体打包,以共同建模同头实体的span对。

cdd60db2-284d-11ed-ba43-dac502259ad0.pngPL-Marker

3. CRL

论文名称:《Consistent Representation Learning for Continual Relation Extraction》

论文链接:https://aclanthology.org/2022.findings-acl.268.pdf

代码地址:https://github.com/thuiar/CRL

论文概括:一致表示学习用于连续关系抽取

通过对比学习和回放记忆时的知识蒸馏,提出一种新颖的一致性表示学习方法。使用基于记忆库的监督对比学习来训练每一个新的任务,以使模型高效学习特征表示。为了防止对老任务的遗忘,构造了记忆样本的连续回放,同时让模型保留在知识蒸馏中历史任务之间的关系。

cdf3f728-284d-11ed-ba43-dac502259ad0.pngCRL

4. MCMN

论文名称:《Pre-training to Match for Unified Low-shot Relation Extraction》

论文链接:https://aclanthology.org/2022.acl-long.397.pdf

代码地址:https://github.com/fc-liu/MCMN

论文概括:预训练用于匹配统一少样本关系抽取

低样本关系抽取旨在少样本甚至零样本场景下的关系抽取。由于低样本关系抽取所包含任务形式多样,传统方法难以统一处理。本文针对这一问题,提出了一种统一的低样本匹配网络

基于语义提示(prompt)范式,构造了从关系描述到句子实例的匹配网络模型;

针对匹配网络模型学习,设计了三元组-复述的预训练方法,以增强模型对关系描述与实例之间语义匹配的泛化性。

在零样本、小样本以及带负例的小样本关系抽取评测基准上的实验结果表明,该方法能有效提升低样本场景下关系抽取的性能,并且具备了较好的任务自适应能力。

ce1c996c-284d-11ed-ba43-dac502259ad0.png

审核编辑:彭静

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    6511

    浏览量

    87598
  • 编码
    +关注

    关注

    6

    文章

    835

    浏览量

    54457
  • 训练模型
    +关注

    关注

    1

    文章

    35

    浏览量

    3755

原文标题:4. MCMN

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【阿里云大学免费精品课】机器学习入门:概念原理及常用算法

    学习:与监督学习相比,训练集没有人为标注的结果。常见的无监督学习算法有聚类等。•监督学习:介于监督
    发表于 06-23 13:51

    经典算法大全(51个C语言算法+单片机常用算法+机器学十大算法

    试题学SPFA算法整体来说,机器学习算法可以分为 3 大类:0.1 监督学习 工作原理:该算法由自变量(协变量、预测变量)和因变量(结果变量)组成,由一组自变量对因变量进行预测。通过这
    发表于 10-23 14:31

    刚性电缆组件五点重要认识

    刚性电缆组件的最基本形式为由金属管构成的同轴传输线。其中,所述金属管一般为形成外导体的铜管,沿该铜管的中心线设有金属丝导体。所述中心金属丝导体由介电材料支撑,从而保持于上述外导体的同一中心轴线上。Pasternack公司刚性
    发表于 07-02 07:09

    人工智能基本概念机器学习算法

    :用来训练,构建模型。验证集:在模型训练阶段测试模型的好坏。测试集:等模型训练好后,评估模型的好坏。学习方式:监督学习:训练带有标签的数据集。无监督学习:训练无标签的数据集。监...
    发表于 09-06 08:21

    监督典型相关分析算法

    监督典型相关分析算法:在典型相关分析算法(canonical correlation analysis,简称CCA)的基础上,通过引入以成对约束形式给出的监督信息,提出了一种半
    发表于 10-31 08:59 12次下载

    广义的监督局部保留投影算法

    针对监督的局部保留投影算法(Supervised Locality Preserving Projection,SLPP)在小样本情况下矩阵的奇异性问题,该文提出了一种广义的监督局部保留投影
    发表于 11-11 15:44 4次下载

    基于C均值聚类和图转导的半监督分类算法

    针对传统图转导( GT)算法计算量大并且准确率不高的问题,提出一个基于C均值聚类和图转导的半监督分类算法。首先,采用模糊C均值(FCM)聚类算法先对未标记样本预选取,缩小图转导
    发表于 11-28 16:36 0次下载
    基于C均值聚类和图转导的半<b class='flag-5'>监督</b>分类<b class='flag-5'>算法</b>

    基于最优投影的半监督聚类算法

    针对谱聚类算法在解决高维、大数据量的聚类问题时出现的效率不高和准确率明显下降的问题进行了研究,并在此研究基础上结合最优投影理论和Nystrom抽样提出了基于最优投影的半监督谱聚类算法
    发表于 01-14 11:54 0次下载

    基于半监督学习框架的识别算法

    问题,对半监督学习中的协同训练算法进行改进,提出了一种基于多学习器协同训练模型的人体行为识别方法.这是一种基于半监督学习框架的识别算法,该方法首先通过基于Q统计量的学习器差异性度量选择
    发表于 01-21 10:41 1次下载

    如何用Python进行无监督学习

    监督学习是一种用于在数据中查找模式的机器学习技术。无监督算法给出的数据不带标记,只给出输入变量(X),没有相应的输出变量。在无监督学习中,算法
    的头像 发表于 01-21 17:23 3962次阅读

    机器学习算法中有监督和无监督学习的区别

    监督学习的好处之一是,它不需要监督学习必须经历的费力的数据标记过程。但是,要权衡的是,评估其性能的有效性也非常困难。相反,通过将监督学习算法的输出与测试数据的实际标签进行比较,可以很
    的头像 发表于 07-07 10:18 5377次阅读

    一种基于光滑表示的半监督分类算法

    。文中提岀了一种基于光滑表示的半监督分类算法。具体来说,此方法通过应用一个低通滤波器来实现数据的平滑,然后将光滑数据用于半监督分类。此外,所提方法将常见的图构造和标签传播集成到一个统一的优化框架中,使它们互相
    发表于 04-08 10:47 17次下载
    一种基于光滑表示的半<b class='flag-5'>监督</b>分类<b class='flag-5'>算法</b>

    光伏组件热斑电池片功率损耗的简化算法研究

    光伏组件热斑电池片功率损耗的简化算法研究说明。
    发表于 05-17 09:51 2次下载

    基于无监督稀疏自编码的图像哈希算法

    基于无监督稀疏自编码的图像哈希算法
    发表于 06-28 16:46 32次下载

    快速HAC聚类算法的改进及应用于无监督语音分割

    快速HAC聚类算法的改进及应用于无监督语音分割(电源输入电容温度高)-该文档为快速HAC聚类算法的改进及应用于无监督语音分割简介资料,讲解的还不错,感兴趣的可以下载看看……………………
    发表于 07-26 11:01 1次下载
    快速HAC聚类<b class='flag-5'>算法</b>的改进及应用于无<b class='flag-5'>监督</b>语音分割