0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何用一种级联的并解决嵌套的实体的三元组抽取模型?

自然语言处理爱好者 来源:AIAS编程有道 2023-02-08 09:28 次阅读

前言

关系抽取是自然语言处理中一个比较基础的任务,除了关系抽取之外还有类似的任务如:属性抽取等。这些任务也都可看成三元组抽取,即(subject,predicate,object)。常见的抽取范式包含:

基于pipeline的分布抽取方式,在已知两个实体subject和object,去预测predicate。

联合抽取方式,一个模型同时将subject,predicate和object抽取出来。

「现实的场景中还存在重叠关系情况,那么针对这种情况该如何解决呢?」ACL2020有一篇论文:A Novel Cascade Binary Tagging Framework for Relational Triple Extraction[1]介绍了如何一种级联的并解决嵌套的实体的三元组(文中介绍的是关系抽取)抽取模型。下面我们来看看这篇论文介绍的内容。

背景

早期基于pipeline的方法首先识别出语句中的所有实体,然后在对所有的实体对分类。这种方式的一个缺点是:实体识别过程中的误差会被引入到关系抽取的环节中,如下图中的Normal情况。

现有的联合抽取模型中不能够有效地解决:一个句子包含多个相互重叠的关系三元组。如下图中的EPO和SEO。

前言

关系抽取是自然语言处理中一个比较基础的任务,除了关系抽取之外还有类似的任务如:属性抽取等。这些任务也都可看成三元组抽取,即(subject,predicate,object)。常见的抽取范式包含:

基于pipeline的分布抽取方式,在已知两个实体subject和object,去预测predicate。

联合抽取方式,一个模型同时将subject,predicate和object抽取出来。

「现实的场景中还存在重叠关系情况,那么针对这种情况该如何解决呢?」,ACL2020有一篇论文:A Novel Cascade Binary Tagging Framework for Relational Triple Extraction[1]介绍了如何一种级联的并解决嵌套的实体的三元组(文中介绍的是关系抽取)抽取模型。下面我们来看看这篇论文介绍的内容。

背景

早期基于pipeline的方法首先识别出语句中的所有实体,然后在对所有的实体对分类。这种方式的一个缺点是:实体识别过程中的误差会被引入到关系抽取的环节中,如下图中的Normal情况。

现有的联合抽取模型中不能够有效地解决:一个句子包含多个相互重叠的关系三元组。如下图中的EPO和SEO。

poYBAGPi-w2AJZ6AAAEnKUp7tzg862.jpg

EPO(Entity Pair Overlap)实体对的重叠,换句话说一个实体对包含多种关系,文中的例子就是一个人同时担任一部电影中的导演和演员的角色。

SEO(Single Entity Overlap)单个实体的重叠,就是有多个关系共享一个实体。

在2020年,预训练模型大行其道的时期下,文中也是结合了Bert模型完成文本的特征抽取工作。文中的模型在当时也达到了sota水平,下面我们看看模型的具体内容。

模型结构

关系三元组提取的目标是识别句子中所有可能的三元组(主语、关系、宾语),其中一些三元组可能与主语或宾语共享相同的实体。数学表达如下:
pYYBAGPi-z2AV6q0AAE7kBlmJ6c146.jpg
poYBAGPi-0WAfiwdAAHR72r561o641.jpg
pYYBAGPi-02AU1WiAAGqtlmaeF0972.jpg

具体如下:

BERT Encoder

编码器模块中,使用预训练Bert模型提取语句的特征为,作为接下来的tagging模块的输入。

Cascade Decoder

该模块主要分为两个部分,首先从输入的语句中监测出subjects,即Subject Tagger。接着对候选的subject,检查其可能的所有关系类型,即Relation-Specific Object Taggers

Subject Tagger

在这个模块中主要去识别输入语句中可能存在的subjects。每一个token会输出两个结果:start和end,通过为每个token分配一个二进制标记(0/1)来分别检测subject的开始和结束位置,该标记指示当前标记是否对应于subject的开始或结束位置。subject标记器对每个token的详细操作如下:

其中:

poYBAGPi-4SAdY1bAAHV6gAyWh4761.jpg
poYBAGPi-4yAJL5eAAHVFUr-aPY146.jpg
pYYBAGPi-5SANdB6AAFI8-CAJm4952.jpg

总结

实验效果如下图:
poYBAGPi-7GABYrMAAIcrLoLxoY399.jpg




审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编码器
    +关注

    关注

    41

    文章

    3360

    浏览量

    131539
  • SEO
    SEO
    +关注

    关注

    0

    文章

    46

    浏览量

    9803

原文标题:一种基于联合方式的三元组抽取模型——CasRel

文章出处:【微信号:NLP_lover,微信公众号:自然语言处理爱好者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    乙烯装置三元制冷技术

    乙烯装置三元制冷技术摘 要 简介了三元制冷系统的设计思路和工艺流程,针对开车运行过程中出现的问题,总结了处理方法。关键词 乙烯 三元制冷 技术 在齐鲁乙烯720kt/ a 改造工程中,额外增加的全部
    发表于 03-18 22:14

    三元一次方程组的C语言程序

    C语言课上闲来无事,让同学给我出个题,同学直接来了句“解个三元一次方程组”,好吧,我做。现在做出来了,用的是矩阵。现在解不了无穷多解的,而且由于C语言中实数位数的问题,例如:结果明明是2,它会显示
    发表于 05-06 21:08

    NLPIR在文本信息提取方面的优势介绍

    构建知识图谱需要满足项要素要求,分别是实体,关系和属性。文本信息提取,则是在文本中提出三元信息,包括实体和关系的信息,实体和属性的信息,
    发表于 09-12 15:33

    物联网云服务:出厂时免烧录设备证书,运行时动态注册【1】

    。背景:阿里云物联网平台设备证书(三元组)提供密和密两方式,以让每个设备有唯
    发表于 10-25 16:20

    请问怎么设计一种级联型多电平变流器?

    怎么设计一种级联型多电平变流器?级联型多电平变流器具有哪些特点?基于STS—SVM的级联型多电平变流器有什么技术特点?
    发表于 04-14 06:48

    回收电芯,回收库存电芯,回收聚合物电芯,回收锂电芯,回收动力电芯三元电芯回收

    回收电芯,回收库存电芯,回收聚合物电芯,回收锂电芯,回收动力电芯三元电芯
    发表于 08-24 11:57

    回收电池,回收动力电池,回收动力锂电池,回收三元动力电池,回收锂电池

    锂电池,回收三元动力电池,回收锂电池锂电池回收 锂电池模组回收软包锂电池回收圆柱锂电池回收动力锂电池回收库存锂电池回收库存退役锂电池回收 库存电动大巴电池回收汽车电池回收 共享单车电池回收
    发表于 09-10 16:35

    怎样去设计一种CIC抽取滤波器对其进行MATLAB仿真呢

    为什么要设计一种理想滤波器呢?CIC抽取滤波器是由哪些部分组成的?怎样去设计一种CIC抽取滤波器对其进行MATLAB仿真呢?
    发表于 11-19 07:29

    根据mac地址创建五元组的步骤

    1. 确认wifi的mac地址根据实际情况得到开发板wifi的mac地址,通常通过命令iwpriv wifi_debug get_mac可知。2. 创建特定五元组在生活物联网平台,本文以mac地址为
    发表于 03-08 07:37

    三元锂快充充电电路,带二次保护

    求四串一并三元锂充电电路,带二次保护,8A持续放电,type-c接口充电,支持快充PD3.0
    发表于 11-01 23:01

    一种从零搭建汽车知识的语义网络及图谱思路

    1、如何进行图谱构建呢?  构建挑战  知识图谱是真实世界的语义表示,其基本组成单位是“实体-关系-实体”,“实体-属性-属性值”的三元组(Triplet),
    发表于 11-22 15:37

    借助局部实体特征的事件触发词抽取方法

    于神经网络的触发词抽取模型利用实体信息判别触发词,但大量无关实体会影响触发词抽取效果。提出一种
    发表于 05-26 15:24 2次下载

    介绍一种新颖的三元组对比学习训练框架

    在自然语言处理和知识图谱领域的信息提取中,三元组抽取是必不可少的任务。
    的头像 发表于 06-23 15:56 3025次阅读
    介绍<b class='flag-5'>一种</b>新颖的<b class='flag-5'>三元组</b>对比学习训练框架

    本体自动化构建方法—面向制造领域人机物三元数据融合

    控制机制,提出一种基于本体的人机物三元数据融合方法,研究复杂制造环境下的人机物三元数据融合建模.在抽取三元组时,区别于传统的流水线式
    的头像 发表于 05-11 17:30 2683次阅读

    实体关系抽取模型CasRel

    许多实验证明联合学习方法由于考虑了两个子任务之间的信息交互,大大提升了实体关系抽取的效果,所以目前针对实体关系抽取任务的研究大多采用联合学习方法。
    的头像 发表于 07-21 14:11 3251次阅读