0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于重叠和嵌套事件抽取领域的主流方法

深度学习自然语言处理 来源:深度学习自然语言处理 作者:深度学习自然语言 2022-09-30 15:24 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

本研究设计了一种简单有效的标签系统将重叠和嵌套事件抽取转换成了词对关系分类的任务,触发词、论元以及其间的关系可以并行地同时被预测出来,达到非常快的抽取速度,在3个重叠或嵌套的事件抽取数据集上的实验结果达到了SOTA。

一、动机介绍

1.1重叠和嵌套事件抽取

事件抽取(Event Extraction,EE)是自然语言处理领域的一项非常基本的任务,在社区长久以来一直得到广泛的研究。EE的目标是从文本中抽取事件触发词和相关的论元。传统的事件抽取关注于普通的事件,认为触发词和论元之间没有重叠,忽视了复杂的事件模式,即重叠事件和嵌套事件:

Flat Event:触发词和论元之间没有重叠;

Overlapped Event:多个事件的共享重叠的触发词或论元;

Nested Event:一个事件的论元是另外一个事件。

ceff6b20-3fef-11ed-b1c7-dac502259ad0.png

图1:普通事件(a),重叠事件(b),嵌套事件(c)

以图1为例,(b)中Investment事件和Share Transfer事件共享了”acquired”这一重叠触发词,以及”Citic Securities”,”Guangzhou Securities”是重叠的论元。(c)中Gene Expression事件是Positive Regulation的Theme论元。

1.2重叠和嵌套事件抽取方法

截止当前,重叠和嵌套事件抽取领域的主流方法大致有三类:

基于Pipleline的方法;

基于多轮QA的方法;

基于级联网络的方法。

这些方法都是Multi-stage的,用多个连续的阶段分别抽取事件触发词和论元。其中,基于级联网络的方法CasEE是之前的SOTA,CasEE依次预测事件类型、抽取触发词、抽取论元。这些Multi-stage的方法后面阶段的预测依赖于前面的预测结果,难以避免地带来了误差传播的问题。

本研究关注于构建一种高效的EE框架,能够在一个阶段同时解决重叠和嵌套的事件抽取。

1.3本文的方法

传统的事件抽取使用序列标注的方法无法解决重叠和嵌套的问题,现有的工作使用指针网络分别识别触发词或论元的头尾token;我们在针对重叠和嵌套事件的共性进行深入挖掘后,发现可以通过token-pair之间的关系分类进行统一建模。触发词和论元可以通过token-head和token-tail之间联系,而论元的角色可以通过触发词和论元之间的关系建模,例如图1(b)中触发词”acquired”和论元”Guangzhou Securities”表达了object关系。

根据上述观察,本文将Overlapped and Nested EE任务转化成一种词对的关系分类任务,通过这种标签体系能够在一个阶段内抽取出事件类型、触发词、论元以及论元的角色,在此基础提出了一种新的EE框架(A One-Stage Framework for Fast Overlapping and Nested Event Extraction),名为OneEE。具体地,该框架的目标是将EE转变为识别出触发词和论元中所蕴含的两种类型的关系,即:

Span关系(S-T, S-A);

Role关系(R-*);

具体的词对关系分类示例如图2所示。其中S-T表示两个词是某个触发词的头部和尾部,S-A表示两个词是某个论元的头部和尾部(如”Citic”->”Securities”,Argument),R-*表示该词作为触发词的事件中,另一个词扮演了角色类型为*的论元(如“acquired”->“Citic Securities”,Subject)。

cf146d68-3fef-11ed-b1c7-dac502259ad0.png

图2:关系分类示例

二、模型框架

图3给出了OneEE整体的框架结构。其整体可分为三层:输入编码层,自适应事件融合曾以及最后的联合解码层。其中解码层是本论文的核心。

cfa6247e-3fef-11ed-b1c7-dac502259ad0.png

图3:模型整体结构

2.1 编码层

给定一个输入句子,将每一个词转换成多个word piece,并将他们输入预训练的BERT模块中。进过BERT计算后,使用最大池化操作将这些word piece表示重新聚合成词表示。

2.2 自适应事件融合层

由于该框架的目标是预测目标事件类型的词对之间的关系,因此生成高质量的事件感知的表示十分重要。因此,为了融合编码器提供的事件信息和上下文信息,本论文设计了一个自适应事件融合层。其中注意力模块用于建模不同事件类型之间的交互并获得全局事件信息,两个门融合模块用于将全局事件信息和目标事件类型信息与上下文化的词表示融合。

2.3 解码层

在自适应事件融合层之后,获得了事件感知的词表示,用于预测词对之间的Span关系和Role关系,对于每个词对(w_i , w_j ),计算一个分数来衡量它们对于关系 s ∈ S 和 r ∈ R 的可能性。为了使预测层对于词与词之间的相对距离敏感,论文还引入了旋转式的相对位置编码,设计了距离感知的打分函数。损失函数部分本文使用了Circle Loss的变体,将交叉熵损失扩展到多标签分类问题,并缓解了类别不均衡的问题。

在解码阶段,该模型通过将事件类型Embedding并行地插入自适应事件融合层来抽取所有事件。如图 4 所示,一旦该模型在一个阶段预测了某种事件类型的所有标签,整个解码过程可以概括为四个步骤:首先,获得触发词或论元的开始和结束索引;其次,获得触发词和论元的span;第三,根据 R-* 关系匹配触发词和论元;最后,将事件类型分配给该事件结构。

cfd4827e-3fef-11ed-b1c7-dac502259ad0.png

图4:解码示例

三、实验结果

本文在3个重叠和嵌套的事件抽取数据集上(包括英文和中文)进行了实验,分别是:

FewFC,一个中文金融事件抽取数据集,标注了10种事件类型和18种论元,有约22%的句子包含重叠事件;

Genia 11和Genia 13,两个英文医学领域数据集,有约18%的句子包含嵌套事件,Genia11 标注了9种事件类型和10种论元,而Genia13的数字是13和7。

表1-2分别展示了上述任务和数据集上与基线模型对比的结果。实验结果表明,本文提出的基于词对关系分类的One-Stage方法,可以同时解决重叠和嵌套的事件抽取,并在3个数据集上的效果都优于之前的工作,并且推理速度也是最快的。

d1375f42-3fef-11ed-b1c7-dac502259ad0.png

表1:FewFC, 重叠事件抽取

d20cec3e-3fef-11ed-b1c7-dac502259ad0.png

表2:Genia 11和Genia 13, 嵌套事件抽取

d2ae4962-3fef-11ed-b1c7-dac502259ad0.png

图5:重叠事件与嵌套事件抽取效果对比

d2dfe350-3fef-11ed-b1c7-dac502259ad0.png

图6:触发词和论元不同距离论元角色抽取效果对比

通过进一步的消融实验,我们探索了不同参数和部件对整体框架的影响。此外我们模型在相对较小的参数情况下,其训练和推理速度超过了多个非连续实体识别模型。

d32ab7ea-3fef-11ed-b1c7-dac502259ad0.png

表6:消融实验

d3457fbc-3fef-11ed-b1c7-dac502259ad0.png

表 7:模型参数与效率对比

四、总结

在本文中,我们提出了一种基于词-词关系识别的新型单阶段框架,以同时解决重叠和嵌套的事件抽取。词对之间的关系被预定义为触发词或论元内的词-词关系以及跨越触发词-论元对。此外,我们提出了一个有效的模型,该模型由一个用于融合目标事件表示的自适应事件融合层和一个用于联合识别各种关系的距离感知的预测层组成。实验结果表明,我们提出的模型在三个数据集上实现了新的 SoTA 结果,并且比 SoTA 模型更快。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编码器
    +关注

    关注

    45

    文章

    3903

    浏览量

    141409
  • 网络
    +关注

    关注

    14

    文章

    8129

    浏览量

    93072
  • 框架
    +关注

    关注

    0

    文章

    404

    浏览量

    18313
  • 模型
    +关注

    关注

    1

    文章

    3648

    浏览量

    51700

原文标题:COLING 2022 | 基于token-pair关系建模解决重叠和嵌套事件抽取的One-stage框架

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    面向领域的Web数据抽取与集成架构

    数据抽取与集成架构,在给出Web数据模型与Web数据模式、领域数据模型和领域数据模式等相关概念基础上,提出Web数据模式与领域数据模式的映射方法
    发表于 12-08 11:40 0次下载
    面向<b class='flag-5'>领域</b>的Web数据<b class='flag-5'>抽取</b>与集成架构

    基于本体约束的知识抽取方法

    在信息抽取领域,命名实体识别方法可以为实体赋予正确的语义,实体关系抽取则可以明确两个实体间的关系语义。但从知识的角度来看,无论是命名实体识别还是实体关系
    发表于 12-19 11:24 0次下载
    基于本体约束的知识<b class='flag-5'>抽取</b><b class='flag-5'>方法</b>

    基于标签优先的抽取排序方法

    针对微博关键词抽取准确率不高的问题,提出一种基于标签优先的抽取排序方法。该方法利用微博本身具有的社交特征标签,从微博内容集中抽取关键词。该
    发表于 12-25 15:04 0次下载
    基于标签优先的<b class='flag-5'>抽取</b>排序<b class='flag-5'>方法</b>

    基于WebHarvest的健康领域Web信息抽取方法

    针对Web信息抽取(WIE)技术在健康领域应用的问题,提出了一种基于WebHarvest的健康领域Web信息抽取方法。通过对不同健康网站的结
    发表于 12-26 13:44 0次下载

    基于自动关键词抽取方法

    科学、心理学和社会科学等多个方面研究了自动关键词抽取的理论基础.从宏观、中观和微观角度,回顾和分析了自动关键词抽取的发展、技术和方法.针对目前广泛应用的自动关键词抽取
    发表于 12-26 16:47 2次下载
    基于自动关键词<b class='flag-5'>抽取</b><b class='flag-5'>方法</b>

    基于XML特征的网页文本抽取方法

    Web信息抽取(Web Information Extraction,简称WIE)是指:给出属于同一类型的若干样本网页。找出它们的源数据集的嵌套结构,并将源数据集从网页中抽取出来。即通过对原文
    发表于 01-02 14:14 0次下载

    语料库中术语抽取算法

    术语抽取在中文信息处理领域中是一项重要的基础性研究课题。随着科技、经济、文化的快速发展,各个学科领域中的术语也发生了很大变化,为了及时了解学科的发展动态,术语抽取的需求应运而生。术语
    发表于 01-12 14:12 0次下载

    节点属性的海量Web信息抽取方法

    为解决大数据场景下从海量Web页面中抽取有价值的信息,提出了一种基于节点属性与正文内容的海量Web信息抽取方法。将Web页面转化为DOM树表示,并提出剪枝与融合算法,对DOM树进行简化;定义DOM
    发表于 02-06 14:36 0次下载

    模型NLP事件抽取方法总结

    本系列文章主要分享近年来事件抽取方法总结,包括中文事件抽取、开放域事件抽取、事件数据生成、跨语言事件抽取、小样本事件
    的头像 发表于 12-31 10:19 1.1w次阅读
    模型NLP事件<b class='flag-5'>抽取</b><b class='flag-5'>方法</b>总结

    实体关系联合抽取取得SOTA的三种方法

    2020实体关系联合抽取一片红海,各种SOTA方法你方唱罢我方登场,在一些数据集上也是不断刷出新高度,为信息抽取领域带来了新思路,推动了信息抽取
    的头像 发表于 02-10 17:08 1.4w次阅读
    实体关系联合<b class='flag-5'>抽取</b>取得SOTA的三种<b class='flag-5'>方法</b>

    基于句法语义依存分析的金融事件抽取

    事件抽取在自然语言处理应用中扮演着重要的角色,如股票市场趋势预测.传统事件抽取较为关注触发词和论元所属类型的正确性,较少地结合应用需求去分析研究事件抽取效果及使用价值.在财经领域,事件
    发表于 03-24 14:03 8次下载
    基于句法语义依存分析的金融事件<b class='flag-5'>抽取</b>

    抽取式摘要方法中如何合理设置抽取单元?

    的核心问题。抽取式摘要则是文本摘要技术中效果稳定,实现简单的一类方法,本文结合COLING 2020中抽取式摘要相关的两篇最新工作,对抽取式摘要方法
    的头像 发表于 05-03 18:23 2132次阅读
    <b class='flag-5'>抽取</b>式摘要<b class='flag-5'>方法</b>中如何合理设置<b class='flag-5'>抽取</b>单元?

    基于规则的商品评论搭配抽取方法

    分析商品评论中评价对象和评价短语的词性和句法关系,提出一种使用规则模板进行评价搭配抽取方法。通过词性、依存句法分析及语义依存分析结果,设计核心搭配抽取规则。引入COO算法及改进的ATT链算法,根据
    发表于 06-11 10:50 128次下载

    如何用一种级联的并解决嵌套的实体的三元组抽取模型?

    关系抽取是自然语言处理中一个比较基础的任务,除了关系抽取之外还有类似的任务如:属性抽取等。
    的头像 发表于 02-08 09:28 1810次阅读
    如何用一种级联的并解决<b class='flag-5'>嵌套</b>的实体的三元组<b class='flag-5'>抽取</b>模型?

    if嵌套函数的正确输入方法

    输入方法是在if语句内部创建一个新的函数。这个函数可以是一个匿名函数或者是一个有名称的函数,具体取决于你的需求和偏好。下面是一个if嵌套函数的正确输入方法的示例: def main_function
    的头像 发表于 11-30 16:50 2071次阅读