0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种简单高效的pipeline方法,在多个基准上获得了新的SOTA结果

智能感知与物联网技术研究所 来源:通信信号处理研究所 作者:通信信号处理研究 2020-12-07 11:26 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

端到端关系抽取涉及两个子任务:命名实体识别和关系抽取。近期研究多采用 joint 方式建模两个子任务,而陈丹琦等人新研究提出一种简单高效的 pipeline 方法,在多个基准上获得了新的 SOTA 结果。

端到端关系抽取旨在识别命名实体,同时抽取其关系。近期研究大多采取 joint 方式建模这两项子任务,要么将二者统一在一个结构化预测网络中,要么通过共享表示进行多任务学习。 而近期来自普林斯顿大学的 Zexuan Zhong、陈丹琦介绍了一种非常简单的方法,并在标准基准(ACE04、ACE05 和 SciERC)上取得了新的 SOTA 成绩。该方法基于两个独立的预训练编码器构建而成,只使用实体模型为关系模型提供输入特征。通过一系列精心检验,该研究验证了学习不同的语境表示对实体和关系的重要性,即在关系模型的输入层融合实体信息,并集成全局语境信息。 此外,该研究还提出了这一方法的高效近似方法,只需要在推断时对两个编码器各执行一次,即可获得 8-16 倍的加速,同时准确率仅小幅下降。

论文链接:https://arxiv.org/pdf/2010.12812.pdf pipeline 方法重回巅峰? 从非结构化文本中抽取实体及其关系是信息抽取中的基本问题。这个问题可以分解为两个子任务:命名实体识别和关系抽取。 早期研究采用 pipeline 方法:训练一个模型来抽取实体,另一个模型对实体之间的关系进行分类。而近期,端到端关系抽取任务已经成为联合建模子任务系统的天下。大家普遍认为,这种 joint 模型可以更好地捕获实体与关系之间的交互,并有助于缓解误差传播问题。 然而,这一局面似乎被一项新研究打破。近期,普林斯顿大学 Zexuan Zhong 和陈丹琦提出了一种非常简单的方法,该方法可以学习基于深度预训练语言模型构建的两个编码器,这两个模型分别被称为实体模型和关系模型。它们是独立训练的,并且关系模型仅依赖实体模型作为输入特征。实体模型基于 span-level 表示而构建,关系模型则建立在给定 span 对的特定语境表示之上。 虽然简单,但这一 pipeline 模型非常有效:在 3 个标准基准(ACE04、ACE05、SciERC)上,使用相同的预训练编码器,该模型优于此前所有的 joint 模型。 为什么 pipeline 模型能实现如此优秀的性能呢?研究者进行了一系列分析,发现:

实体模型和关系模型的语境表示本质上捕获了不同的信息,因此共享其表示会损害性能;

在关系模型的输入层融合实体信息(边界和类型)至关重要;

在两个子任务中利用跨句(cross-sentence)信息是有效的;

更强大的预训练语言模型能够带来更多的性能收益。

研究人员希望,这一模型能够引发人们重新思考联合训练在端到端关系抽取中的价值。 不过,该方法存在一个缺陷:需要为每个实体对运行一次关系模型。为了缓解该问题,研究者提出一种新的有效替代方法,在推断时近似和批量处理不同组实体对的计算。该近似方法可以实现 8-16 倍的加速,而准确率的下降却很小(例如在 ACE05 上 F1 分数下降了 0.5-0.9%)。这使得该模型可以在实践中快速准确地应用。 研究贡献 该研究的主要贡献有:

提出了一种非常简单有效的端到端关系抽取方法,该方法学习两个独立编码器,分别用于实体识别和关系抽取的。该模型在三个标准基准上达到了新 SOTA,并在使用相同的预训练模型的时,性能超越了此前所有 joint 模型。

该研究经过分析得出结论:对于实体和关系而言,相比于联合学习,学习不同的语境表示更加有效。

为了加快模型推断速度,该研究提出了一种新颖而有效的近似方法,该方法可实现 8-16 倍的推断加速,而准确率只有很小的降低。

方法 该研究提出的模型包括一个实体模型和一个关系模型。如下图所示,首先将输入句子馈入实体模型,该模型为每一个 span 预测实体类型;然后通过嵌入额外的 marker token 在关系模型中独立处理每对候选实体,以突出显示主语、宾语及其类型。

此外,研究者还介绍了该方法与 DYGIE++ 的区别(DYGIE++ 与该方法很接近,并且是最强的基线方法)。 1. 该研究提出的方法对实体模型和关系模型使用不同的编码器,未使用多任务学习;预测得到的实体标签直接作为关系模型的输入特征。 2. 关系模型中的语境表示特定于每个 span 对。 3. 该方法用额外的语境扩展输入,从而纳入跨句信息。 4. 该方法未使用束搜索或图传播层,因此,该模型要简单得多。 有效的近似方法 该研究提出的方法较为简洁有效,但是它的缺点是需要对每一个实体对运行一次关系模型。为此,研究者提出一种新型高效的替代性关系模型。核心问题在于,如何对同一个句子中的不同 span 对重用计算,在该研究提出的原始模型中这是不可能实现的,因为必须为每个 span 对分别嵌入特定的实体标记。因此,研究者提出了一种近似模型,该模型对原始模型做了两个重要更改。 首先,该近似方法没有选择直接将实体标记嵌入原始句子,而是将标记的位置嵌入与对应 span 的开始和结束 token 联系起来:

其次,近似方法为注意力层添加了约束:使文本 token 只注意文本 token 不注意标记 token,实体标记 token 则可以注意所有文本 token,4 个标记 token 全部与同一个 span 对关联。 这两项更改允许模型对所有文本 token 重用计算,因为文本 token 独立于实体标记 token。因而,该方法可以在运行一次关系模型时批量处理来自同一个句子的多个 span 对。 实验 研究人员在三个端到端关系抽取数据集 ACE04、ACE054 和 SciERC 上进行方法评估,使用 F1 分数作为评估度量指标。 下表 2 展示了不同方法的对比结果:

从图中可以看出,该研究提出的 single-sentence 模型实现了强大的性能,而纳入跨句语境后,性能结果得到了一致提升。该研究使用的 BERT-base(或 SciBERT)模型获得了与之前工作类似或更好的结果,包括那些基于更大型预训练语言模型构建的模型,使用较大编码器 ALBERT 后性能得到进一步提升。 近似方法的性能 下表展示了完全关系模型和近似模型的 F1 分数与推断速度。在两个数据集上,近似模型的推断速度显著提升。

这个 pipeline 模型为什么超过了 joint 模型? 除了展示方法和性能以外,该研究还深入分析了这一 pipeline 模型取得如此优秀性能的原因。 键入文本标记(typed text marker)的重要性 该研究认为,为不同 span 对构建不同语境表示非常重要,早期融合实体类型信息可以进一步提升性能。 为了验证键入文本标记的作用,研究者使用其不同变体在 ACE05 和 SciERC 数据集上进行实验,包括 TEXT、TEXTETYPE、MARKERS、MARKERSETYPE、MARKERSELOSS、TYPEDMARKERS 六种。 下表 4 展示了这些变体的性能,从中可以看出不同的输入表示确实对关系抽取的准确率产生影响。

实体和关系如何交互 人们对 joint 模型的主要认知是,对两个子任务之间交互的建模对彼此有所帮助。但这项研究并未采取这种方式,而是使用了两个独立的编码器。 研究人员首先研究了共享两个表示编码器能否提升性能。如下表 5 所示,简单地共享编码器对实体 F1 和关系 F1 分数均有所损害。研究人员认为,其原因在于两个任务具备不同的输入格式,需要不同的特征来预测实体类型和关系,因此使用单独的编码器可以学得更好的任务特定特征。

该研究的分析结果显示: 实体信息有助于预测关系,但实验未表明关系信息可以大幅提升实体性能。 仅共享编码器对该研究提出的方法无益。 如何缓解 pipeline 方式中的误差传播问题 pipeline 训练的一个主要缺陷是误差传播问题。使用 gold 实体(及其类型)进行关系模型训练,使用预测实体进行推断,可能会导致训练和测试之间存在差异。 为此,研究人员首先探究在训练阶段使用预测实体(而非 gold 实体)能否缓解这一问题。该研究采用 10-way jackknifing 方法,结果发现这一策略竟然降低了最终的关系性能。研究人员假设其原因在于训练阶段引入了额外的噪声。 在目前的 pipeline 方法中,如果在推断阶段 gold 实体没有被实体模型识别出来,则关系模型无法预测与该实体相关的任何关系。于是,研究人员考虑在训练和测试阶段,对关系模型使用更多 span 对。实验结果表明,这无法带来性能提升。 这些常识未能显著提升性能,而该研究提出的简单 pipeline 方法却惊人的有效。研究者认为误差传播问题并非不存在或无法被解决,我们需要探索更好的解决方案。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编码器
    +关注

    关注

    45

    文章

    3903

    浏览量

    141442
  • 模型
    +关注

    关注

    1

    文章

    3648

    浏览量

    51712
  • Pipeline
    +关注

    关注

    0

    文章

    29

    浏览量

    9911

原文标题:陈丹琦新作:关系抽取新SOTA,用pipeline方式挫败joint模型

文章出处:【微信号:tyutcsplab,微信公众号:智能感知与物联网技术研究所】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    指令集测试的一种纠错方法

    本文描述进行指令集测试的一种纠错方法 1.打开测试指令集对应的dump文件 dump文件是指由汇编文件进行反汇编之后,可以供人阅读指令的反汇编文件。其包含了每条指令的具体操作的信
    发表于 10-24 14:04

    光伏电站高效清洁利器:大功率无线充电器颠覆运维模式

    青岛鲁渝能源科技的光伏清扫机器人无线充电方案已经国内多个大型光伏电站成功应用,获得了客户的致好评。我们的技术团队持续创新,致力于为光伏行业提供更智能、更
    的头像 发表于 09-18 16:47 488次阅读

    是德示波器MSOX2024A时间基准稳定性的测试方法

    值有出入,进而使整个测量结果的准确性降低,影响对信号特性的判断与分析。 1.2 时间基准不稳定导致的测量误差 时间基准不稳定会带来多种测量误差,如时间间隔测量误差、频率测量误差等。时间间隔误差会使信号波形
    的头像 发表于 08-18 17:19 507次阅读
    是德示波器MSOX2024A时间<b class='flag-5'>基准</b>稳定性的测试<b class='flag-5'>方法</b>

    求助,关于TC387使能以及配置SOTA些问题求解

    你好, 之前我拿到贵司给个demo,里面有些使能以及配置SWAP的代码, 这里有些疑问 问题1. 判断SOTA功能是否生效,demo中使用的是 SCU_STMEM1中的bit位, 代码如下
    发表于 08-08 07:31

    一种新的无刷直流电机反电动势检测方法

    无位置传感器无刷直流电机的控制算法是近年来研究的热点之,有霍尔位置信号直流电机根据霍尔状态来确定通断功率器件。利用无刷直流电机的数学模型,根据反电动势检测原理,提出了一种新的线反电动势检测方法
    发表于 08-07 14:29

    汉思新材料取得一种PCB板封装胶及其制备方法的专利

    汉思新材料取得一种PCB板封装胶及其制备方法的专利汉思新材料(深圳市汉思新材料科技有限公司)于2023年取得了项关于PCB板封装胶及其制备方法
    的头像 发表于 06-27 14:30 452次阅读
    汉思新材料取得<b class='flag-5'>一种</b>PCB板封装胶及其制备<b class='flag-5'>方法</b>的专利

    多个i.MXRT共享颗Flash启动的方法与实践(下)

    多个i.MXRT共享颗Flash启动的方法与实践()》 文里痞子衡给大家从理论
    的头像 发表于 06-05 10:04 1033次阅读
    <b class='flag-5'>多个</b>i.MXRT共享<b class='flag-5'>一</b>颗Flash启动的<b class='flag-5'>方法</b>与实践(下)

    Matter 智能家居的通用语言

    Matter由连接标准联盟(CSA)创建,旨在解决智能家居的互操作性问题。Matter 基于简单性、互操作性、可靠性和安全性四大核心原则 。 是采用基于 IP 应用层的开源协议,本质一种“通用
    发表于 05-19 15:35

    永磁同步电机二阶迭代学习控制

    针对永磁同步电机存在的周期性脉动问题,提出了一种二阶 PD-型迭代学习控制策略,该算法能够 有效实现最优跟踪控制 。利用卷积的推广 Young 不等式,获得了系统跟踪误差 Lebesgue-p
    发表于 03-26 14:28

    晶扬电子获得新型开关芯片专利

    近日,深圳市晶扬电子有限公司成功获得了项关于新型开关芯片的专利,专利名称为“一种能够替代PMOS管的开关芯片”。该专利的授权公告号为CN118984150B,申请日期为2024年10月。这
    的头像 发表于 02-11 09:22 856次阅读

    基准定义、标注方法及设计选取

    用来建立基准并实际起基准作用的实际要素如条边、个表面或个孔等。
    的头像 发表于 01-23 10:27 5956次阅读
    <b class='flag-5'>基准</b>定义、标注<b class='flag-5'>方法</b>及设计选取

    中国电提出大模型推理加速新范式Falcon

    中提出的 Falcon 方法一种 增强半自回归投机解码框架 ,旨在增强 draft model 的并行性和输出质量,以有效提升大模型的推理速度。Falcon 可以实现约 2.91-3.51 倍的加速比,多种数据集
    的头像 发表于 01-15 13:49 1461次阅读
    中国电提出大模型推理加速新范式Falcon

    Mamba入局图像复原,达成新SOTA

    MambaIRv2,更高性能、更高效率!另外还有ACM MM 2024的Freqmamba方法图像去雨任务中取得了
    的头像 发表于 12-30 18:09 1617次阅读
    Mamba入局图像复原,达成新<b class='flag-5'>SOTA</b>

    是否可以将6片TLV5638的REF脚并联在起接到基准电压?

    我设计的个系统中,用到6片TLV5638作为DA输出,我使用外部基准电压作为REF的输入,请问我是否可以将6片TLV5638的REF脚并联在起接到基准电压? 这样使用会有什么影响
    发表于 12-27 08:27

    一种新型高效率的服务器电源系统

    一种新型高效率的服务器电源系统
    发表于 12-19 16:45 1次下载