0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何解决NER覆盖和不连续问题

深度学习自然语言处理 来源:深度学习自然语言处理 作者:zenRRan 2021-09-08 10:48 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

论文:A Span-Based Model for Joint Overlapped and DiscontinuousNamed Entity Recognition

链接:https://aclanthology.org/2021.acl-long.372.pdf

代码:https://github.com/foxlf823/sodner

提取摘要

由于普通的NER问题被研究的透透的了,本文主要解决一种稍微复杂些问题:一种带有覆盖和不连续(Overlapped and Discontinuous)的命名实体识别任务。

而在这两者研究上来说,前人只是要么解决覆盖问题,要么解决不连续问题,但是本文提出一种联合解决这两种问题的span-based方法。

span-based方法昨天也提到过了,所以关于实体+关系抽取的任务都可以尝试。

本文通过两个步骤构建模型:

通过列举所有可能的text span来识别出实体片段(entity fragments);

在这些entity fragments上预测是两种关系overlapping or succession。

这样,我们不仅可以识别Discontinuous的实体,同时也可以对Overlapped的实体进行双重检查。

通过上述方法轻松将NER装换成RE(Relation Extraction)任务。最终实验在很多数据集上比如CLEF, GENIA andACE05上展现除了很强劲的性能。

该模型的步骤为

input一方面通过pre-train模型获取word rep,一方面通过dependency parsing获取句法信息;

GCN集合LSTM的输出和句法输入,得到syntax-enhanced的新的表达;

获取所有span表示;

通过两个MLP预测span是否为实体,以及实体时间是否有关系;

最后每个loss加上权重,为最终优化目标。

关键分类

AGGCN用来融入句法信息

attention-guided GCN (AGGCN)比普通GCN要强一些,所以这里选用该方法。传统的GCN:

124ac384-1003-11ec-8fb8-12bb97331649.png

而AGGCN就是使用self-attention,替换以前的邻接矩阵A,最后通过线性方法将multi head生成的结果合一:

12545908-1003-11ec-8fb8-12bb97331649.png

Span的表示

解码先预测实体片段,再预测关系。

12860e4e-1003-11ec-8fb8-12bb97331649.png

解码公式

损失计算

实验实验数据介绍

在数据上的表现

在其他数据上与前人的对比,虽然性能不如SOTA,但是这种Span-based方式和SOTA差不了多少,是个新颖的想法。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3873

    浏览量

    52338
  • nlp
    nlp
    +关注

    关注

    1

    文章

    491

    浏览量

    23366

原文标题:ACL2021 | 一种巧妙解决NER覆盖和不连续问题的方法

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    靠港供电总中断,CSD 船用变压器如何保障船舶用电连续宕机?

    频发,船东苦不堪言,CSD船用变压器如何保障靠港供电连续宕机?靠港供电中断,90%源于变压器适配性不足与性能不稳定。一是电压波动大,普通变压器转换精度差,岸电侧
    的头像 发表于 04-12 00:00 1113次阅读
    靠港供电总中断,CSD 船用变压器如何保障船舶用电<b class='flag-5'>连续</b><b class='flag-5'>不</b>宕机?

    优比施UPS电源如何解决进出口设备电压匹配

    在全球化工业协作日益紧密的今天,越来越多企业涉足进出口精密设备业务,但电压匹配问题却成为了阻碍业务顺畅推进的“隐性壁垒”。据中国机电产品进出口商会2025年数据显示,32%的出海设备因电压问题导致
    的头像 发表于 03-27 10:18 242次阅读
    优比施UPS电源如<b class='flag-5'>何解</b>决进出口设备电压<b class='flag-5'>不</b>匹配

    芯片测试覆盖率99%就够了吗?给DFT设计提个醒

    芯片测试的目标是在合理时间内筛选出所有制造缺陷。测试覆盖率是衡量测试完备性的核心指标,但实践中常存在误区。本文探讨如何有效评估覆盖率,并将其反馈至芯片设计阶段。一、测试覆盖率的真实含义与评估局限
    发表于 02-06 11:06

    何解决太诱电感与PCB热膨胀系数匹配问题?

    要解决太诱电感与PCB热膨胀系数(CTE)匹配问题,需从材料选择、结构设计、工艺优化和辅助材料应用四个维度协同入手,通过降低热应力集中、吸收膨胀差异、优化热循环过程,实现可靠性的提升。以下是具体
    的头像 发表于 01-28 17:41 310次阅读
    如<b class='flag-5'>何解</b>决太诱电感与PCB热膨胀系数<b class='flag-5'>不</b>匹配问题?

    PCB阻焊覆盖的唯一依据:Gerber文件

    PCB阻焊覆盖的唯一依据:Gerber文件 工程师研习社 工程师研习社 2026年1月15日 08:02 广东 PCB交付后,制造商时常收到如上问题反馈。 部分工程师认为阻焊覆盖只需在下单时勾选
    发表于 01-23 13:58

    机场800兆数字集群信号覆盖

    机场800兆数字集群信号覆盖
    的头像 发表于 12-11 13:13 2410次阅读
    机场800兆数字集群信号<b class='flag-5'>覆盖</b>

    为何晶振并联一个1MΩ电阻?晶振低温起振如何解

    在无源晶振应用方案中,两个外接电容能够微调晶振产生的时钟频率。而并联1MΩ电阻可以帮助晶振起振。因此,当发生程序启动慢或运行时,建议·
    的头像 发表于 11-21 15:37 3513次阅读
    为何晶振并联一个1MΩ电阻?晶振低温<b class='flag-5'>不</b>起振如<b class='flag-5'>何解</b>决

    Neway微波的高频覆盖

    Neway微波高频覆盖的核心优势体现在其产品支持从低频到毫米波频段(DC-110 GHz)的全面覆盖,满足高频场景对低损耗、抗干扰及环境适应性的严苛需求。一、高频覆盖范围与核心能力l 全频段支持
    发表于 11-20 09:02

    5G DL 3CC CA下行速率达预期的原因分析

    随着运营商的频谱重耕,多个频段覆盖不同,5G用户急剧增加,亟需提高用户速率和深度覆盖。DL 3CC CA技术可以将多个频段灵活聚合,充分扩大频谱利用率,提高用户速率和网络的重点覆盖方向。DL 3CC
    的头像 发表于 10-22 09:15 1674次阅读
    5G DL 3CC CA下行速率<b class='flag-5'>不</b>达预期的原因分析

    文件系统的文件怎么循环覆盖的写入数据?

    请教一个文件系统数据写入的问题。 比如我新建一个文件,test.txt,写入数据超过512KB后,就从头开始写,后面的数据不删除,从头开始覆盖。 比如原来写了1000条数据,然后从头开始循环覆盖
    发表于 09-22 08:20

    如何在下载程序时保护flash中的用户数据不被覆盖

    程序或debug时,覆盖这些用户数据?尝试了更换地址也不行,stm32cubeprogrammer的“进行编程之前不进行闪存擦除”也会被擦除,有什么好办法?
    发表于 08-14 06:38

    使用 APx 音频分析仪测量等效连续声级

    在这篇文章中,我们将回答技术支持部门经常收到的一个问题:如何使用APx500音频分析仪测量等效连续声级Leq,T和A计权等效连续声级LAeq,T?等效连续声级在大多数环境中,环境声级随时间不断波动
    的头像 发表于 08-01 16:41 2133次阅读
    使用 APx 音频分析仪测量等效<b class='flag-5'>连续</b>声级

    安康电缆外径测量仪:连续测线漂移 厂家直供价更低

    上。 电缆外径测量仪通过光电技术实现“连续测线漂移”,厂家直供模式提供显著价格优势,同时具备高精度、高稳定性和抗干扰能力。用户实测数据验证了其在实际生产中的可靠性,是线缆行业质量控制的理想选择
    发表于 07-10 14:30

    何解决罗德与施瓦茨示波器新探头量程匹配问题

    在电子测量领域,示波器与探头的匹配度直接影响测量精度与效率。当用户为新购的罗德与施瓦茨示波器配置新探头时,若出现量程匹配(如信号显示异常、测量误差过大等),往往源于探头参数设置、硬件兼容性或环境
    的头像 发表于 06-07 15:32 942次阅读
    如<b class='flag-5'>何解</b>决罗德与施瓦茨示波器新探头量程<b class='flag-5'>不</b>匹配问题

    allegro软件走线命令下参数不显示如何解

    在PCB设计中,走线命令是频繁使用的功能之一。执行走线命令后,通常会在Options面板中显示线宽、层、角度等设置选项,用于调整走线参数。然而,有时执行走线命令后,Options面板中可能没有显示这些设置区域,如图1所示,该如何解决?
    的头像 发表于 06-05 09:30 2455次阅读
    allegro软件走线命令下参数不显示如<b class='flag-5'>何解</b>决