0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

词义消歧与实体消歧

深度学习自然语言处理 来源:AI算法小喵 作者:AI算法小喵 2022-08-02 14:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

写在前面

最近刚开始调研实体消歧方面的相关工作,这里先开一个头吧。希望大家可以通过这篇简要的文章对实体消歧任务本身有一个基本的认识。

1. 背景:词义消歧与实体消歧

1.1 词义消歧

自然语言文本中存在着大量的多义词,而多义词的存在也会影响人对文本的语义理解,让人对文本的意思产生混淆。

词义消岐(Word Sense Disambiguation,简称WSD) 是NLP中一个非常基本的任务,旨在确定多义词在具体语境中的确切意义。

在词义消歧中,同一词语的不同义项会作为候选词。我们需要在所有候选词中找到与文本中目标词语最接近的那个义项。这里“义项”指的是词是词典中的某个具体表示。

0ffbd464-118e-11ed-ba43-dac502259ad0.png

如上图所示,「苹果」在百度百科中共有25个义项,单说「苹果」我们可能并不知道说的是「苹果公司」还是「水果里的苹果」。但结合具体的上下文语境,我们就可以很好地对「苹果」消歧,从而明确「苹果」的具体含义:

10309532-118e-11ed-ba43-dac502259ad0.png

1.2 实体消歧

实体链指/实体链接(Entity Linking,简称 EL) 在知识图谱构建、信息检索和问答系统等领域具有广泛的应用价值。

实体链指的主要目标是识别上下文中的实体指称具体指代现实世界中的哪一个实体,也就是将实体指称项映射到知识库中的相应实体上去。

具体而言,实体链指一般包括实体识别、候选实体获取、实体消歧这三个主要环节。之所以需要实体消歧,而不是直接将实体识别的结果放入知识图谱的原因主要有两方面:

多样性(即多词同义):同一实体在文本中会有不同的指称。比如:甜瓜、安东尼、和瓜哥都指美国职业篮球运动员卡梅隆·凯恩·安东尼。

歧义性(即一词多义):相同的实体指称在不同的上下文中可以指不同的实体。比如:迈克尔·乔丹可能指美国篮球运动员,也可能指爱尔兰政治家等。

1.3 总结

从以上说明来看,其实词义消歧与实体消歧具有一定相似性, 二者的目的都是处理文本中词汇歧义的问题. 主要区别在于:

在词义消歧中的词义通常是固定的, 可根据目标词在词典中的义项来列举;

在实体消歧中, 实体词义无法列举,所以需要前序步骤候选实体获取;

此外,实体词的词义数目大于普通词,这个主要还是跟知识库的量级相关。

2. 相关论文

这里我们主要给大家推荐两篇近期发表的论文:

词义消歧:《ESC: Redesigning WSD with Extractive Sense Comprehension》

实体消歧:《ExtEnD: Extractive Entity Disambiguation》

两篇论文的模型都非常简单,个人觉得关键或者说亮点主要在于他们对问题的转换。其实,从这两篇论文的名字就能看出端倪:都是将消歧问题转换成了抽取式问题。

2.1 EXTENE 实体消歧

论文名称:《ExtEnD: Extractive Entity Disambiguation》

论文链接:https://aclanthology.org/2022.acl-long.177.pdf

代码地址:https://github.com/SapienzaNLP/extend.

105e153e-118e-11ed-ba43-dac502259ad0.png

如上图所示,EXTEND将实体消歧任务转换为了抽取式任务,或者说MRC类任务。具体地:

将含有目标实体指称项的文本当作Query;

将知识库中对应的所有候选实体及其描述当作Context;

二者拼接然后预测Answer的Span(startend prediction,start-end matching),这里的Answer就是在知识库中目标实体指称实际关联的实体。

好了,这就是EXTEND论文的核心思想。是不是感觉模型已经跃然纸上了,整体上应该和我们之前在 一文详解关系抽取模型 CasRel、实体识别LEAR论文阅读笔记、 实体识别BERT-MRC论文阅读笔记中介绍过的模型类似。

2.2 ESC 词义消歧

论文名称:《ESC: Redesigning WSD with Extractive Sense Comprehension》

论文链接:https://aclanthology.org/2021.naacl-main.371.pdf

代码地址:https://github.com/SapienzaNLP/esc

1070bb3a-118e-11ed-ba43-dac502259ad0.png

ESC的模型架构和EXTEND是相似的。整体上首先将输入的上下文和目标词的所有义项拼接,模型的输出则是目标词真正义项的起始和终止位置。

2.3 总结

论文的具体细节就不在本文里赘述了,大家可根据链接下载原文阅读。此外,两篇论文都公布了源码,大家也可以快速利用源码在一些开源数据上进行实验。

当然也有一些相关比赛,比如百度:实体链指[1]目前就还在进行中:

10a33e7a-118e-11ed-ba43-dac502259ad0.png

我目前看到的几个还是比较一致的做法,打分排序:

比如实体链指比赛方案分享[2]:

10b95016-118e-11ed-ba43-dac502259ad0.png

CCKS&百度 2019中文短文本的实体链指 第一名解决方案[3]:

10e2a970-118e-11ed-ba43-dac502259ad0.png

大家可以将论文的模型适配到中文场景下,然后尝试在这个比赛的实体消歧环节使用,看看效果如何。

还是一样,如果本文对你有帮助的话,欢迎点赞&在看&分享,这对我继续分享&创作优质文章非常重要。感谢!

参考资料

[1]

百度:实体链指: https://aistudio.baidu.com/aistudio/competition/detail/83/0/introduction

[2]

实体链指比赛方案分享: https://aistudio.baidu.com/aistudio/projectdetail/1331020?channelType=0&channel=0

[3]

CCKS&百度 2019中文短文本的实体链指 第一名解决方案: https://github.com/panchunguang/ccks_baidu_entity_link

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 文本
    +关注

    关注

    0

    文章

    120

    浏览量

    17941
  • nlp
    nlp
    +关注

    关注

    1

    文章

    491

    浏览量

    23367

原文标题:一文简要了解词义消歧与实体消歧

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    微机谐装置在使用时需要注意什么

           微机谐装置在使用时需要注意什么?微机谐装置应安装于PT开口三角处,谐电阻器则置于PT一次侧中性点与地之间。通过这种方式,装置能够有效地检测并消除谐振现象,同时保护PT不受
    的头像 发表于 03-16 11:44 184次阅读

    保护PT,一次谐器和微机谐装置哪个重要?

    一次谐器作为“守门员”,负责第一道防线:限制电压、阻尼谐振萌芽、抵御冲击电流,确保PT自身安全。 微机谐装置作为“侦察兵兼特种部队”,负责第二道防线:精准判断故障类型,并对已形成的谐振进行快速
    的头像 发表于 01-05 09:09 686次阅读
    保护PT,一次<b class='flag-5'>消</b>谐器和微机<b class='flag-5'>消</b>谐装置哪个重要?

    解析一次谐和二次谐的差异与应用场景

    在电力系统中,谐装置是保障系统稳定运行的关键设备,它可以有效消除谐振过电压,避免因谐振引发的设备损坏和停电事故。一次谐器和微机谐装置,都可以用于PT柜,保护电压互感器。 一次
    的头像 发表于 12-11 11:33 733次阅读

    微机谐装置多种规格多功能可选

    谐装置
    aozhuogeng
    发布于 :2025年10月20日 10:34:51

    微机谐装置的通讯测试是如何完成的

    准备一台微机谐装置和配合完成测试的电脑程序,把线路和工作电源准备连接好,通讯有正和负,然后找到测试电脑里的程序,点击发送,看到上面接收区会显示一串数字,证明信号接收是没问题的,显示屏亮起,如果电压
    发表于 09-01 08:44

    影响三防漆泡的因素有哪些

    三防漆在涂覆过程中若存在气泡,会导致涂层出现针孔、空洞等缺陷,降低防护性能。泡效果受材料特性、工艺操作及环境条件等多方面影响,下面就让我们来了解一下影响三防漆泡的因素,以及如何改善这种情况吧
    的头像 发表于 07-18 18:10 968次阅读
    影响三防漆<b class='flag-5'>消</b>泡的因素有哪些

    一次谐器选型

    谐装置
    aozhuogeng
    发布于 :2025年07月14日 10:15:35

    双电机驱动系统隙技术分析

    摘要: 双电机驱动系统是电力系统中重要的电机系统,双电机驱动的隙技术是双电机驱动系统中的关键技术,双电机驱动系统能否实现正常运行关键在于隙技术本身的水平。在人们对电机系统的要求越来越高的背景下
    发表于 06-19 11:01

    微机谐装置优势

    微机谐装置(也称为微机谐器或智能谐装置)具有显著优势。以下是其核心优势: 1.  强大的谐振识别能力:     能够实时、精确地识别系统发生的多种类型的铁磁谐振(如分频、工频、高频谐振),以及
    的头像 发表于 06-16 15:50 888次阅读
    微机<b class='flag-5'>消</b>谐装置优势

    微机谐装置如何守护电网安全?

    谐装置
    aozhuogeng
    发布于 :2025年06月16日 15:13:58

    选择适合微机谐器的关键因素

    选择适合的微机谐器是保障电力系统(尤其是中性点非有效接地系统)安全稳定运行的重要环节。以下是关键因素的详细分条列举: 选择适合微机谐器的关键因素: 1.  系统基本参数匹配性:      额定
    的头像 发表于 06-13 16:27 696次阅读

    微机谐器核心价值

    谐装置
    aozhuogeng
    发布于 :2025年06月12日 08:24:34

    WXZ196微机谐装置的工作方式是什么

    WXZ196微机谐装置的工作方式是什么? 1、实时监测:微机谐装置通过高性能的传感器,实时监测电力系统中的关键参数,尤其是PT开口三角处的电压和频率。在正常工作的情况下,PT开口三角处的电压小于
    的头像 发表于 06-03 09:55 650次阅读

    微机谐装置功能特点

    谐装置
    aozhuogeng
    发布于 :2025年05月28日 15:27:29

    一次谐器原理及作用

    谐装置
    aozhuogeng
    发布于 :2025年05月27日 09:03:06