0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NLP:现有联合抽取工作的不足之处

深度学习自然语言处理 来源:深度学习自然语言处理 作者:深度学习的知识小 2021-01-07 15:06 次阅读

这是一篇关于实体关系联合抽取的工作。关于现有的联合抽取工作,作者提出了两点不足之处:

Feature Confusiong: 用于同样的特征表示进行NER和RE(关系分类)两项任务,可能会对模型的学习造成误解;

现有的基于Table-Filling方法去完成联合抽取的工作,会将表结构转化成一个序列结构,这样导致丢失了重要的结构信息

因此本文的工作有以下特点:

针对NER和RE,分别学习出不同的序列表示(sequence representations)和表格表示(table representations); 这两种表示能分别捕获任务相关的信息,同时作者还涉及了一种机制使他们彼此交互;

保持表格的结构,通过神经网络结构来捕捉二维表格中的结构信息;同时,引入BERT中的attention权重,进行表格中元素表示的学习。

c796a5b0-5036-11eb-8b86-12bb97331649.png

模型的核心部分包括以下模块:

Text Embedding: 对于一个输入的包含n个words的句子,其词向量、字符向量和BERT词向量的共同构成了每个word的表示。

Table Encoder: 目标在于学出 N×N 表格下的向量表示,表格第i行第j列的向量表示,与句子中的第i个和第j个词相对应,如Figure1所示。文中使用基于GRU结构的MD-RNN(多维RNN)作为Text Encoder,在更新表格中当前cell的信息时,通过MDRNN融合其上下左右四个方向上的信息,从而利用了表格的结构特点;同时引入当前cell所对应的两个词在Sequence Encoder下的表示,使得Table Encoder和Sequence Encoder之间发生信息的交流;

c7f39a22-5036-11eb-8b86-12bb97331649.png

Sequence Encoder: Sequence Encoder的结构与Transformer类似,不同之处在于将Transformer中的scaled dot-product attention 替换为文中提出的 table-guided attention。具体地,将Transformer中计算Q,K之间分值的过程直接替换为对应两个word在table中对应的向量:

c8445e30-5036-11eb-8b86-12bb97331649.png

由于 T_ij 融合了四个方向上的信息,能够更加充分的捕捉上下文信息以及词与词之间的关系,同时也使Table Encoder和Sequence Encoder之间产生了双向的信息交流。

c89b028a-5036-11eb-8b86-12bb97331649.png

Exploit Pre-trained Attention Weights: Text Embeddings部分有用到BERT,因此将BERT中各个层上多头attention每个头上的atention权重堆叠起来,得到张量T l ∈ R N × N × ( L l × A l ) T^{l} in mathbb{R}^{N imes N imes (L^l imes A^l)} T和 Text Embedding中每个词的表示,来构成Table的初始输入:

c8fcda28-5036-11eb-8b86-12bb97331649.png

c9423afa-5036-11eb-8b86-12bb97331649.png

作者通过在不同数据集上的实验证明了模型的有效性,并通过消融实验进行了相关的分析。

责任编辑:xj

原文标题:【EMNLP2020】用填表的方式进行实体关系联合抽取

文章出处:【微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 自然语言处理

    关注

    1

    文章

    509

    浏览量

    13103
  • nlp
    nlp
    +关注

    关注

    1

    文章

    463

    浏览量

    21823

原文标题:【EMNLP2020】用填表的方式进行实体关系联合抽取

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    特斯拉频繁调价,马斯克解释传统经销商模式价格不稳

    IT之家发现,Whole Mars博客的Omar认为特斯拉的定价策略缺乏连续性,Sawyer Merritt则指出,虽然定价更为透明,但这或许是特斯拉直销模式的不足之处
    的头像 发表于 04-22 15:15 91次阅读

    UART转RS485电路的不足之处

    当RE#为低时,接收数据; 当RE#为高时,禁止接收; 当DE为高时,发送数据; 当DE为低时,禁止发送。 RO为接收输出端,DI为发送输入端。
    发表于 03-28 10:21 277次阅读
    UART转RS485电路的<b class='flag-5'>不足之处</b>

    汽车转向器轴承滑动力测试深度解析

    软件平台采用了简仪的锐视测控软件平台,面向对象驱动——FirmDrive,快速实现了AI CI同步采集,确保了力与位移的同步,消除了任何偏移,解决了原有PLC方案存在的不足之处
    发表于 03-07 11:24 89次阅读
    汽车转向器轴承滑动力测试深度解析

    谷歌发布Pixel手机3月功能更新,优化应用屏幕共享和快速配对功能

    除对先前阶段不足之处进行修复和增强系统稳定性外,谷歌还将重点放在了扩大“圈选即搜”(Circle to Search)功能的覆盖范围、优化应用屏幕共享和Fast Pair等功能上。
    的头像 发表于 03-05 10:10 175次阅读

    澳大利亚新设咨询机构,助力降低人工智能风险

    澳大利亚科学技术部部长霍西克表示,尽管预期AI能推动未来经济发展,但其实施过程中仍存诸多不足之处。面对技术信任度低的难题,他认为此乃当前不可忽视之挑战。
    的头像 发表于 01-17 14:36 271次阅读

    什么是“车规级”?使用车规零件的不足之处分享

    车规和工规,谁的要求高。普遍的认为标准的高低顺序是军工 > 汽车 > 工业 > 消费电子。但个人却不不能完全接受这个顺序。
    发表于 12-22 16:47 214次阅读
    什么是“车规级”?使用车规零件的<b class='flag-5'>不足之处</b>分享

    请问一个平台的多个sharc 21469如何联合工作?

    你好, 请问一个平台的多个sharc 21469如何联合工作。根据adi的spec有link port可以将多个sharc连接到一起,那么他们的工作方式是各自独立并行工作还是某种
    发表于 11-29 06:39

    全控型电力电子器件的RCD关断缓冲电路的主要不足是什么?

    不足之处。 首先,全控型电力电子器件的RCD关断缓冲电路的设计复杂度较高。由于电力电子器件通常具有较高的功率和大量的电压,RCD关断缓冲电路需要能够快速准确地检测到过电流和过压情况,并在短时间内关断电力电子器件。这就要求电路
    的头像 发表于 11-21 15:17 271次阅读

    介绍一种前馈形式的振荡控制器(下)

    上篇跟大家聊到了posicast的不足之处在于,对于系统的模型不匹配敏感,其实有个简单的解决办法:把两个posicast串联在一起。
    的头像 发表于 11-07 17:14 377次阅读
    介绍一种前馈形式的振荡控制器(下)

    寄生参数抽取只会StarRC不会QRC?

    寄生参数抽取 只会StarRC 不会QRC?本章节讲解下QRC抽取寄生参数。
    的头像 发表于 10-11 16:01 1672次阅读
    寄生参数<b class='flag-5'>抽取</b>只会StarRC不会QRC?

    集成电路中低功耗乘法器的实现与设计方案

    限度的低功耗效果。本文紧跟市场发展动向,从以上应用角度出发,着力研究集成电路设计中小数乘法器的前端低功耗算法以及实现技术,并且改进了现有低功耗设计技术的一些不足之处
    发表于 09-19 07:42

    人工智能nlp是什么方向

    人工智能nlp是什么方向  人工智能(AI)已经日益普及,正在改变我们的方法和方式。AI 涵盖了许多领域,其中包括机器学习,计算机视觉,自然语言处理(NLP)等。在这些方向之中,NLP 是最引人注目
    的头像 发表于 08-22 16:45 1317次阅读

    六相永磁同步电机降阶模型ECE抽取方法

    永磁同步电机降阶模型ECE抽取是通过对永磁同步电机有限元结果进行降阶抽取,等效抽取的结果是基于有限元计算得到的数据表,在控制系统联合仿真过程中只需通过查表得方法就能得到电机的性能,因此
    发表于 08-14 14:08 1628次阅读
    六相永磁同步电机降阶模型ECE<b class='flag-5'>抽取</b>方法

    166. 任务167:R CNN的不足之处 - 副本 (5) - 副本 - 副本

    机器视觉自动驾驶
    充八万
    发布于 :2023年06月21日 19:41:42

    蓝牙技术的性能参数和有哪些不足之处

      这些参数对于蓝牙技术的性能、运行距离、连接数、安全性等方面都有关键的作用,合理设置这些参数可以提高蓝牙技术的应用性能和实用性。
    发表于 05-06 17:41 4087次阅读