0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NLP:现有联合抽取工作的不足之处

深度学习自然语言处理 来源:深度学习自然语言处理 作者:深度学习的知识小 2021-01-07 15:06 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

这是一篇关于实体关系联合抽取的工作。关于现有的联合抽取工作,作者提出了两点不足之处:

Feature Confusiong: 用于同样的特征表示进行NER和RE(关系分类)两项任务,可能会对模型的学习造成误解;

现有的基于Table-Filling方法去完成联合抽取的工作,会将表结构转化成一个序列结构,这样导致丢失了重要的结构信息。

因此本文的工作有以下特点:

针对NER和RE,分别学习出不同的序列表示(sequence representations)和表格表示(table representations); 这两种表示能分别捕获任务相关的信息,同时作者还涉及了一种机制使他们彼此交互;

保持表格的结构,通过神经网络结构来捕捉二维表格中的结构信息;同时,引入BERT中的attention权重,进行表格中元素表示的学习。

c796a5b0-5036-11eb-8b86-12bb97331649.png

模型的核心部分包括以下模块:

Text Embedding: 对于一个输入的包含n个words的句子,其词向量、字符向量和BERT词向量的共同构成了每个word的表示。

Table Encoder: 目标在于学出 N×N 表格下的向量表示,表格第i行第j列的向量表示,与句子中的第i个和第j个词相对应,如Figure1所示。文中使用基于GRU结构的MD-RNN(多维RNN)作为Text Encoder,在更新表格中当前cell的信息时,通过MDRNN融合其上下左右四个方向上的信息,从而利用了表格的结构特点;同时引入当前cell所对应的两个词在Sequence Encoder下的表示,使得Table Encoder和Sequence Encoder之间发生信息的交流;

c7f39a22-5036-11eb-8b86-12bb97331649.png

Sequence Encoder: Sequence Encoder的结构与Transformer类似,不同之处在于将Transformer中的scaled dot-product attention 替换为文中提出的 table-guided attention。具体地,将Transformer中计算Q,K之间分值的过程直接替换为对应两个word在table中对应的向量:

c8445e30-5036-11eb-8b86-12bb97331649.png

由于 T_ij 融合了四个方向上的信息,能够更加充分的捕捉上下文信息以及词与词之间的关系,同时也使Table Encoder和Sequence Encoder之间产生了双向的信息交流。

c89b028a-5036-11eb-8b86-12bb97331649.png

Exploit Pre-trained Attention Weights: Text Embeddings部分有用到BERT,因此将BERT中各个层上多头attention每个头上的atention权重堆叠起来,得到张量T l ∈ R N × N × ( L l × A l ) T^{l} in mathbb{R}^{N imes N imes (L^l imes A^l)} T和 Text Embedding中每个词的表示,来构成Table的初始输入:

c8fcda28-5036-11eb-8b86-12bb97331649.png

c9423afa-5036-11eb-8b86-12bb97331649.png

作者通过在不同数据集上的实验证明了模型的有效性,并通过消融实验进行了相关的分析。

责任编辑:xj

原文标题:【EMNLP2020】用填表的方式进行实体关系联合抽取

文章出处:【微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 自然语言处理

    关注

    1

    文章

    630

    浏览量

    14724
  • nlp
    nlp
    +关注

    关注

    1

    文章

    491

    浏览量

    23345

原文标题:【EMNLP2020】用填表的方式进行实体关系联合抽取

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    PCIe 5.0 E1.S硬盘盒重磅上市!可抽取式托盘+主动散热,免开箱秒换SSD

    服务器、工作站与边缘设备部署新一代EDSFF存储提供了实用方案。它适配安装在单槽、半高、3/4长度的PCIex4插槽中,并在PCIe挡板处提供了一个可抽取硬盘托盘
    的头像 发表于 04-17 15:38 369次阅读
    PCIe 5.0 E1.S硬盘盒重磅上市!可<b class='flag-5'>抽取</b>式托盘+主动散热,免开箱秒换SSD

    AD8386:高性能10位12通道输出抽取式LCD驱动器的全方位解析

    、12通道输出抽取式LCD驱动器AD8386。 文件下载: AD8386.pdf 一、AD8386的特性亮点 1. 高电压驱动与保护 AD8386具备高电压驱动能力,能够在距离电源轨1.3V的范围内工作
    的头像 发表于 04-14 16:20 65次阅读

    ICY DOCK存储解决方案:剪辑师的工作流革命

    在影视后期制作等领域,存储系统是制约工作效率的关键因素之一。面对4K/8K高码率素材的爆发式增长,剪辑师普遍面临存储空间不足、访问速度瓶颈、多硬盘管理复杂及团队协作低效等挑战。本文将深入探讨
    的头像 发表于 02-28 11:51 188次阅读
    ICY DOCK存储解决方案:剪辑师的<b class='flag-5'>工作</b>流革命

    自然语言处理NLP的概念和工作原理

    自然语言处理 (NLP) 是人工智能 (AI) 的一个分支,它会教计算机如何理解口头和书面形式的人类语言。自然语言处理将计算语言学与机器学习和深度学习相结合来处理语音和文本数据,这些数据也可以与其他类型的数据一起用于开发智能工程系统。
    的头像 发表于 01-29 14:01 600次阅读
    自然语言处理<b class='flag-5'>NLP</b>的概念和<b class='flag-5'>工作</b>原理

    探究PCB样板贴片技术特点

    PCB样板贴片技术是现代电子制造过程中不可或缺的一环,它可以为量产前的电路板测试提供参考,发现不足之处,从而避免一些不必要的错误和损失。本文将从技术特点、优缺点和售卖市场等方面深入探究PCB样板贴片
    的头像 发表于 01-08 12:46 304次阅读
    探究PCB样板贴片技术特点

    一个经典的结构体和联合体共用的实例

    Linux 中可以 使用 sizeof 进行获取,默认为字节对齐的大小。 联合联合体的参数共享同一个内存地址,所占的内存大小完全是由联合体中参数类型决定字长,然后数据共享,内存共享等。 结构体和
    发表于 12-16 07:14

    高效部署磁盘阵列:选对硬盘抽取盒,省心又强力

    在服务器、工作站或高性能PC中部署磁盘阵列(RAID)是提升存储性能或保障数据安全的成熟方案。无论是追求速度的RAID0,注重安全的RAID1,还是兼顾性能与冗余的RAID10,多硬盘组合都面临共同
    的头像 发表于 11-07 16:34 1266次阅读
    高效部署磁盘阵列:选对硬盘<b class='flag-5'>抽取</b>盒,省心又强力

    IMU+多相机高速联合自动标定方案

    随着视觉惯性传感器在自动驾驶、机器人、AR/VR 等领域规模化落地,多相机+IMU 联合标定需求呈爆发式增长,多相机+IMU 联合标定领域尚属空白。 感算商城联合知名方案公司推出国内首台量产级
    发表于 10-23 14:04

    请问RT-Thread与stm32cubemx联合开发的原理是什么?

    在使用RT-Thread与stm32cubemx联合开发的原理是什么,cubemx在其中主要起到了哪些功能呢?
    发表于 10-11 15:49

    解决超声波清洗机出水压力不足的7个方法

    超声波清洗机出口压力过小或无压力会直接影响设备的清洗效果和质量。发生应激障碍后,应及时进行故障调查和处理,避免清扫工作受到影响。关于超声波清洗机出水压力不足的原因及处理方法:一、超声波清洗机高压喷嘴
    的头像 发表于 08-14 16:46 973次阅读
    解决超声波清洗机出水压力<b class='flag-5'>不足</b>的7个方法

    浮思特 | 红外激光模组工作原理:科技的神奇之处

    在现代科技快速发展的今天,红外激光模组作为一种重要的光电设备,逐渐走进了我们的生活和工作中。无论是在医疗、安防还是工业领域,红外激光模组都扮演着不可或缺的角色。那么,红外激光模组到底是如何工作的呢
    的头像 发表于 08-05 09:58 829次阅读
    浮思特 | 红外激光模组<b class='flag-5'>工作</b>原理:科技的神奇<b class='flag-5'>之处</b>

    开源欧拉社区AI联合工作组正式成立

    侧智能设备及云边端协同等前沿实践。现场还详细解读了开源欧拉24.03 LTS SP2的技术特性并分享实践案例,同时正式宣布成立开源欧拉社区AI联合工作组,旨在推动构建基于开源欧拉的AI基础软件事实标准,助力企业智能应用生态繁荣。
    的头像 发表于 07-28 17:20 1400次阅读

    软通动力加入openEuler社区AI联合工作

    近日,2025开放原子开源生态大会开幕,openEuler社区携手软通动力与社区成员单位共同发起成立“openEuler社区AI联合工作组”,工作组将整合芯片、算法、应用等全产业链力量,推动操作系统
    的头像 发表于 07-25 14:42 1278次阅读

    【硬盘抽取盒民主实验】你的真话,决定产品命运!敢说就送!

    这不是一场营销,而是一次硬盘抽取盒民主实验。ICYDOCK诚邀敢说真话的你!你的每一条真实反馈,都可能被采纳,直接塑造CP138产品的命运!你的声音,至关重要!CP138核心亮点速览CP138是专为
    的头像 发表于 07-18 16:32 512次阅读
    【硬盘<b class='flag-5'>抽取</b>盒民主实验】你的真话,决定产品命运!敢说就送!

    【ICY DOCK 新品 MB601V5K-B】2.5英寸 U.2/U.3 NVMe PCIe 5.0转3.5英寸硬盘抽取盒(1 x MCIO 4i SFF-TA-1016)

    ToughArmor MB601V5K-B是专为高速U.2/U.3 NVMe硬盘设计的PCIe 5.0硬盘抽取盒。这款硬盘抽取盒配备最新的MCIO 4i(SFF-TA-1016)接口,支持高达
    的头像 发表于 05-21 16:55 1241次阅读
    【ICY DOCK 新品 MB601V5K-B】2.5英寸 U.2/U.3 NVMe PCIe 5.0转3.5英寸硬盘<b class='flag-5'>抽取</b>盒(1 x MCIO 4i SFF-TA-1016)