0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

命名实体识别(NER)是自然语言处理(NLP)中的基本任务之一

8nfr_ZTEdevelop 来源:未知 作者:李倩 2018-04-18 11:17 次阅读

什么是命名实体识别(NER)?

命名实体识别(NER)是自然语言处理(NLP)中的基本任务之一。NLP的一般流程如下:

句法分析是NLP任务的核心,NER是句法分析的基础。NER任务用于识别文本中的人名(PER)、地名(LOC)等具有特定意义的实体。非实体用O来表示。我们以人名来举例:

王 B-PER

文 I-PER

和 O

小 B-PER

丽 I-PER

结 O

婚 O

了。 O

(IOB是块标记的一种表示。B-表示开始,I-表示内部,O-表示外部)

首先明确的是NER是个分类任务,具体称为序列标注任务,即文本中不同的实体对应不同的标签,人名-PER,地名-LOC,等等,相似的序列标注任务还有词性标注、语义角色标注。传统的解决此类问题的方法,包括:(1)基于规则的方法。根据语言学上预定义的规则。但是由于语言结构本身的不确定性,规则的制定上难度较大。(2)基于统计学的方法。利用统计学找出文本中存在的规律。主要有隐马尔可夫(HMM)、条件随机场(CRF)模型和Viterbi算法。文末会简要介绍比较流行的CRF模型。(3)神经网络深度学习(多层神经网络)这么流行,当然不会放过nlp,之前我的一篇帖子(《深度学习在机器翻译中的应用》)里提到过循环神经网络(RNN)及其变种LSTM。因为文本的上下文依赖性,LSTM这种能够存储上下文信息的序列模型是较好的选择(本文侧重于CRF,LSTM的基本知识可参考《深度学习在机器翻译中的应用》)。

LSTM+CRF模型

语言文本的特殊之处在于其具有一定的结构,主谓宾定状补,状语后置,非限制性定语从句等等。这些结构的存在代表着每个单词的前后是有着一定的词性限制的。比如:

我现在回家 //这是常见的(主+状+谓+宾)结构的句子

我今天家 //这样的文本就不能称为一个句子,少了必要的语法结构

LSTM网络是整体思路同样是先对给定的训练样本进行学习,确定模型中的参数,再利用该模型对测试样本进行预测得到最后的输出。由于测试输出的准确性现阶段达不到100%,这就意味着,肯定存在一部分错误的输出,这些输出里很可能就包含类似于上述第二句话这种不符合语法规则的文本。因此,这就是为什么要将CRF模型引入进来的原因。条件随机场(CRF)是一种统计方法。其用于文本序列标注的优点就是上文所说的对于输出变量可以进行约束,使其符合一定的语法规则。常见的神经网络对训练样本的学习,只考虑训练样本的输入,并不考虑训练样本的输出之间的关系。

LSTM+CRF 网络

LSTM 网络可以看作是一个多分类问题,给定B、I、O等标签作为训练输出,”john goes to school”等句子作为输入,根据网络模型计算的概率大小确定句子中的每个单词属于哪个标签(类别),概率最大的即为该单词最后所属的标签(类别),标签与标签之间是独立的。LSTM+CRF则是在分类问题的基础上,加上输出之间的约束关系。比如”B”标签之后还是”B”,这种不符合语法规则的情况,通过CRF机制是可以排除的。目前,tensorflow 已支持LSTM+CRF的配置。(LSTM+CRF是深度学习中比较经典的模型,当前还有LSTM+cnn+CRF等其他的经过优化的模型)。

附:条件随机场(CRF)原理

要完全搞懂CRF的原理,可以参考李航的《统计学习方法》的第11章。这里作简要说明。CRF的基础是马尔可夫随机场,或者称为概率无向图。

延伸

概率无向图:用无向图表示随机变量的概率分布。

上图就是满足局部马尔可夫性的概率无向图。每个结点都代表着一个随机变量,边代表着随机变量之间的关系。

局部马尔可夫性:P(Yu|Yv)=P(Yu|Yv,Yw)简单理解,因为Yu和Yw之间没有边连接,则在给定随机变量Yv条件下的Yu的概率,跟多加了一个Yw无关。

CRF的理解

CRF可以理解为在给定随机变量X的条件下,随机变量Y的马尔可夫随机场。其中,线性链CRF(一种特殊的CRF)可以用于序列标注问题。CRF模型在训练时,给定训练序列样本集(X,Y),通过极大似然估计、梯度下降等方法确定CRF模型的参数;预测时,给定输入序列X,根据模型,求出P(Y|X)最大的序列y(这里注意,LSTM输出的是一个个独立的类别,CRF输出的是最优的类别序列,也就是CRF全局的优化要更好一些)。

线性链条件随机场(可以比较一下与上面LSTM+CRF网络图的区别与联系)

为何CRF可以表示输出序列内各元素(Y1,Y2,…,Yi,Yi+1)之间的联系?这里就是要联系到马尔可夫性。这也就是为什么CRF的基础是马尔可夫随机场。CRF如何求解P(Y|X),有具体的数学公式,这里就不详细列出了。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 深度学习
    +关注

    关注

    73

    文章

    5239

    浏览量

    119927
  • 自然语言
    +关注

    关注

    1

    文章

    271

    浏览量

    13209
  • nlp
    nlp
    +关注

    关注

    1

    文章

    464

    浏览量

    21828

原文标题:干货 | 深度学习在NLP的命名实体识别中(NER)的应用

文章出处:【微信号:ZTEdeveloper,微信公众号:中兴开发者社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    自然语言基础技术之命名实体识别相对全面的介绍

    早期的命名实体识别方法基本都是基于规则的。之后由于基于大规模的语料库的统计方法在自然语言处理各个方面取得不错的效果之后,一大批机器学习的方法也出现在
    的头像 发表于 04-17 10:12 4741次阅读
    <b class='flag-5'>自然语言</b>基础技术之<b class='flag-5'>命名实体</b><b class='flag-5'>识别</b>相对全面的介绍

    自然语言处理技术介绍

    ,包括:分词、词性标注、句法分析、命名实体识别,以及信息抽取领域的实体关系抽取等。2.1.分词分词是自然语言处理技术的基础构成
    发表于 09-27 09:57

    hanlp汉语自然语言处理入门基础知识介绍

    人工智能。自然语言处理涉及的几个层次:作为输入共有两个来源,语音与文本。所以第级是语音识别和OCR或分词(事实上,跳过分词虽然理所当然地
    发表于 01-02 14:43

    HanLP分词命名实体提取详解

    工具。 HanLP是由系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。HanLP提
    发表于 01-11 14:32

    基于结构化感知机的词性标注与命名实体识别框架

    `上周就关于《结构化感知机标注框架的内容》已经分享了篇《分词工具Hanlp基于感知机的中文分词框架》,本篇接上篇内容,继续分享词性标注与命名实体识别框架的内容。词性标注训练词性标注
    发表于 04-08 14:57

    HanLP-命名实体识别总结

    的中国人名自动识别研究》,大家可以百度下看看 地名识别 理论指导文章为:《基于层叠隐马尔可夫模型的中文命名实体识别》 机构名
    发表于 07-31 13:11

    【推荐体验】腾讯云自然语言处理

    结构化抽取,有效辅助人工,降低人力参与成本。因为现在腾讯云自然语言处理产品公测免费,所以我注册了腾讯云账号去专门体验了下,最直观的感受就是确实如产品介绍说的:开箱即用的
    发表于 10-09 15:28

    什么是自然语言处理

    什么是自然语言处理自然语言处理任务有哪些?自然语言处理
    发表于 09-08 06:51

    基于神经网络结构在命名实体识别中应用的分析与总结

    近年来,基于神经网络的深度学习方法在自然语言处理领域已经取得了不少进展。作为NLP领域的基础任务命名实体
    的头像 发表于 01-18 09:24 4451次阅读
    基于神经网络结构在<b class='flag-5'>命名实体</b><b class='flag-5'>识别</b>中应用的分析与总结

    思必驰中文命名实体识别任务助力AI落地应用

    ,已成为一项重要研究课题。命名实体识别(Named Entity Recognition,NER任务的目标是识别出文本中预定义类别的
    的头像 发表于 02-22 18:27 1670次阅读

    命名实体识别的迁移学习相关研究分析

    命名实体识别NER)是自然语言处理的核心应用任务之一
    发表于 04-02 15:15 8次下载
    <b class='flag-5'>命名实体</b><b class='flag-5'>识别</b>的迁移学习相关研究分析

    基于字语言模型的中文命名实体识别系统

    而造成的数据稀缺问题,以及传统字向量不能解决的一字多义问題,文中使用在大规模无监督数据上预训练的基于上下文相关的字向量,即利用语言模型生成上下文相关字向量以改进中文NER模型的性能。同时,为解决命名实体
    发表于 04-08 14:36 14次下载
    基于字<b class='flag-5'>语言</b>模型的中文<b class='flag-5'>命名实体</b><b class='flag-5'>识别</b>系统

    入门自然语言处理基本任务——文本匹配

    半个月的努力,最终结果勉强不错(第6),收割了一台Kindle。 2021年1月,疫情形势依然严峻,幸运的是国家不仅及时稳住了疫情,还研发出了有效的疫苗。借助疫情主题的比赛,我希望帮助更多读者,入门自然语言处理基本任务——文本
    的头像 发表于 05-31 11:51 2879次阅读

    关于边界检测增强的中文命名实体识别

    引言 命名实体识别(Named Entity Recognition,NER)是自然语言处理领域的一个基础
    的头像 发表于 09-22 16:05 2739次阅读

    研究人员为多模态NER任务提出新颖的关系增强图卷积网络

    命名实体识别NER)是信息抽取的一项基本任务,它的目的是识别文本片段中的实体及类型,如人名(P
    的头像 发表于 09-28 11:41 1322次阅读