0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

知识图谱是NLP的未来吗?

深度学习自然语言处理 来源:CSDN 作者:CSDN 2021-04-15 14:36 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

知识图谱是NLP的未来吗?

2021年了,不少当年如日中天技术到今天早已无人问津,而知识图谱这个AI界的大IP最火的时候应该是18,19年,彼时上到头部大厂下到明星创业公司都在PR自己图谱+NLP布局能够赋予AI认知能力。到了当下这个AI总体降温的时间节点,我们是时候冷静思考知识图谱的未来到底该何去何从了。

回到这个问题本身:知识图谱是否是NLP的未来呢?

我的看法:知识图谱不是NLP的未来,因为知识图谱是另外一种与NLP有很多交集的技术。在目前所有已知的发展方向中,知识图谱是最有可能长期和NLP互利共生的技术。

那么,知识图谱和NLP到底是什么关系呢?直觉上看,机器学习可以类比我们人类学习。回顾一下我们自己的学习过程,大脑和感官主要负责信息获取、处理、分析、决策。对于简单问题或少数天才,接受到信息后,只需要在大脑中思考一遍即可得出结论。但是对于复杂问题,比如工作汇报或期末考试,只靠大脑很难记住所有信息,这个时候,很多人都会选择将一些加工过的结构化或半结构化的知识整理成笔记,方便需要的时候快速回顾。

发现了吗?大脑的角色非常类似NLP以及其他ML技术,而笔记几乎就是KG的灵感来源。具体来说,NLP在图谱构建过程中举足轻重,而图谱又通过引入知识的方式反哺NLP。

不少证据已经表明诸如Bert之类的预训练语言模型本身已经存储了知识,就像我们的大脑中也存在一些关键记忆一样,但它不可能将所有现实世界中的事实全部内化,犹如人脑不可能记住所有见过的东西一样,而知识图谱通过引入知识能缓解NLP的学习压力。另一个严重的问题是,由于NLP技术目前远没有人脑智能,模型在训练中记住的知识实际上是不可控的(此处可以围观隔壁的AI偏见问题[1]),这对NLP技术的落地应用是一个需要考虑的风险,而在可解释性方面,知识图谱是Bug级的存在。

知识图谱如何赋能NLP技术?

NLP技术如何赋能图谱构建的资料很多,知识图谱落地应用近些年也是进展地如火如荼,但,知识图谱如何赋能NLP技术这个话题聊的人却不太多。

我自己总结了最近几年KG赋能NLP技术的一些打法,欢迎补充~

预训练中引入知识

代表工作:

ERNIE[2],使用短语和实体mask策略在中文NLP任务上取得了较好的效果,其中短语和实体来自KG

aee077aa-9cd8-11eb-8b86-12bb97331649.jpg

图2. ERNIE

K-BERT[3],预训练过程中注入相关的KG三元组,为模型配备领域知识,提高模型在特定领域任务上的性能,同时降低大规模预训练成本。

aef208bc-9cd8-11eb-8b86-12bb97331649.jpg

图3. K-BERT

信息抽取中做远程监督

用KG对齐文本做远程监督标注数据是信息抽取领域的大杀器,能够有效降低人工标注成本,可以将实体抽取、关系抽取、事件抽取等子任务一网打尽,用过的小伙伴都说好。

aefecd68-9cd8-11eb-8b86-12bb97331649.jpg

图4. 远程监督

实体链接中引入实体信息

实体链接,就是把文本中的mention链接到KG里的entity的任务。如下图所示[4]:

af1c5676-9cd8-11eb-8b86-12bb97331649.jpg

图5. 实体链接

显然,KG中的实体信息,如实体描述、实体属性、实体embedding以及实体间关系等都是该任务的关键特征,想深入了解的朋友请移步[4]。

文本生成中融合知识

通过知识图谱中的显示事实来指导生成文本是实现可控文本生成的一个重要方向,如下所示[5]:

af25508c-9cd8-11eb-8b86-12bb97331649.jpg

图6. 文本生成

具体大致分为4种较为典型的方式[6]:

多任务学习(生成+文本蕴含)

基于knowledge graph 的文本生成

基于memory network 的文本生成

结合分布-采样进行文本生成

想详细了解的朋友请移步[6]。

语义匹配中引入关键词信息

在深度语义匹配任务中,有人发现,通过文本中关键词之间的交互即可较为容易的找到匹配对象,与其他词汇关系不大[7][8]。

af4881b0-9cd8-11eb-8b86-12bb97331649.jpg

图7. 语义匹配case

因此,考虑通过从KG中引入特定领域的关键词表,然后在建模时highlight关键词的重要度,从而达到更好的效果[8]。

af63b5c0-9cd8-11eb-8b86-12bb97331649.jpg

图8. 关键字注意力机制

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3814

    浏览量

    52261
  • nlp
    nlp
    +关注

    关注

    1

    文章

    491

    浏览量

    23341
  • 知识图谱
    +关注

    关注

    2

    文章

    132

    浏览量

    8350

原文标题:知识图谱能否拯救NLP的未来?

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    上海3月26-28日《EMC设计整改与仿真应用》公开课安排来袭!

    课程名称:《EMC设计整改与仿真应用》讲师:石老师、樊老师时间地点:上海3月26-28日主办单位:赛盛技术课程特色系统化知识图谱:从电磁兼容基础、三要素到接地、寄生参数等核心原理,构建清晰完整
    的头像 发表于 03-18 09:33 398次阅读
    上海3月26-28日《EMC设计整改与仿真应用》公开课安排来袭!

    实力认证!行云创新入围《AI 中国生态图谱 2025》大模型开放平台板块

    近日,中国电子信息产业发展研究院旗下权威 IT 创新媒体与专业市场研究机构赛迪网,正式发布 《AI 中国生态图谱 2025》 。作为国内 AI 产业极具权威性与公信力的全景研判成果,该图谱全面梳理
    的头像 发表于 03-04 14:25 329次阅读
    实力认证!行云创新入围《AI 中国生态<b class='flag-5'>图谱</b> 2025》大模型开放平台板块

    自然语言处理NLP的概念和工作原理

    自然语言处理 (NLP) 是人工智能 (AI) 的一个分支,它会教计算机如何理解口头和书面形式的人类语言。自然语言处理将计算语言学与机器学习和深度学习相结合来处理语音和文本数据,这些数据也可以与其他类型的数据一起用于开发智能工程系统。
    的头像 发表于 01-29 14:01 583次阅读
    自然语言处理<b class='flag-5'>NLP</b>的概念和工作原理

    2026年度《EMC设计整改与仿真应用》公开课安排来袭!

    课程名称:《EMC设计整改与仿真应用》讲师:石老师、樊老师时间地点:上海3月26-28日、北京5月21-23日、深圳9月17-19日、成都11月26-28日主办单位:赛盛技术课程特色系统化知识图谱
    的头像 发表于 12-30 15:02 758次阅读
    2026年度《EMC设计整改与仿真应用》公开课安排来袭!

    润和软件入选大模型一体机产业图谱

    近日,由中国人工智能产业发展联盟与中国信息通信研究院联合编制的《大模型一体机产业图谱》正式发布。该图谱系统梳理并收录了国内大模型一体机产业链上下游70余家代表性企业,全面呈现我国大模型一体机的生态
    的头像 发表于 12-10 17:56 1682次阅读
    润和软件入选大模型一体机产业<b class='flag-5'>图谱</b>

    华为联合发布宜兴“天机镜”大模型知识图谱

    近日,由宜兴市大数据发展有限公司与华为联合主办的“共聚AI泛生态 智启产业新未来——城市大安全AI产业发展峰会暨华为中国行2025江苏站”,在江苏宜兴举行。
    的头像 发表于 11-14 16:40 1699次阅读

    云知声荣获2025人工智能治理示范案例

    服务业协会联合组织征集的《北京人工智能治理案例集》在会议期间正式发布。云知声"基于医疗大模型和医学知识图谱技术打造可信可靠的医学AI应用"凭借其创新的技术架构和卓越的治理实践,荣获"人工智能治理示范案例"。
    的头像 发表于 11-10 17:28 1065次阅读

    光伏组件IV曲线测试仪:解锁光伏组件性能的“能量图谱仪”

    光伏组件IV曲线测试仪:解锁光伏组件性能的“能量图谱仪”柏峰【BF-CV1500】光伏组件的输出特性是决定电站发电效率的核心,而IV(电流-电压)曲线作为组件性能的“指纹图谱”,包含了短路电流、开路电压、最大功率点等关键参数
    的头像 发表于 10-15 10:49 1230次阅读
    光伏组件IV曲线测试仪:解锁光伏组件性能的“能量<b class='flag-5'>图谱</b>仪”

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的未来:提升算力还是智力

    本章节作者分析了下AI的未来在哪里,就目前而言有来那个两种思想:①继续增加大模型②将大模型改为小模型,并将之优化使之与大模型性能不不相上下。 一、大模型是一条不可持续发展的道路 大模型的不可
    发表于 09-14 14:04

    中软国际入选中国信通院AI Agent智能体产业图谱1.0

    近日,中国信息通信研究院(以下简称“中国信通院”)《AI Agent智能体产业图谱1.0》正式发布。该图谱是国内系统性梳理智能体产业生态的重要成果,聚焦“基础底座、智能体平台、场景智能体与行业智能体
    的头像 发表于 07-14 14:55 1809次阅读

    家电电路识图自学手册

    家电电路识图自学手册
    发表于 07-11 15:49 16次下载

    造物数科亮相华为开发者大会2025 | 技术创新与数字服务,加速电子电路产业数智化转型

    6月20-22日,作为电子电路产业互联网创新引领者,造物数科受邀出席东莞松山湖举办的华为开发者大会2025(HDC.2025),全面解析电子电路产业数智化转型解决方案,并联合启动工业知识图谱联盟。3
    的头像 发表于 06-23 18:00 1318次阅读
    造物数科亮相华为开发者大会2025 | 技术创新与数字服务,加速电子电路产业数智化转型

    曙光AI解决方案助力光大银行数字化基础设施升级

    “人工智能+”的国家战略,希望率先在业内打破“技术悬浮”,计划将人脸识别、OCR识别、智能客服、大模型、机器学习、RPA、知识图谱、智能营销等全业态从国外算力切换到国产异构算力。 面对场景繁杂、国产生态成熟度低、切换风险高等
    的头像 发表于 05-12 10:46 1007次阅读

    轻轻松松学电工(识图篇)

    内容介绍 结合广大电工人员的实际需要,主要介绍了常用电工电路识图的基础知识、方法及技巧,内容包括常用电气符号、电工识图基本方法,以及识读供配电系统图、建筑电气图、电力拖动系统电气图、PLC梯形图
    发表于 04-30 17:18

    中兴通讯发布创新与知识产权白皮书

    在第25个世界知识产权日到来之际,中兴通讯以“守护创新价值,共创数智未来”为主题,发布《中兴通讯创新与知识产权白皮书》,白皮书系统梳理了中兴通讯四十年来的创新历程与知识产权管理体系建设
    的头像 发表于 04-28 16:18 1334次阅读