0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

知识图谱与大模型结合方法概述

华为DevCloud 来源:未知 2023-10-29 15:50 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

本文作者 | 黄巍

《Unifying Large Language Models and Knowledge Graphs: A Roadmap》总结了大语言模型和知识图谱融合的三种路线:1)KG增强的LLM,可在LLMs的预训练和推理阶段引入KGs;2)LLM增强KG,LLM可用于KG构建、KG embedding、KG补全、基于KG的文本生成、KBQA(基于图谱的问答)等多种场景;3)LLM+KG协同使用,主要用于知识表示和推理两个方面。该文综述了以上三个路线的代表性研究,探讨了未来可能的研究方向。

知识图谱(KG)和大语言模型(LLM)都是知识的表示形式。KG是符号化的知识库,具备一定推理能力,且结果可解释性较好。但存在构建成本高、泛化能力不足、更新难等不足。LLM是参数化的概率知识库,具备较强语义理解和泛化能力,但它是黑盒模型,可能编造子虚乌有的内容,结果的可解释性较差。可见,将LLM和KG协同使用,同时利用它们的优势,是一种互补的做法。

wKgZomU-D9WABEmCAACDJaTqIbk703.png

LLM和KG的融合路线,可分为以下类型:

wKgZomU-D9WAWM3wAADglL6UMl0258.png

第一种融合路线是KG增强LLM,可在LLM预训练、推理阶段引入KG。以KG增强LLM预训练为例,一个代表工作是百度的ERNIE 3.0将图谱三元组转换成一段token文本作为输入,并遮盖其实体或者关系来进行预训练,使模型在预训练阶段直接学习KG蕴含的知识。

wKgZomU-D9aAHQU4AACBLP79zBo093.png

第二种融合路线是LLM增强KG。LLM可用于KG构建、KG embedding、KG补全、基于KG的文本生成、KBQA(基于图谱的问答)等多种场景。以KG构建为例,这是一项成本很高的工作,一般包含1) entity discovery 实体挖掘 2) coreference resolution 指代消解 3) relation extraction 关系抽取任务。LLM本身蕴含知识,且具备较强的语义理解能力,因此,可利用LLM从原始数据中抽取实体、关系,进而构建知识图谱。

wKgZomU-D9aAMineAACkS7JiANc980.png

第三种融合路线是KG+LLM协同使用,主要用于知识表示和推理两个方面。以知识表示为例,文本语料库和知识图谱都蕴含了大量的知识,文本中的知识通常是非结构化的,图谱里的知识则是结构化的,针对一些下游任务,需要将其对齐进行统一的表示。比如,KEPLER是一个统一的模型来进行统一表示,它将文本通过LLM转成embedding表示,然后把KG embedding的优化目标和语言模型的优化目标结合起来,一起作为KEPLER模型的优化目标,最后得到一个能联合表示文本语料和图谱的模型。示意图如下:

wKgZomU-D9aAK95VAABY9WjcPUQ072.pngwKgZomVA6_OAdWxgAAAChhq5BME149.svg

小结

上述方法都在尝试打破LLM和KG两类不同知识表示的边界,促使LLM这种概率模型能利用KG静态的、符号化的知识;促使KG能利用LLM参数化的概率知识。从现有落地案例来看,大模型对知识的抽象程度高,泛化能力强,用户开箱即用,体验更好。且如果采用大模型+搜索的方案,用户更新知识的成本也较低,往知识库加文档即可。在实际业务场景落地时,如果条件允许,优先考虑使用大模型。当前chatGPT火爆,也印证了其可用性更好。如遇到以下场景时,可以考虑将LLM和KG结合使用:

•对知识可信度和可解释性要求高的场景,比如医疗、法律等,可以考虑再建设知识图谱来降低大模型回答错误知识的概率,提高回答的可信度和可解释性。

•已经有一个蕴含丰富知识的图谱,再做大模型建设时。可以参考KG增强LLM的方法,将其知识融合到LLM中。

•涉及基于图谱的多条推理能力的场景。

•涉及基于图谱可视化展示的场景,比如企查查、天眼查等。

参考文献:

1.Unifying Large Language Models and Knowledge Graphs: A Roadmaphttps://arxiv.org/abs/2306.08302


原文标题:知识图谱与大模型结合方法概述

文章出处:【微信公众号:华为DevCloud】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    218

    文章

    36322

    浏览量

    263075

原文标题:知识图谱与大模型结合方法概述

文章出处:【微信号:华为DevCloud,微信公众号:华为DevCloud】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    模型优化压缩空气储能系统软件平台解决方案

    +智能运维 构建设备、故障、运维经验全生命周期知识图谱结合LLM实现自然语言交互、故障诊断与维修决策。非计划停机减少40%+,运维成本降低25%。 三、典型应用场景 系统设计与参数优化:大模型辅助
    发表于 05-29 14:17

    模型赋能制造业:AISOP 如何实现 SOP 全流程智能化生成与落地

    理解能力,构建企业专属工艺知识图谱,实现 “参数 - 质量特性(CTQ)” 精准映射,将分散的数据转化为可复用的结构化知识资产。例如,自动关联某型号元器件的 ESD 防护等级与对应的操作规范,形成动态更新
    发表于 05-22 17:12

    万里红入围嘶吼2026网络安全产业图谱

    近日,嘶吼安全产业研究院正式揭晓《2026网络安全产业图谱》。万里红凭借深厚的技术底蕴和全栈式产品布局,强势入围7大核心类别与16项细分领域,尤其在备受关注的AI安全领域,万里红大模型知识应用系统
    的头像 发表于 05-19 16:34 293次阅读

    行业洞察篇__数字孪生IOC的“智能体”时刻:智慧城市公共服务的演进逻辑

    去改变现实的“数字手”。我觉得这个比喻虽然有推广的嫌疑,但确实点出了本质——从“看”到“做”的跨越。 支撑这种跨越的技术栈正在快速成熟。主流技术栈正在转向“多模型集成+知识图谱+rAg+智能体编排
    发表于 05-14 09:52

    AI大模型微调企业项目实战课

    实战通常遵循严密的“三步走”战略: 第一步:数据炼金——高质量SFT数据的构建 在微调领域,“垃圾进,垃圾出”是铁律。实战课的核心首先是教企业如何“洗数据”。这包括从内部ERP、OA系统、知识图谱中提
    发表于 04-16 18:48

    实力认证!行云创新入围《AI 中国生态图谱 2025》大模型开放平台板块

    了中国 AI 产业全链路生态布局,是洞察国内 AI 技术发展与产业落地的核心行业风向标。行云创新凭借在 AI 领域深厚的技术积淀、全栈产品能力及丰富的行业落地经验,成功 入围图谱第三层模型层・大模型开放平台板块 。 成立于 20
    的头像 发表于 03-04 14:25 469次阅读
    实力认证!行云创新入围《AI 中国生态<b class='flag-5'>图谱</b> 2025》大<b class='flag-5'>模型</b>开放平台板块

    润和软件入选大模型一体机产业图谱

    近日,由中国人工智能产业发展联盟与中国信息通信研究院联合编制的《大模型一体机产业图谱》正式发布。该图谱系统梳理并收录了国内大模型一体机产业链上下游70余家代表性企业,全面呈现我国大
    的头像 发表于 12-10 17:56 1814次阅读
    润和软件入选大<b class='flag-5'>模型</b>一体机产业<b class='flag-5'>图谱</b>

    华为联合发布宜兴“天机镜”大模型知识图谱

    近日,由宜兴市大数据发展有限公司与华为联合主办的“共聚AI泛生态 智启产业新未来——城市大安全AI产业发展峰会暨华为中国行2025江苏站”,在江苏宜兴举行。
    的头像 发表于 11-14 16:40 1816次阅读

    AI与工业互联网的发展趋势怎么样

    ”转向“行业化”,如海尔卡奥斯推出的天智工业大模型,已落地石油化工、家电等9大行业40余个场景,通过“一行业、一模型”模式实现精准赋能。 大模型与工业知识图谱深度
    的头像 发表于 09-01 11:33 873次阅读

    知识分享 | 使用MXAM进行AUTOSAR模型的静态分析:Embedded Coder与TargetLink模型

    知识分享在知识分享栏目中,我们会定期与读者分享来自MES模赛思的基于模型的软件开发相关Know-How干货,关注公众号,随时掌握基于模型的软件设计的技术
    的头像 发表于 08-27 10:04 955次阅读
    <b class='flag-5'>知识</b>分享 | 使用MXAM进行AUTOSAR<b class='flag-5'>模型</b>的静态分析:Embedded Coder与TargetLink<b class='flag-5'>模型</b>

    知识分享 | 敏捷方法在基于模型的软件开发项目中的应用

    传统的瀑布式软件开发流程存在诸多局限,这使得应用敏捷原则变得尤为重要,尤其是面对复杂且不断变化的开发环境时。作为最高效的软件开发方法之一,基于模型的开发(MBD)具有诸多优势。将敏捷原则融入MBD
    的头像 发表于 07-16 16:52 1495次阅读
    <b class='flag-5'>知识</b>分享 | 敏捷<b class='flag-5'>方法</b>在基于<b class='flag-5'>模型</b>的软件开发项目中的应用

    家电电路识图自学手册

    家电电路识图自学手册
    发表于 07-11 15:49 16次下载

    模型推理显存和计算量估计方法研究

    方法。 一、引言 大模型推理是指在已知输入数据的情况下,通过深度学习模型进行预测或分类的过程。然而,大模型的推理过程对显存和计算资源的需求较高,这给实际应用带来了以下挑战: 显存不足:
    发表于 07-03 19:43

    FA模型和Stage模型API切换概述

    API切换概述 FA模型和Stage模型由于线程模型和进程模型的差异,部分接口仅在FA模型下才
    发表于 06-06 06:29

    FA模型访问Stage模型DataShareExtensionAbility说明

    FA模型访问Stage模型DataShareExtensionAbility 概述 无论FA模型还是Stage模型,数据读写功能都包含客
    发表于 06-04 07:53