0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

知识图谱与大模型结合方法概述

华为DevCloud 来源:未知 2023-10-29 15:50 次阅读

本文作者 | 黄巍

《Unifying Large Language Models and Knowledge Graphs: A Roadmap》总结了大语言模型和知识图谱融合的三种路线:1)KG增强的LLM,可在LLMs的预训练和推理阶段引入KGs;2)LLM增强KG,LLM可用于KG构建、KG embedding、KG补全、基于KG的文本生成、KBQA(基于图谱的问答)等多种场景;3)LLM+KG协同使用,主要用于知识表示和推理两个方面。该文综述了以上三个路线的代表性研究,探讨了未来可能的研究方向。

知识图谱(KG)和大语言模型(LLM)都是知识的表示形式。KG是符号化的知识库,具备一定推理能力,且结果可解释性较好。但存在构建成本高、泛化能力不足、更新难等不足。LLM是参数化的概率知识库,具备较强语义理解和泛化能力,但它是黑盒模型,可能编造子虚乌有的内容,结果的可解释性较差。可见,将LLM和KG协同使用,同时利用它们的优势,是一种互补的做法。

wKgZomU-D9WABEmCAACDJaTqIbk703.png

LLM和KG的融合路线,可分为以下类型:

wKgZomU-D9WAWM3wAADglL6UMl0258.png

第一种融合路线是KG增强LLM,可在LLM预训练、推理阶段引入KG。以KG增强LLM预训练为例,一个代表工作是百度的ERNIE 3.0将图谱三元组转换成一段token文本作为输入,并遮盖其实体或者关系来进行预训练,使模型在预训练阶段直接学习KG蕴含的知识。

wKgZomU-D9aAHQU4AACBLP79zBo093.png

第二种融合路线是LLM增强KG。LLM可用于KG构建、KG embedding、KG补全、基于KG的文本生成、KBQA(基于图谱的问答)等多种场景。以KG构建为例,这是一项成本很高的工作,一般包含1) entity discovery 实体挖掘 2) coreference resolution 指代消解 3) relation extraction 关系抽取任务。LLM本身蕴含知识,且具备较强的语义理解能力,因此,可利用LLM从原始数据中抽取实体、关系,进而构建知识图谱。

wKgZomU-D9aAMineAACkS7JiANc980.png

第三种融合路线是KG+LLM协同使用,主要用于知识表示和推理两个方面。以知识表示为例,文本语料库和知识图谱都蕴含了大量的知识,文本中的知识通常是非结构化的,图谱里的知识则是结构化的,针对一些下游任务,需要将其对齐进行统一的表示。比如,KEPLER是一个统一的模型来进行统一表示,它将文本通过LLM转成embedding表示,然后把KG embedding的优化目标和语言模型的优化目标结合起来,一起作为KEPLER模型的优化目标,最后得到一个能联合表示文本语料和图谱的模型。示意图如下:

wKgZomU-D9aAK95VAABY9WjcPUQ072.pngwKgZomVA6_OAdWxgAAAChhq5BME149.svg

小结

上述方法都在尝试打破LLM和KG两类不同知识表示的边界,促使LLM这种概率模型能利用KG静态的、符号化的知识;促使KG能利用LLM参数化的概率知识。从现有落地案例来看,大模型对知识的抽象程度高,泛化能力强,用户开箱即用,体验更好。且如果采用大模型+搜索的方案,用户更新知识的成本也较低,往知识库加文档即可。在实际业务场景落地时,如果条件允许,优先考虑使用大模型。当前chatGPT火爆,也印证了其可用性更好。如遇到以下场景时,可以考虑将LLM和KG结合使用:

•对知识可信度和可解释性要求高的场景,比如医疗、法律等,可以考虑再建设知识图谱来降低大模型回答错误知识的概率,提高回答的可信度和可解释性。

•已经有一个蕴含丰富知识的图谱,再做大模型建设时。可以参考KG增强LLM的方法,将其知识融合到LLM中。

•涉及基于图谱的多条推理能力的场景。

•涉及基于图谱可视化展示的场景,比如企查查、天眼查等。

参考文献:

1.Unifying Large Language Models and Knowledge Graphs: A Roadmaphttps://arxiv.org/abs/2306.08302


原文标题:知识图谱与大模型结合方法概述

文章出处:【微信公众号:华为DevCloud】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    215

    文章

    33629

    浏览量

    247162

原文标题:知识图谱与大模型结合方法概述

文章出处:【微信号:华为DevCloud,微信公众号:华为DevCloud】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    利用知识图谱与Llama-Index技术构建大模型驱动的RAG系统(下)

    对于语言模型(LLM)幻觉,知识图谱被证明优于向量数据库。知识图谱提供更准确、多样化、有趣、逻辑和一致的信息,减少了LLM中出现幻觉的可能性。
    的头像 发表于 02-22 14:13 278次阅读
    利用<b class='flag-5'>知识图谱</b>与Llama-Index技术构建大<b class='flag-5'>模型</b>驱动的RAG系统(下)

    知识图谱基础知识应用和学术前沿趋势

    知识图谱(Knowledge Graph)以结构化的形式描述客观世界中概念、实体及其关系。是融合了认知计算、知识表示与推理、信息检索与抽取、自然语言处理、Web技术、机器学习与大数据挖掘等等方向的交叉学科。人工智能是以传统符号派与目前流行的深度神经网路为主,如下图所示,
    的头像 发表于 01-08 10:57 437次阅读
    <b class='flag-5'>知识图谱</b>基础<b class='flag-5'>知识</b>应用和学术前沿趋势

    《电子工程师必备——九大系统电路识图宝典》+附录5学习方法

    jf_39110170 网名“还没吃饭”阅读《电子工程师必备 九大系统电路识图宝典第2版》附录5的读后感:探索科学学习方法 作为一名对电子技术学科充满热情的嵌入式工程师,你是否曾因学习方法的不明确而感到困惑?你是否曾在
    发表于 10-06 23:25

    《电子工程师必备——九大系统电路识图宝典》+附录4读后感

    阅读和理解电路图是非常关键的。在此,我将结合自己的经验和理解,详细阐述电子电路图的种类和识图方法,并分享我的心得体会。 电子电路图的种类 在附录4中,主要介绍了三种常见的电子电路图:方框图、原理图
    发表于 09-28 13:44

    云知声亮相第十七届全国知识图谱与语义计算大会

    8月24日-27日,第十七届全国知识图谱与语义计算大会(CCKS 2023)在沈阳成功举办。大会聚焦“知识图谱赋能通用AI”,邀请国内外知名学者、产业界知名发言人员介绍相关领域的最新进展和发展趋势
    的头像 发表于 08-31 16:02 411次阅读
    云知声亮相第十七届全国<b class='flag-5'>知识图谱</b>与语义计算大会

    2023中国工业互联网技术发展的十大科技趋势

    知识图谱是一种基于语义网技术的知识表示方法,它将实体、属性和关系等元素进行抽象和建模,形成一个具有语义表达能力的图结构。在工业领域,知识图谱可以将工业领域的
    的头像 发表于 08-31 15:18 518次阅读
    2023中国工业互联网技术发展的十大科技趋势

    如何利用大模型构建知识图谱?如何利用大模型操作结构化数据?

    上图是之前,我基于大语言模型构建知识图谱的成品图,主要是将金融相关的股票、人物、涨跌幅之类的基金信息抽取出来。
    的头像 发表于 08-24 16:56 8715次阅读
    如何利用大<b class='flag-5'>模型</b>构建<b class='flag-5'>知识图谱</b>?如何利用大<b class='flag-5'>模型</b>操作结构化数据?

    大型语言模型知识图谱:机遇与挑战

    这对知识表示领域来说是一个巨大的步骤。长时间以来,人们关注的是明确的知识,例如嵌入在文本中的知识,有时也被称为非结构化数据,以及以结构化形式存在的知识,例如在数据库和
    的头像 发表于 08-24 14:50 428次阅读
    大型语言<b class='flag-5'>模型</b>与<b class='flag-5'>知识图谱</b>:机遇与挑战

    知识图谱嵌入模型 (KGE) 的总结和比较

    知识图谱嵌入(KGE)是一种利用监督学习来学习嵌入以及节点和边的向量表示的模型。它们将“知识”投射到一个连续的低维空间,这些低维空间向量一般只有几百个维度(用来表示知识存储的内存效率)
    的头像 发表于 07-31 16:07 625次阅读
    <b class='flag-5'>知识图谱</b>嵌入<b class='flag-5'>模型</b> (KGE) 的总结和比较

    中软国际解放号入选中国信通院《2023大模型和AIGC产业图谱

    知识工程化经验, 成功入选图谱中基础设施层、模型与工具层、产品服务层等多个核心技术与服务板块。 在AI2.0蓬勃发展的时代,大模型与产业深度融合是技术走向成熟的必然趋势。由于大
    的头像 发表于 07-11 18:05 416次阅读

    最新综述!当大型语言模型(LLM)遇上知识图谱:两大技术优势互补

    LLM 是黑箱模型,缺乏可解释性,因此备受批评。LLM 通过参数隐含地表示知识。因此,我们难以解释和验证 LLM 获得的知识。此外,LLM 是通过概率模型执行推理,而这是一个非决断性的
    的头像 发表于 07-10 11:35 1467次阅读
    最新综述!当大型语言<b class='flag-5'>模型</b>(LLM)遇上<b class='flag-5'>知识图谱</b>:两大技术优势互补

    声智私有化部署解决方案加速模型落地

    基于在人机交互领域特别是聊天机器人的长期积累,声智将融合自然语言处理和知识图谱的多技能对话模型全面升级为AzeroGPT壹元模型,面向行业用户提供安全的私有化部署、可信的行业化训练、专业的生成式推理
    的头像 发表于 06-12 10:24 374次阅读

    巨微文化携手IBM依托AI共塑知识图谱新篇章

    知识图谱是具有 AI 能力加持的智能“知识库”,借助于基于 AI 的自然语言处理 (NLP) 能力,打造智能搜索、智能问答、个性化推荐、辅助决策和异常监测等能力。对于教辅此类知识密集型行业,科目复杂度高,需要多个专家协同工作
    的头像 发表于 06-05 16:17 572次阅读

    新型数据知识驱动的元宇宙建模框架方案

    本文采用深度学习为主要研究手段,运用知识图谱、生成式对抗网络、“元宇宙”等相关理论和方法结合提出的数据知识驱动的新型框架,针对以实现传统作战环境建模的表现力差、扩展性弱的现状进行一种
    发表于 05-11 15:23 535次阅读
    新型数据<b class='flag-5'>知识</b>驱动的元宇宙建模框架方案

    首个中文医学知识LLM:真正的赛华佗—华驼(HuaTuo)

    通过医学知识图谱和 GPT 3.5 API 构建了中文医学指令数据集,并在此基础上对 LLaMA 进行了指令微调,提高了 LLaMA 在医疗领域的问答效果。
    的头像 发表于 05-08 11:30 1250次阅读
    首个中文医学<b class='flag-5'>知识</b>LLM:真正的赛华佗—华驼(HuaTuo)