0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

科技云报道:ChatGPT的胜利,宣告知识图谱的消亡?

科技云报到 来源:jf_60444065 作者:jf_60444065 2023-05-24 14:30 次阅读

科技云报道原创

过去10年,知识图谱可谓是最接近“人工智能”的概念。业内普遍认为,知识图谱的概念最先是由谷歌于2012年正式提出,主要用来支撑下一代搜索和在线广告业务。

此后,这项技术迅速火爆,被国内外多家搜索引公司所采用,如:美国的微软必应,中国的百度、搜狗等,都在短短的一年内纷纷宣布了各自的“知识图谱”产品,足以看出这项革新对整个搜索引擎界的整体影响。

但这项技术的应用并不仅拘泥于搜索引擎领域范围。由于让人工智能具备了认知能力和逻辑能力,知识图谱进而实现了智能分析、智能搜索、人机交互、个性化推荐等场景应用,成为互联网知识驱动的智能应用的基础设施。

可以说知识图谱与大数据和深度学习一起,成为推动互联网和人工智能发展的核心驱动力之一。

然而,ChatGPT的横空出世让整个AI界都沸腾了。

pYYBAGRtrqGAdQUVAAVaSdmmGNE688.png

ChatGPT带来的震撼在于,它不用借助知识图谱就可以很好地解决用户对话知识问答相关的任务,具有非常强大的理解能力、流畅的对话能力和上下文的刻画能力。

更重要的是,它将原来基于特定任务的模型变成了一个统一的、基于提示的、任务无关的模型,可以去尝试解决非常复杂或困难的、人类参与很多的任务。

这也让AI界认知产生了分化,有观点认为有了ChatGPT这种大语言模型后,知识图谱完全没有存在的意义,甚至有的公司已经彻底抛弃了知识图谱路线。

那么,在大模型时代,知识图谱真的要消亡了吗?

知识图谱vs大语言模型

在讨论这个问题之前,先来了解一下知识图谱和大语言模型的异同。

知识图谱从字面上看,可以拆分为知识+图谱,这样就可以理解:将需要的知识数据(结构化或非结构化数据)以图谱的形式进行展示,这种简单的过程也是知识图谱的构建过程。

知识图谱通常包含实体、关系和属性三个要素,例如人名、国家、语言等实体,以及人口、首都、官方语言等关系和属性。它可以根据图谱中定义的关系提供精确且逻辑一致的答案,因此对于信息检索、问答和结构化数据推理等任务特别有用。

大语言模型是基于深度学习和神经网络,像GPT-4这样的大语言模型是在大量文本数据上进行训练,以学习模式、上下文以及单词和短语之间的关系。

它们可以生成类似人类的文本、回答问题、提供建议以及执行其他自然语言任务,还可以很好地处理模棱两可和不完整的信息,并且处理广泛的主题。

不难发现,两者在知识的学习、分析、推理方面有着类似的功能,但却各有优劣势。

知识图谱通常需要手动或半自动构建,是一种非常耗时耗人力的工作,随着知识的不断扩展和变化,知识图谱也需要不断更新;

同时,它的作用仅限于图谱编码中的知识范围,这使得它在处理模棱两可或不完整的信息时准确率较低。

但它的优势在于准确的知识库,对于事实性的、专业性的知识有着非常高的准确度。

相反,专业知识在大模型训练语料里占比非常少,这也使得ChatGPT等语言大模型生成的内容的可靠性和真实性备受质疑。

它无法将真实与想象、真实与虚构分开,这种现象甚至促使创造了一个新术语:人工智能幻觉,维基百科将其定义为“人工智能的自信反应,其训练数据似乎没有合理性”。

同时,语言大模型需要大量的计算能力和资源来进行训练和微调,其花费的时间和成本也不容小觑。

目前,语言大模型只在通用领域给出了较为惊艳的表现,至于在知识图谱广泛应用的垂直领域,语言大模型暂时未显示出领先的一面。

知识图谱退场为时尚早

正因为语言大模型暂时还无法解决事实准确性、可信度、可追溯等问题,知识图谱的存在就非常有意义。

知识图谱或者类似的知识库、知识引擎,能够为大模型提供准确的知识,它可以被用来通知、聚焦、过滤和控制生成式人工智能,增强大模型响应的智能和可靠性,使其更适合关键任务。

当大模型真正落地到工业应用时,也需要有知识图谱对专业领域知识的支撑,至少短期来看是非常需要的。

因此,我们也可以说,知识图谱的构建原来有各种各样的构建方式,现在又多了一种构建方式——用大模型去辅助整个知识图谱构建,通过大量语料和大数据的学习,通过Prompt去进行知识的激发。

同时知识图谱反过来也能够去推动大模型Prompt工程里的相关工作,融入到大模型的训练中,使得生成更可控,更准确。同时,知识图谱也可以提供很多额外的语义信息,帮助大模型的知识推理做得更好。

所以从本质上看,大语言模型出现后,并不是将知识图谱消灭了,而是可以发挥知识图谱和大模型这两种技术的优势:在需要可控知识或可控逻辑的时候,知识图谱会发挥更大作用;在需要更自由的交互任务理解和生成时,大模型发挥更好的作用。

结合这两种方法的优势,可以产生更强大和有效的自然语言处理系统。

知识图谱与大语言模型的结合

那么,知识图谱如何与大语言模型相结合呢?

有意思的是,ChatGPT给出了将知识图谱集成到大语言模型中的几种方法:

使用知识图谱数据进行预训练

将知识图谱中的知识注入到大语言模型的预训练阶段,可以帮助大模型学习实体与其属性之间的关系。可以通过将知识图谱三元组(主语、谓语、宾语)转换为自然语言句子并将它们添加到训练语料库中来完成。

使用基于图的目标进行微调

在预训练之后,使用基于图的目标对特定任务的模型进行微调,可以帮助大模型学习使用图中编码的知识进行推理和推理。这可能涉及将自然语言查询转换为基于图形的查询,以及开发将基于图形的推理与基于文本的推理相结合的方法。

例如,可以对模型进行微调,以预测图形中缺失的实体或关系,这可以提高其对底层结构的理解。

改进实体链接和消除歧义

增强模型识别文本中的实体并将其链接到知识图谱中相应节点的能力。这可以通过在训练或微调期间结合高级实体链接和消除歧义技术来实现。

集成图嵌入

图嵌入是一种用于将图中的节点、边或整个子图转换为连续向量或低维表示的技术,机器学习算法可以更轻松地处理这些向量或低维表示。

图嵌入在知识工程的上下文中特别有用,因为它可以帮助将知识图谱中的结构化信息转换为可以更容易地与机器学习算法(尤其是神经网络)集成的格式。

使用图神经网络或其他图表示学习方法学习,并可用于丰富模型对实体及其关系的理解。

推理时查询知识图谱

当模型遇到需要精确、结构化知识的问题或任务时,可以查询知识图谱获取相关信息。这可以通过将自然语言查询转换为基于图形的查询(例如,使用SPARQL),然后使用检索到的信息来回答问题或执行任务来完成。

知识图谱引导生成

将大语言模型的生成能力与知识图谱中的结构化信息相结合,可以生成更准确、更相关的文本。例如,在生成实体的摘要或描述时,模型可以对知识图谱中的信息进行优先级排序,以确保事实的正确性。

混合模型

开发包含基于图和基于神经网络的组件的混合模型,可以利用这两种方法的优势。例如,图神经网络(GNN)可用于学习图结构数据的潜在表示,然后可以将其与大语言模型集成以执行自然语言处理任务。

鼓励可解释性和可解释性

开发允许大语言模型基于知识图谱为其推理和预测生成解释的方法。这可以帮助用户了解模型如何利用知识图谱中的结构化信息,并有助于调试和优化模型。

结语

技术的浪潮总是汹涌而至,在新的技术革新来临之际,我们更应该客观看待新旧技术的优劣,而不是冲动地去拥抱新技术,抛弃现有成熟技术。

对于知识图谱来说,大模型的出现并不是一个冲击,恰恰是给了知识图谱一个新的生长空间。当我们将大模型与自身优势的行业应用去深度结合,形成数据和算法的持续迭代,必将看到更好的结果持续涌现。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

审核编辑黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26343

    浏览量

    263943
  • ChatGPT
    +关注

    关注

    27

    文章

    1402

    浏览量

    4526
  • 大模型
    +关注

    关注

    2

    文章

    1452

    浏览量

    1030
收藏 人收藏

    评论

    相关推荐

    在FPGA设计中是否可以应用ChatGPT生成想要的程序呢

    当下AI人工智能崛起,很多开发领域都可看到ChatGPT的身影,FPGA设计中,是否也可以用ChatGPT辅助设计呢?
    发表于 03-28 23:41

    利用知识图谱与Llama-Index技术构建大模型驱动的RAG系统(下)

    对于语言模型(LLM)幻觉,知识图谱被证明优于向量数据库。知识图谱提供更准确、多样化、有趣、逻辑和一致的信息,减少了LLM中出现幻觉的可能性。
    的头像 发表于 02-22 14:13 264次阅读
    利用<b class='flag-5'>知识图谱</b>与Llama-Index技术构建大模型驱动的RAG系统(下)

    【国产FPGA+OMAPL138开发板体验】(原创)6.FPGA连接ChatGPT 4

    OMAP-L138(定点/浮点DSP C674x+ARM9)+ FPGA处理器的开发板。 编写一个用于FPGA访问ChatGPT 4的程序代码是一个相当复杂的任务,涉及到硬件设计、网络通信、数据处理等多个
    发表于 02-14 21:58

    知识图谱基础知识应用和学术前沿趋势

    知识图谱(Knowledge Graph)以结构化的形式描述客观世界中概念、实体及其关系。是融合了认知计算、知识表示与推理、信息检索与抽取、自然语言处理、Web技术、机器学习与大数据挖掘等等方向的交叉学科。人工智能是以传统符号派与目前流行的深度神经网路为主,如下图所示,
    的头像 发表于 01-08 10:57 429次阅读
    <b class='flag-5'>知识图谱</b>基础<b class='flag-5'>知识</b>应用和学术前沿趋势

    不到1分钟开发一个GPT应用!各路大神疯狂整活,网友:ChatGPT就是新iPhone

    这个说法并不准确。尽管ChatGPT等语言模型已经在一定程度上改变了我们获取信息、学习知识的方式,但它们并不能替代人类进行创造性思考和创造性活动。 虽然一些人可能会利用ChatGPT等语言模型快速
    发表于 11-19 12:06

    知识图谱与大模型结合方法概述

    本文作者 |  黄巍 《Unifying Large Language Models and Knowledge Graphs: A Roadmap》总结了大语言模型和知识图谱融合的三种路线
    的头像 发表于 10-29 15:50 596次阅读
    <b class='flag-5'>知识图谱</b>与大模型结合方法概述

    云知声亮相第十七届全国知识图谱与语义计算大会

    8月24日-27日,第十七届全国知识图谱与语义计算大会(CCKS 2023)在沈阳成功举办。大会聚焦“知识图谱赋能通用AI”,邀请国内外知名学者、产业界知名发言人员介绍相关领域的最新进展和发展趋势
    的头像 发表于 08-31 16:02 401次阅读
    云知声亮相第十七届全国<b class='flag-5'>知识图谱</b>与语义计算大会

    2023中国工业互联网技术发展的十大科技趋势

    知识图谱是一种基于语义网技术的知识表示方法,它将实体、属性和关系等元素进行抽象和建模,形成一个具有语义表达能力的图结构。在工业领域,知识图谱可以将工业领域的知识进行建
    的头像 发表于 08-31 15:18 512次阅读
    2023中国工业互联网技术发展的十大科技趋势

    如何利用大模型构建知识图谱?如何利用大模型操作结构化数据?

    上图是之前,我基于大语言模型构建知识图谱的成品图,主要是将金融相关的股票、人物、涨跌幅之类的基金信息抽取出来。
    的头像 发表于 08-24 16:56 8286次阅读
    如何利用大模型构建<b class='flag-5'>知识图谱</b>?如何利用大模型操作结构化数据?

    大型语言模型与知识图谱:机遇与挑战

    这对知识表示领域来说是一个巨大的步骤。长时间以来,人们关注的是明确的知识,例如嵌入在文本中的知识,有时也被称为非结构化数据,以及以结构化形式存在的知识,例如在数据库和
    的头像 发表于 08-24 14:50 424次阅读
    大型语言模型与<b class='flag-5'>知识图谱</b>:机遇与挑战

    摩尔定律为什么会消亡?摩尔定律是如何消亡的?

    虽然摩尔定律的消亡是一个日益严重的问题,但每年都会有关键参与者的创新。
    的头像 发表于 08-14 11:03 1324次阅读
    摩尔定律为什么会<b class='flag-5'>消亡</b>?摩尔定律是如何<b class='flag-5'>消亡</b>的?

    知识图谱嵌入模型 (KGE) 的总结和比较

    知识图谱嵌入(KGE)是一种利用监督学习来学习嵌入以及节点和边的向量表示的模型。它们将“知识”投射到一个连续的低维空间,这些低维空间向量一般只有几百个维度(用来表示知识存储的内存效率)。向量空间中,每个点代表一个概念,每个点在空
    的头像 发表于 07-31 16:07 601次阅读
    <b class='flag-5'>知识图谱</b>嵌入模型 (KGE) 的总结和比较

    巨微文化携手IBM依托AI共塑知识图谱新篇章

    知识图谱是具有 AI 能力加持的智能“知识库”,借助于基于 AI 的自然语言处理 (NLP) 能力,打造智能搜索、智能问答、个性化推荐、辅助决策和异常监测等能力。对于教辅此类知识密集型行业,科目复杂度高,需要多个专家协同工作
    的头像 发表于 06-05 16:17 561次阅读

    首个中文医学知识LLM:真正的赛华佗—华驼(HuaTuo)

    通过医学知识图谱和 GPT 3.5 API 构建了中文医学指令数据集,并在此基础上对 LLaMA 进行了指令微调,提高了 LLaMA 在医疗领域的问答效果。
    的头像 发表于 05-08 11:30 1230次阅读
    首个中文医学<b class='flag-5'>知识</b>LLM:真正的赛华佗—华驼(HuaTuo)

    局部放电特征图谱绘制

    现在有小波去噪够的局部放电数据,怎么绘制q-n图谱或者是三维的图谱,prpd图。
    发表于 04-26 17:54