0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Fudan DISC实验室将分享三篇关于知识图谱嵌入模型的论文

深度学习自然语言处理 来源:复旦DISC 作者:复旦DISC 2021-04-15 14:14 次阅读

引言

知识图谱嵌入 knowledge graph embedding是将包含实体和关系的知识图谱三元组嵌入到高维向量空间中,获得实体和关系的数值表示,提取图中相关信息,并进行后续运算推断。常用于知识图谱补全 (KG completion),关系提取 (relation extraction),实体分类 (entity classification),实体决议 (entity resolution)等等。

本次Fudan DISC实验室将分享三篇关于知识图谱嵌入模型的论文,分别介绍其训练策略、概率校准、模型设计三个方面取得的进展。

文章概览

知识图谱嵌入模型的训练策略(You CAN Teach an Old Dog New Tricks! On Training Knowledge Graph Embeddings)

论文地址:https://openreview.net/pdf?id=BkxSmlBFvr

该篇文章在两个常见数据集上对比了五种知识图谱嵌入 (Knowledge Graph Embedding) 方法在同样的训练框架和参数设置下的性能,总结并评测了不同模型架构和不同训练策略对模型的影响,正如文章标题所说“你可以教给老狗新的技巧”,训练策略对模型的性能有重大影响,并且可能占最近几年进展的很大一部分。

知识图谱嵌入模型的概率校准(Probability Calibration for Knowledge Graph Embedding Models)

论文地址:https://openreview.net/pdf?id=S1g8K1BFwS

该篇文章将概率校准的两种方法运用到知识图谱嵌入模型中,解决了当前知识图谱嵌入模型对于实体推断的打分不是概率的问题。

使用盒嵌入在知识图谱上推断(Query2box: Reasoning over Knowledge Graphs in Vector Space Using Box Embeddings)

论文地址:https://openreview.net/pdf?id=BJgr4kSFDS

该篇文章将盒嵌入引入知识图谱推断中,将原有的基于点嵌入的模型升级为基于高维矩形嵌入的模型,解决推断过程中“一推多”、合取、析取的问题。

论文细节

1

69b4f548-9cd8-11eb-8b86-12bb97331649.png

论文动机

目前有很多知识图谱嵌入模型,是近期的热点;

这些模型缺少统一的训练策略消融对比;

通常没有考虑最先进的基线。

以此带来的问题是难以评估模型和训练的贡献。因此文章将热门的5个模型在2个广泛使用的数据集上控制训练策略进行实验对比。

69c664c2-9cd8-11eb-8b86-12bb97331649.png

方法

本文使用上表中的5个模型对比了如下的训练参数设置,篇幅有限不做过多介绍。

69d7a3f4-9cd8-11eb-8b86-12bb97331649.png

实验结果

69f38768-9cd8-11eb-8b86-12bb97331649.png

结果表明通过好的训练策略,热门模型都比他们论文刚发表时发布的性能有所提升,甚至有些模型可以超过后来提出的模型,如RESCAL;同时,文中也对比了重新实现的模型与更新的模型性能,发现最新的模型并没有比之前的模型在训练策略调优后的效果上有明显提升。

6a22c6e0-9cd8-11eb-8b86-12bb97331649.png

同时,每个模型在不同训练策略下的方差都比较大,并没有完全特别好的模型。

6a36ff5c-9cd8-11eb-8b86-12bb97331649.png

此外,文章还对比了不同参数的作用,以及训练的过程。

6a4ea314-9cd8-11eb-8b86-12bb97331649.png

6a6d271c-9cd8-11eb-8b86-12bb97331649.png

2

6a8323b4-9cd8-11eb-8b86-12bb97331649.png

论文动机

知识图谱嵌入研究忽略了概率标定问题。

流行的知识图谱嵌入模型没有校准。

知识图谱嵌入得到分数的概率都是不可靠的。

因此,本文提出了一种知识图嵌入模型的标定方法,使用Platt标度和等渗回归,对概率进行了校准。

6a99db18-9cd8-11eb-8b86-12bb97331649.png

方法

论文主要的研究对象是基于知识图谱嵌入的评分,使用Platt标度和等渗回归,对评分概率进行了校准。

6ad23cf6-9cd8-11eb-8b86-12bb97331649.png

实验结果

6aeca172-9cd8-11eb-8b86-12bb97331649.png

6b0c182c-9cd8-11eb-8b86-12bb97331649.png

6b206d4a-9cd8-11eb-8b86-12bb97331649.png

6b4b2008-9cd8-11eb-8b86-12bb97331649.png

6b9b7ac6-9cd8-11eb-8b86-12bb97331649.png

实验结果表明,Platt标度和等渗回归的校准效果良好。

3

6bcbf76e-9cd8-11eb-8b86-12bb97331649.png

论文动机

在知识图谱的链接预测(link prediction)中,存在多步推理的情况,以及有的时候推理并不是一一对应,而是存在同样满足条件的多个实体集合的情况。当前的研究主要关注于单步的点推理,也没有考虑推理中集合的操作。因此,本文提出将盒嵌入模型用于回答知识图谱的推理问题,从而解决推理中多步集合推理的问题。

6be6fd02-9cd8-11eb-8b86-12bb97331649.png

方法

文中定义了盒嵌入向量的构造和投影合取的操作,以及距离的计算方式。

6c85eaca-9cd8-11eb-8b86-12bb97331649.png

此外,文中还证明了任何一个命题都可以转化为标准形式。

6fc455f0-9cd8-11eb-8b86-12bb97331649.png

实验结果

6fe1678a-9cd8-11eb-8b86-12bb97331649.png

7001be90-9cd8-11eb-8b86-12bb97331649.png

703906ac-9cd8-11eb-8b86-12bb97331649.png

实验结果表明盒嵌入模型相比于点嵌入模型拥有更好的推理效果。

总结

此次 Fudan DISC 解读的三篇论文围绕知识图谱嵌入模型展开,训练策略对于嵌入模型的训练影响很大,由知识图谱嵌入模型得到的打分可以通过概率校准的手段使其变成概率,盒嵌入模型的引入解决了复杂集合推断的问题。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    2709

    浏览量

    47735
  • 数据集
    +关注

    关注

    4

    文章

    1179

    浏览量

    24366
  • 知识图谱
    +关注

    关注

    2

    文章

    131

    浏览量

    7609

原文标题:知识图谱嵌入的一点小事 - ICLR2021

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    利用知识图谱与Llama-Index技术构建大模型驱动的RAG系统(下)

    对于语言模型(LLM)幻觉,知识图谱被证明优于向量数据库。知识图谱提供更准确、多样化、有趣、逻辑和一致的信息,减少了LLM中出现幻觉的可能性。
    的头像 发表于 02-22 14:13 291次阅读
    利用<b class='flag-5'>知识图谱</b>与Llama-Index技术构建大<b class='flag-5'>模型</b>驱动的RAG系统(下)

    上海AI实验室发布新一代书生·视觉大模型

    近日,上海人工智能实验室(上海AI实验室)联手多所知名高校及科技公司共同研发出新一代书生·视觉大模型(InternVL)。
    的头像 发表于 02-04 11:25 645次阅读

    知识图谱基础知识应用和学术前沿趋势

    知识图谱(Knowledge Graph)以结构化的形式描述客观世界中概念、实体及其关系。是融合了认知计算、知识表示与推理、信息检索与抽取、自然语言处理、Web技术、机器学习与大数据挖掘等等方向的交叉学科。人工智能是以传统符号派与目前流行的深度神经网路为主,如下图所示,
    的头像 发表于 01-08 10:57 452次阅读
    <b class='flag-5'>知识图谱</b>基础<b class='flag-5'>知识</b>应用和学术前沿趋势

    知识图谱与大模型结合方法概述

    本文作者 |  黄巍 《Unifying Large Language Models and Knowledge Graphs: A Roadmap》总结了大语言模型知识图谱融合的三种路线
    的头像 发表于 10-29 15:50 617次阅读
    <b class='flag-5'>知识图谱</b>与大<b class='flag-5'>模型</b>结合方法概述

    PCR基因扩增实验室装修设计解决方案-生命科学

    。PCR实验室进风由原有中央空调控制,要求中央空调风口安装到指定位置,且高度为地面铺装好后2600mm处。 ④如果使用荧光PCR仪,扩增和产物分析可以合并。若房间进深允许,可设P
    发表于 09-19 14:28

    云知声亮相第十七届全国知识图谱与语义计算大会

    8月24日-27日,第十七届全国知识图谱与语义计算大会(CCKS 2023)在沈阳成功举办。大会聚焦“知识图谱赋能通用AI”,邀请国内外知名学者、产业界知名发言人员介绍相关领域的最新进展和发展趋势
    的头像 发表于 08-31 16:02 419次阅读
    云知声亮相第十七届全国<b class='flag-5'>知识图谱</b>与语义计算大会

    2023中国工业互联网技术发展的十大科技趋势

    知识图谱是一种基于语义网技术的知识表示方法,它将实体、属性和关系等元素进行抽象和建模,形成一个具有语义表达能力的图结构。在工业领域,知识图谱可以将工业领域的知识进行建
    的头像 发表于 08-31 15:18 531次阅读
    2023中国工业互联网技术发展的十大科技趋势

    如何利用大模型构建知识图谱?如何利用大模型操作结构化数据?

    上图是之前,我基于大语言模型构建知识图谱的成品图,主要是将金融相关的股票、人物、涨跌幅之类的基金信息抽取出来。
    的头像 发表于 08-24 16:56 8816次阅读
    如何利用大<b class='flag-5'>模型</b>构建<b class='flag-5'>知识图谱</b>?如何利用大<b class='flag-5'>模型</b>操作结构化数据?

    大型语言模型知识图谱:机遇与挑战

    这对知识表示领域来说是一个巨大的步骤。长时间以来,人们关注的是明确的知识,例如嵌入在文本中的知识,有时也被称为非结构化数据,以及以结构化形式存在的
    的头像 发表于 08-24 14:50 438次阅读
    大型语言<b class='flag-5'>模型</b>与<b class='flag-5'>知识图谱</b>:机遇与挑战

    实验室安全高压气路设计方案

    概述: 实验室安全高压气路设计方案为实现实验室简洁、高端化而设计,采用高纯气体中央供气系统是专为高精度压力测试设备所用高纯工作气体的传输而设计,系统需要为各压力标准设备提供压力、流量稳定且经过传输后
    发表于 08-01 15:57

    知识图谱嵌入模型 (KGE) 的总结和比较

    知识图谱嵌入(KGE)是一种利用监督学习来学习嵌入以及节点和边的向量表示的模型。它们将“知识”投射到一个连续的低维空间,这些低维空间向量一般
    的头像 发表于 07-31 16:07 632次阅读
    <b class='flag-5'>知识图谱</b><b class='flag-5'>嵌入</b><b class='flag-5'>模型</b> (KGE) 的总结和比较

    最新综述!当大型语言模型(LLM)遇上知识图谱:两大技术优势互补

    LLM 是黑箱模型,缺乏可解释性,因此备受批评。LLM 通过参数隐含地表示知识。因此,我们难以解释和验证 LLM 获得的知识。此外,LLM 是通过概率模型执行推理,而这是一个非决断性的
    的头像 发表于 07-10 11:35 1471次阅读
    最新综述!当大型语言<b class='flag-5'>模型</b>(LLM)遇上<b class='flag-5'>知识图谱</b>:两大技术优势互补

    WAIC 2023:竹间智能推出「99万实验室」,与企业共建大模型

    与LLM行业解决方案,首创推出“99万实验室”,与各行各业共建大模型实验室,提供私有化部署与云端PaaS对所有企业开放。现已开放注册免费试用! 竹间智能的创始人兼首席执行官简仁贤对我们的产品做出了如下解读:"EmotiBrain
    的头像 发表于 07-07 10:23 272次阅读

    巨微文化携手IBM依托AI共塑知识图谱新篇章

    知识图谱是具有 AI 能力加持的智能“知识库”,借助于基于 AI 的自然语言处理 (NLP) 能力,打造智能搜索、智能问答、个性化推荐、辅助决策和异常监测等能力。对于教辅此类知识密集型行业,科目复杂度高,需要多个专家协同工作
    的头像 发表于 06-05 16:17 577次阅读

    实验室安全高压气路设计方案

    概述: 实验室安全高压气路设计方案为实现实验室简洁、高端化而设计,采用高纯气体中央供气系统是专为高精度压力测试设备所用高纯工作气体的传输而设计,系统需要为各压力标准设备提供压力、流量稳定且经过传输后
    发表于 05-26 16:54