0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

复杂知识库问答任务的典型挑战和解决方案

深度学习自然语言处理 来源:专知 作者:专知 2021-06-13 09:49 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

知识库问答旨在通过知识库回答自然语言问题。近来,大量的研究集中在语义或句法上复杂的问题上。在本文中,我们精心总结了复杂知识库问答任务的典型挑战和解决方案,介绍了复杂知识库问答的两种主流方法,即基于语义解析(基于SP)的方法和基于信息检索(基于IR)的方法。首先,我们形式化地定义了知识库问答任务并介绍了该任务下相关的数据集。然后,我们从两个类别的角度全面回顾了前沿方法,说明他们针对典型挑战的解决方案。最后,我们总结并讨论了一些仍具有挑战的未来研究方向。

知识库(KB)是一个结构化的数据库,它以(主题、关系、对象)的形式包含一系列事实。大型KBs,如Freebase [Bollacker et al., 2008], DBPedia [Lehmann et al., 2015]和Wikidata [Tanon et al., 2016],已经构建服务于许多下游任务。知识库问答(KBQA)是一种基于知识库的自然语言问答任务。KBQA的早期工作[Bordes et al., 2015; Dong et al., 2015; Hu et al., 2018a; Lan et al., 2019b; Lan et al., 2019a]专注于回答一个简单的问题,其中只涉及一个单一的事实。例如,“j·k·罗琳出生在哪里?”“是一个可以用事实来回答的简单问题”(J.K.罗琳)罗琳,出生地,英国)。

最近,研究人员开始更多地关注于回答复杂问题,即复杂的KBQA任务[Hu et al., 2018b; Luo et al., 2018]。复杂问题通常包含多个主题,表达复合关系,并包含数值运算。以图1中的问题为例。这个例题的开头是“the Jeff Probst Show”。这个问题不是问一个单一的事实,而是要求由两个关系组成,即“被提名人”和“配偶”。该查询还与一个实体类型约束“(Jeff Probst,是一个电视制作人)”相关联。最后的答案应该通过选择有最早结婚日期的可能候选人来进一步汇总。一般来说,复杂问题是涉及多跳推理、约束关系、数值运算或上述几种组合的问题。

回到简单KBQA的解决方案,已经提出了两种主流方法的一些研究。这两种方法首先识别问题中的主题,并将其链接到知识库中的实体(称为主题实体)。然后,通过执行已解析的逻辑形式或在从知识库中提取的特定于问题的图中进行推理,在主题实体的邻近区域内获得答案。这两类方法在以往的工作中通常被称为基于语义解析的方法(基于SP的方法)和基于信息检索的方法(基于IR的方法)[Bordes et al., 2015; Dong et al., 2015; Hu et al., 2018a; Gu et al., 2020]。它们包括解决KBQA任务的不同工作机制。前一种方法用符号逻辑形式表示问题,然后对知识库执行它,获得最终答案。后一种方法构造一个特定于问题的图,给出与问题相关的全面信息,并根据其与问题的相关性对抽取的图中的所有实体进行排序。

然而,当将这两种主流方法应用于复杂的KBQA任务时,复杂的问题会给这两种方法的不同部分带来挑战。我们认为主要挑战如下:

现有基于SP的方法中使用的解析器难以覆盖各种复杂的查询(例如,多跳推理、约束关系和数值运算)。类似地,以前的基于ir的方法可能无法回答复杂的查询,因为它们的排序是在没有可追溯推理的情况下对小范围实体执行的。

在复杂问题中,更多的关系和主题意味着更大的潜在逻辑形式的搜索空间,这将显著增加计算成本。同时,更多的关系和被试会阻碍基于IR的方法检索所有相关实体进行排序。

两种方法都把理解问题作为首要步骤。当问题在语义和句法方面都变得复杂时,就要求模型具有较强的自然语言理解和泛化能力。

对于复杂问题,为答案标记ground truth路径是非常昂贵的。通常,只提供问答对。这表明基于SP的方法和基于IR的方法需要分别在没有正确逻辑形式和推理路径标注的情况下进行训练。这种微弱的监管信号给两种方式都带来了困难。

关于相关综述,我们观察到Wu等人[2019]和Chakraborty等人[2019]回顾了关于简单KBQA的现有工作。此外,Fu等人[2020]研究了复杂KBQA的当前进展。他们只从技术的角度提供了高级方法的一般观点,而更多地关注于电子商务领域的应用场景。与这些综述不同的是,我们的工作试图识别在以往的研究中遇到的挑战,并以全面和有序的方式广泛讨论现有的解决方案。具体来说,我们将复杂KBQA的方法根据其工作机制分为两种主流方法。我们将这两种方法的整个过程分解为一系列模块,并分析每个模块中的挑战。我们相信这种方式特别有助于读者理解挑战,以及如何在现有的复杂KBQA解决方案中解决这些挑战。此外,我们还对复杂KBQA的几个有前途的研究方向进行了展望。

原文标题:IJCAI2021最新「复杂知识库问答研究」综述论文,阐述KBQA方法、挑战与对策

文章出处:【微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据库
    +关注

    关注

    7

    文章

    4094

    浏览量

    68696
  • 自然语言
    +关注

    关注

    1

    文章

    293

    浏览量

    14048

原文标题:IJCAI2021最新「复杂知识库问答研究」综述论文,阐述KBQA方法、挑战与对策

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    HPM知识库 | 先楫半导体电机库简介

    HPM知识库本栏目是先楫MCU开发的「一站式技术参考」!每周上新,为HPM开发者提供全维度的技术文档、问题解决方案、开发指南与实战教程,了解更多,请访问https://kb.hpmicro.com
    的头像 发表于 05-22 10:58 110次阅读
    HPM<b class='flag-5'>知识库</b> | 先楫半导体电机库简介

    国产化DevOps工具链实践:知识库与需求/任务/版本如何打通?

    人工、复用率低、变更不同步。国产化DevOps工具链要解决的,不是简单替换界面,而是把 需求→任务→版本→知识库 变成可追溯、可审计、可联动的闭环,同时满足私有化部署、数据不出境、操作留痕等硬性要求。 一、真实场景与精
    的头像 发表于 05-13 09:41 253次阅读

    固态变压器实时仿真的挑战和解决方案

    变压器高开关频率、大拓扑级联特点影响,传统仿真技术难以兼顾精度与实时性,EasyGo实时仿真解决方案为破解这一行业技术瓶颈提供了高效可行的全新路径。一、固态变压器
    的头像 发表于 03-20 13:35 615次阅读
    固态变压器实时仿真的<b class='flag-5'>挑战和解决方案</b>

    HPM知识库 | [EtherCAT] 从站运行过程中报错(错误码:0x1A\\0x1B\\0x2C)的代码分析

    HPM知识库先楫半导体官方公众号全新上线「HPM知识库」专栏。我们将在这里不定期更新技术文档、开发指南与实战教程,打造先楫MCU开发的“一站式技术参考指南”!了解更多,欢迎访问https
    的头像 发表于 03-13 08:34 436次阅读
    HPM<b class='flag-5'>知识库</b> | [EtherCAT] 从站运行过程中报错(错误码:0x1A\\0x1B\\0x2C)的代码分析

    开发知识库测试添加知识库

    文档类型的知识要等待数据校验完成后才能上架 可以点击知识名称查看知识详情 等待后端处理完成可以点击知识列表的上架 在智能体中知识库的位置点
    发表于 03-06 15:07

    鸿蒙智能体开发知识库---创建知识库

    在小艺智能体平台页面,通过【工作空间】-【知识库】-【新建知识库】,进入新建知识库流程。 若勾选【授权知识库用于知识
    发表于 03-06 10:18

    模力方舟与TorchV达成战略合作

    近日,模力方舟与大模型知识协作系统 TorchV(杭州萌嘉网络科技有限公司)达成战略合作。双方将联合推出基于国产算力的企业级解决方案,支持在模力方舟上完成 TorchV 的专属部署,帮助开发者与技术团队将知识库
    的头像 发表于 03-03 16:28 567次阅读
    模力方舟与TorchV达成战略合作

    设备维修总踩坑?故障知识库 + AI 诊断,新手也能修复杂

    设备维修的核心痛点,本质是知识难沉淀、故障难预判。知识库解决经验传承问题,AI诊断实现精准高效,二者结合让维修从“经验依赖”转向“标准化+智能辅助”。
    的头像 发表于 01-08 14:04 628次阅读
    设备维修总踩坑?故障<b class='flag-5'>知识库</b> + AI 诊断,新手也能修<b class='flag-5'>复杂</b>机

    openDACS 2025 开源EDA与芯片赛项 赛题七:基于大模型的生成式原理图设计

    教材,元器件厂商的数据手册、典型应用电路等权威资料,构建一个结构清晰、内容准确的私域知识库。 检索和说明、应答方案:参赛队伍需要设计合理的检索方案,实现对
    发表于 11-13 11:49

    HarmonyOSAI编程智能问答

    CodeGenie基于生成式搜索能力,通过查询生成、内容优选服务高效理解用户意图,问答交互式地获取编码相关知识。 对话示例 在对话区域输入需要查询的问题,开始问答。示例如下: ArkTS如何实现
    发表于 09-03 16:17

    零基础在智能硬件上克隆原神可莉实现桌面陪伴(提供人设提示词、知识库、固件下载)

    个步骤:1、创建智能体:配置可莉的基础信息2、声音复刻:克隆可莉的声音3、配置知识库:配置可莉和嘟嘟可的背景、故事经历、语录等知识库 4、自定义唤醒词:修改唤醒词和唤醒回复语 (篇尾提供修改了唤醒词
    发表于 08-22 19:51

    积算科技上线赤兔推理引擎服务,创新解锁FP8大模型算力

    的模型轻量化部署方案。用户通过远程算力平台预置的模型镜像与AI工具,仅需50%的GPU算力即可解锁大模型推理、企业知识库搭建、智能体开发,加速大模型在智能问答、报告生成、客服助手、智能体等典型
    的头像 发表于 07-30 21:44 1142次阅读

    软通动力携手华为云推出AI知识引擎与数据工程融合创新解决方案

    在华为开发者大会2025中,软通动力携手华为云以华为云昇腾AI、盘古大模型、ModelArts等为技术底座,全新升级数据治理基线解决方案,正式发布AI知识引擎与数据工程融合创新解决方案(包括软通动力
    的头像 发表于 06-28 17:07 1864次阅读

    微小泄漏零容忍:结束线连接器气密性检测的挑战与对策

    我们在使用结束线连接器气密检测的时候会遇到很多问题,那在气密检测中遇到这些挑战,我们该如何去解决呢,下面是一些挑战和解决对策:
    的头像 发表于 06-04 14:17 583次阅读
    微小泄漏零容忍:结束线连接器气密性检测的<b class='flag-5'>挑战</b>与对策

    快速入门——LuatOS:sys任务管理实战攻略!

    的开发者,这里将用最简明的步骤,助你轻松实现多任务应用开发! sys是LuatOS的核心系统调度,它基于Lua协程机制实现了实时多任务调度、定时器管理以及消息通信等功能。 在详细介
    的头像 发表于 05-29 14:36 1082次阅读
    快速入门——LuatOS:sys<b class='flag-5'>库</b>多<b class='flag-5'>任务</b>管理实战攻略!