0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

会话式机器阅读理解概述

智能感知与物联网技术研究所 来源:通信信号处理研究所 作者:通信信号处理研究 2020-11-25 16:07 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

1

会话式机器阅读理解是什么?

如何在会话式阅读理解里面能够建模它的implicative reasoning,即如何去学习会话与阅读理解篇章之间的蕴含关系。 在这篇文章中,讲者概述了两种常见阅读理解的类型: 第一种是标准的阅读理解,该模式是指,给定一篇描述型的文章和一个基于事实型的问题,通过匹配文章和问题,从文章中抽取一个span来回答这个问题; 第二种是会话式的问答,与标准的单轮问答不同,需要追问新问题,即follow up question,同时问题是以交互的形式出现。会话式问答,存在两个挑战,一个是需要能理解篇章,另一个是能够理解交互的会话本身。 基于会话式问答,讲者引入一个例子简单说明(图1)。

比如,用户简单描述了自己的情况(Scenario),但用户的问题并不能直接从文章(Rule Text)中获取,往往这个文章可能是一个比较通用的、相当于是一个法规或者法律的篇章。 比如,说明能够申请7a贷款的人,需要具备什么样的条件,但针对用户问题在文章中没有直接的答案,必须和用户进行一个交互,才能得到明确的回答。例子中,成功申请贷款的条件有三个,所以还需再问另外的条件。 比如,能不能够在别的地方获取它的资金来源,假如用户说no的话,这时候就可以给他一个答案,也就是说你可以申请。 因此,在这种情形下,就需要既能够读懂这篇文章,理解文章中的规则,也要能够主动地和用户交互,从用户那边获取一些需要知道的信息,最终再给他一个决策。

图1 定义该项任务常用的数据集是ShARC (shaping answers with rules through conversation 的简称),数据集的设定是:给定Rule Text;用户描述自己的Scenario(Background);用户提出question;已有的问答(Dialog History)。 整个过程可以概述为,由于用户给定的background往往不明确,机器需要进行几轮交互,然后从交互中获取一些跟规则有关的信息,然后告诉用户具体答案。 整个任务有两个子任务: 任务一,整合Rule Text,Scenario,Question以及通过几轮交互从用户获取的信息,作为模型输入,然后做出决策(Decision Making)。

该决策包含四种类型:一种是根据现有的信息能够作出yes or no 的决策;或者有些情况下,用户的问题可能与给定Rule Text无关,或根据Rule Text并不能解决问题,则会出现unanswerable的答案;另一种情况是Rule Text中需要满足很多条件,但有些条件机器不确定是否满足,需要作出inquire的决策,主动从用户那里获取更多信息,直至几轮交互后能够作出yes or no的决策。 任务二,如果生成的决策是inquire,则需要机器问一个follow-up question,该问题能根据Rule Text引导用户提供一些没有提供的信息,便于进一步的决策。

图2 2

会话式机器阅读理解的初探

2.1 模型介绍 负采样 针对于该任务,讲者主要介绍了两项工作,首先是发表于ACL2020的文章“Explicit Memory Tracker with Coarse-to-Fine Reasoning for Conversational Machine Reading”。 该工作的贡献有两个: a. 针对决策,提出了explicit tracker,即能够显示的追踪文章中条件是否被满足; b. 采用coarse-to-fine方法抽取Rule Text中没有被问到的规则、条件等。

图3 模型主要包括了四部分:1.Encoding→ 2.Explicit Memory Tracking→ 3.Decision Making→ 4.Question Generation,整体结构如下:

图4 (1) Encoding 将Rule Text中的句子分开,比如分为三个句子,在每个句子前加一个[CLS]表征句子特征,同时把queestion,scenario以及用户的会话历史加起来,也用[CLS]表征,拼接起全部特征后,通过BERT进行encoding。

图5 (2) Explicit Memory Tracking 该部分的目的在于挖掘出存在于Relu Text的句子中与用户提供的信息(比如initial question 和dialog history)之间的implication。 针对于此,提出了explict memory tracker,类似于recurrent的思想,逐步的把用户的信息和Relu Text中的规则进行交互,从而更新每一个规则的memory里对应的value,最终得到每一个条件满足,不满足或者不知道的一个状态。 经过n次更新完后,每一个rule 都会得到key-value对。

图6 (3)Decision Making 对n次更新完后的key-value做self-attention,经过一个线性层做四分类,即Yes, No, Irrelevant, Inquire。

图7 同时,还设计了一个subtask,即对最终更新完之后的key-value做一个预测,显示的预测该规则是Entailment,Prediction还是Unknown。该预测任务和Decision Making一起进行训练。

图8 (4)Question Generation 若得到的决策是Inquire,就要求继续做一个follow-up question的generation。 主要包括两个步骤: 第一步,从rule 中抽取一个span,具体是使用了一种coarse-to-fine 的做法,如下图所示。由于在Entailment prediction,句子的unknown分数越高,表示该句子越可能被问;若句子状态是Entailment或者Contradiction,说明该句子状态已知,没必要继续问下去。 因此,选择每一个句子在Entailment prediction中unknown的分数,并在每一个句子中计算抽取start和end的分数,然后将这两个分数相乘,综合判断哪一个span最有可能被问到。

图9 第二步,就是把span和rule 拼接起来,经过一个预训练模型将其rephrase一个question。

图10 2.2 实验验证 负采样 使用ShARC数据集进行实验验证,包含了两个任务的评价:分别为对于Decision Making任务采用 Marco-Accuracy 和Micro-Accuracy评价;以及对于问题生成采用BLEU Score评价。 此外,讲者考虑到在end-to-end evaluation时,存在一个缺点,也就是说,对于评价问题生成时,模型是基于决策这部分的水平去做问题生成的评价,这使得每个模型之间问题生成的表现不好比较,因此提出一个oracle question generation evaluation,即只要当Ground truth decision 是inquire,就对其问题生成的水平进行评价。 在测试集上得到的结果验证了所提出的Entailnment Memory Tracker(EMT)模型较其他模型效果有很大提升,尤其在问题生成方面效果显著。

表1 具体分析每一类决策的准确率,可验证Inquire的效果要更好,主要因为模型能显式的追踪模型的一些状态,而不是简单的学习模型中一些Pattern。 此外,在oracle question generation evaluation数据集上,与之前最好的模型E3,以及加上UniLM的模型进行对比,同样也证明了采用Coarse-to-Fine的方法抽取span,在问题生成方面具有更好的效果。

表2 同时,讲者给出了一个例子,更形象明白的说明了所提出的模型具备可解释性。

图11 3

如何更好地进行会话式机器阅读理解

3.1 问题提出负采样 进一步,讲者介绍了第二项工作,该工作与前者的侧重点有所不同,存在两个差异: 第一,document interpretation,主要由于第一项工作只是简单的对句子进行了一个切分,但实际上有些conditions(比如,上述例子中的American small business for profit business)是长句子中从句的条件,因此,第二项工作侧重如何去理解这样的条件。比如,能申请7(a)贷款,需要满足(①==True and ②==True and ③==True)的条件,这在第一项工作中是没有被建模的。

图12 第二,dialogs understanding,即对于会话并没有做特别显式的理解。比如,在会话第一轮发现rule之间是and的关系,并且在Scenairo中抽取出条件,说明第一个rule是true,但还要继续问第二个和第三个rule,所以给定Inquire的决策,直至满足所有的rule后,才能给一个“You can apply the loan”的回答。

3.2 模型介绍负采样 因此,该项工作主要基于这两点,提出先采用Discourse Segmentation的方法显式的把条件更好地抽取出来,之后做Entailment Reasoning 显式地预测每一个状态是否被满足,如果预测结果是Inquire,还需要做一个Follow-up Question Generation。

具体的,在discourse segmentation 中主要有两个目标:其一是明白Rule Text中的逻辑关系;其二是将句子中的条件更好地抽取出来。比如,对于一个rule采用Discourse Segmentation的方法将其抽取成三个elementary discourse unit (EDU),比如,下图中EDU1 ,EDU3是条件,然后EDU2是一个结果,这样的一个关系。

图15 如何实现Entailment Reasoning? 与工作一类似,在EDU抽取之后,将其与之前的用户Question,Scenairo 以及Dialog History拼接起来,经过预训练模型,得到每一个phrase的表征。然后采用多层transformer模型预测rule中每一个EDU 的状态,是Entailment、Contradiction,或者Neutral。 多层transformer模型较之前recurrent思想的模型更优秀,其不仅能在用户信息与rule之间做交互,也能更好的理解rule本身的逻辑结构(比如,conjunction,disconjunction等 )。 进一步,如何实现Decision Making? 在做决策时,根据学习到的Entailment、 Contradiction、Neutral向量,去映射前一步做Entailment Prediction的三个分数,得到每一个EDU的状态vector,同时拼接该状态vector与EDU本身的语义表示,作为Decision Classifier 输入,从而得到决策。

图163.3实验验证及结论负采样 同样地,实验也是在ShARC数据集上进行。实验结果表明,使用discourse segmentation加上更好的更显式的Reasoning的模式,较之前使用EMT模型具有更好的性能表现,在Micro Accuracy和Macro Accuracy上差不多高出4%。

表3 在Ablation Study中,首先对比了RoBERTa和BERT之间的区别,表明了RoBERTa对于Reasoning的任务具有一定的贡献;其次,说明了采用discourse segmentation划分一个句子为多个EDU形式的效果优于仅对句子进行划分的结果;然后,证明了采用Transformer显示地对用户信息和问题之间做交互是有必要的;最后,证明了拼接Entailment vector和EDU本身的语义表示,对最终决策具有相当大的贡献。

表4 进一步,分析了不同逻辑结构下模型的结果表现。这里粗略分成4种规则的逻辑结构,即Simple、Disjunction、Conjunction以及Other。结果表示,模型在Simple形式下具有最好效果,然而在Disjunction形式下效果较差。

图17 为什么模型对于Disjunction,做出的决策效果较差? 考虑到模型涉及两部分内容,一是dialogue understanding;二是对 scenario的理解。 因此,讲者进一步做了如下实验,就是把这两块内容分开,选择一个只用到dialogue understanding 的子集,再选择一个只用到scenario Interpretation的子集,进行实验。 结果表明,只用到dialogue understanding 的子集的模型效果要优于用到整个数据集的效果,但在scenario Interpretation的子集上,实验效果差了很多。 该现象的原因在于,用户自己的background (scenario)可能用到了很多reasoning的方式,与rule 不完全一样,因此对scenario的理解是比较差的。很多时候scenario里提到了关键信息但是模型并没有抽取成功,从而继续做出inquire的决策。这也可能是导致Disjunction决策效果较差的原因。

图18 4

总结

综上,讲者团队分别提出了Explicit Memory Tracker with Coarse-to-Fine Reasoning 以及Discourse aware Entailment Reasoning的方法,并且在ShARC数据集上效果很好,同时设计实验分析了数据集本身的难点以及模型的缺陷,为后续研究指明可拓展方向。

责任编辑:xj

原文标题:香港中文大学高一帆博士:会话式机器阅读理解

文章出处:【微信公众号:通信信号处理研究所】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 阅读
    +关注

    关注

    0

    文章

    10

    浏览量

    11693
  • 机器学习
    +关注

    关注

    67

    文章

    8573

    浏览量

    137548

原文标题:香港中文大学高一帆博士:会话式机器阅读理解

文章出处:【微信号:tyutcsplab,微信公众号:智能感知与物联网技术研究所】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    元太科技与联发科技深化合作 生成AI SoC整合彩色电子纸技术升级阅读体验 锁定彩色教育与阅读市场

    全球电子纸领导厂商元太科技与IC设计大厂联发科技宣布,双方将深化合作,透过整合联发科技全球首款专为生成AI电子阅读器打造的系统单芯片(SoC)与内建硬件时序控制芯片(Hardware TCON
    的头像 发表于 05-30 11:03 287次阅读

    智能机器人从0到1系统入门课程 带源码课件 百度网盘下载

    历着从“指令”向“对话”的转变。 未来的机器人将具备更强的抗噪能力和语义理解能力。通过集成先进的语音识别引擎,机器人能够在高噪环境下准确
    发表于 04-11 16:41

    探索MAX8621Y/MAX8621Z:便携设备的高效电源管理解决方案

    探索MAX8621Y/MAX8621Z:便携设备的高效电源管理解决方案 在当今的电子设备中,电源管理是一个至关重要的环节。对于便携设备而言,更是需要高效、紧凑且功能强大的电源管理解
    的头像 发表于 03-17 11:20 480次阅读

    【「Altium Designer 25 电路设计精进实践」阅读体验】总体感受

    较好的理解相应的内容和掌握相关的技能。文中的实例是ASMV71方针开发板作为主控单元,具有丰富的外设和接口,能够作为评估开发板来使用,是较为真实的案例,有助于学习和实践。 为了更好的阅读该书,我将按照书中的内容完成相应的设计和实践操作。 今天是完成软件安装和界面的熟悉。
    发表于 02-22 18:06

    破解RDMA网络“黑盒”:轻量化会话追踪工具

    在RDMA网络运维面临“黑盒”挑战的背景下,星融元推出的RST工具通过无侵入捕获CM报文,实现RDMA会话的可视化追踪与全网路径还原。该工具基于RFT与RPT双模块,支持从设备流表到全局拓扑的多维观测,大幅降低运维定位成本,推动高性能网络运维走向透明化与智能化。
    的头像 发表于 02-13 14:30 679次阅读
    破解RDMA网络“黑盒”:轻量化<b class='flag-5'>会话</b>追踪工具

    MAX14663:便携医疗设备的理想电源管理解决方案

    的电源管理芯片——MAX14663。 文件下载: MAX14663.pdf 一、概述 MAX14663是一款集成度极高的电源管理解决方案,适用于便携医疗设备,如高端血糖仪等。它将电池充电器、电量计、电压保护与转换以及电缆检测与
    的头像 发表于 02-05 16:35 699次阅读

    【「龙芯之光 自主可控处理器设计解析」阅读体验】--全书概览与概述

    感谢论坛与出版社提供此书以及作者编著此书。下面是书籍实物,不是很厚但很通俗易懂、简明概要。 首先对全书章节进行概览,然后对第一章概述进行阅读学习。 全书分6章,在架构、工具链、案例方面进行了介绍
    发表于 01-18 12:58

    【「龙芯之光 自主可控处理器设计解析」阅读体验】+可测试性设计章节阅读与自己的一些感想

    作为嵌入底层开发,对第四章可测试性的内容比较感兴趣,因为嵌入底层开发如何测试是一个很重要的内容,一些芯片的可测试性设计做得很好,就更方便调试与查找问题有开发。 所以就来阅读下本章,分享下书中内容
    发表于 01-15 23:30

    《AI机器人控制进阶教程(入门版)》阅读指引

    一、为何要学习“AI+机器人”?在开始动手实验前,理解“AI”与“机器人”结合的价值至关重要。这不仅是技术的融合,更是开启智能体(Agent)未来的钥匙。1.从自动化到智能化传统机器
    的头像 发表于 01-07 10:56 2598次阅读
    《AI<b class='flag-5'>机器</b>人控制进阶教程(入门版)》<b class='flag-5'>阅读</b>指引

    为什么选远景达嵌入二维码阅读器?扫码识别快、准、稳,口碑之选

    在物流分拣、零售收银、工厂仓储等高频扫码场景中,嵌入二维码阅读器的性能直接影响工作效率与服务质量。远景达嵌入二维码阅读器凭借“快、准、稳”的核心优势,成为众多企业的优选设备,而嵌入
    的头像 发表于 12-09 16:32 793次阅读
    为什么选远景达嵌入<b class='flag-5'>式</b>二维码<b class='flag-5'>阅读</b>器?扫码识别快、准、稳,口碑之选

    【「高速数字设计(基础篇)」阅读体验】+初步上手阅读

    初步拿到书,阅读了第一章。感受就是非常讲的基础,非常适合小白学习。刚好我就是,虽然大学里也学过数电,但是也有一段时间了,突然让我将一下D触发器,一定是脑袋空空的说出什么来的,但是稍微讲一下,就可以
    发表于 10-21 20:50

    如何理解6 DOF ?

    6DOF是6DegreesofFreedom的缩写,中文翻译为六自由度。这是一个在机器人、航空航天、虚拟现实(VR)、增强现实(AR)和3D建模等领域非常核心的概念。它描述的是一个刚体在三
    的头像 发表于 09-17 12:04 2956次阅读
    如何<b class='flag-5'>理解</b>6 DOF ?

    手持身份证识别阅读器:移动的身份识别智能终端

    鸟鸟N70S手持居民身份证阅读器是一种专为移动办公与身份核验而设计的终端设备,集身份证识别、OCR、二维码扫描、人脸识别等功能于一体。广泛应用于公安执法、金融开户、医疗登记、展会安保等场景,支持全天候移动工作,真正实现身份验证的高效与安全。
    的头像 发表于 08-20 14:34 1959次阅读
    手持<b class='flag-5'>式</b>身份证识别<b class='flag-5'>阅读</b>器:移动的身份识别智能终端

    【「Yocto项目实战教程:高效定制嵌入Linux系统」阅读体验】+基础概念学习理解

    。为了对珠峰更了解些,开始接触 Linux 系统开发,并逐渐认识到 Yocto 项目在定制嵌入 Linux 系统方面的重要性。所以很想拜读下此书。 二、书籍内容概述 基础知识 书中首先回顾了 Linux
    发表于 08-04 22:29

    【「Yocto项目实战教程:高效定制嵌入Linux系统」阅读体验】01初读体验

    书可以比较系统的讲解了yocto的逻知识点,便尝试申请看这本书。幸运的是,最终获得了看此书的机会。 首先,上图: 阅读过程 按照惯例,拿到书后,第一步是阅读推荐序和自序,从推荐序中可以获得他人读这本
    发表于 06-30 21:49