0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

知识桥接的因果交互网络(KBCIN)

深度学习自然语言处理 来源:深度学习自然语言处理 2023-04-23 10:02 次阅读

1. 动机介绍

对话中的情感分析已经成为自然语言处理(Natural Language Processing, NLP)界的一个新兴话题。大多数现有的工作主要集中在对话情绪识别上(Emotion Recognition in Conversations, ERC),其目的是预测对话中每个话语的情绪标签[1,2,3]。然而,情感推理任务,如识别对话中情绪背后的原因,还没有被充分研究。最近,Poria等人[4]认为,在对话中识别情绪原因(RECCON)有利于提高情绪分析模型的可解释性和性能。同时,它在一些领域有潜在的应用,如情绪支持系统[5]和共情对话系统[6]。因此,Poria等人[4]引入了一个名为RECCON的新任务,该任务有一个标注情绪原因的数据集。它包括两个不同的子任务:原因跨度抽取(Causal Span Extraction, CSE)和情绪原因蕴含(Causal Emotion Entailment, CEE)。在本文中,我们重点关注CEE子任务,其目标是预测对话历史中哪些特定的语句会引发目标语句中的非中性情绪。

在CEE任务中,有两个主要的挑战。首先,为了捕捉对话者之间相互交织的情感动态变化,有必要通过有效的语境模型来理解语境中的深层语义关联。其次,要准确地将候选语句推理到目标情感上可能很困难,因为因果线索并不总是在语境中明确提及,而是应该通过基于推理来暗示,这就导致了候选语句和目标语句之间存在推理空缺。然而,Poria等人[4]简单地将CEE表述为一个语句对分类问题,这是缺乏足够的对话语境模型和有效的情感原因推理的。因此,为了应对这样的两个挑战,我们将常识性知识(Commonsense Knowledge, CSK)[7]引入CEE。

467edd2e-e041-11ed-bfe3-dac502259ad0.png

图1: 数据集RECCON-DD示例

一方面,以事件为中心的CSK,对语句中提到的事件前后可能发生的事情进行揭示,可以被视为语义层面的桥梁(S-bridge),连接对话的发展,加强相关语句之间的语义依赖,从而深入理解对话的语境信息。如图1左侧所示,语句#7中PersonA想单独离开的事件发生在PersonA告诉PersonB离开的事件之后,这与语句#1和#5相关。

另一方面,根据Moors等人[8],人类的感觉和行动倾向是情绪的两个重要组成部分,并在很大程度上为目标情绪的产生提供了潜在的因果线索。为此,社会交互CSK被用作情绪层面的桥梁(E-bridge)和行动层面的桥梁(A-bridge),根据对话者的感觉和行动倾向所传达的因果线索,将候选语词与目标语词连接起来。在图1中,话语#4中PersonB的狡辩和批评使PersonA感到愤怒,这与目标语句#7所持有的情绪是一致的。此外,语句#5的内容暗示了PersonA的行动倾向是独处,它直接导致了她在目标语句#7中表达的内容。

在本文中,我们提出了知识桥接因果交互网络(Knowledge Bridged Causal Interaction Network, KBCIN),以有效地进行语境建模和情绪原因推理。具体来说,我们将一个对话抽象为一个对话图,以建模对话中的语句间依赖关系。然后,我们引入了以事件为中心的CSKs,包括两种类型isAfter和isBefore,并设计了知识增强的图注意力模块(CSK-Enhanced Graph Attention),将CSKs作为S-bridge在图上进行消息传递。此外,为了填补候选语句和目标语句之间的推理空缺,我们利用社会交互CSKs,x(o)Want和x(o)React作为A-bridge和E-bridge。我们设计了情绪交互模块和行动交互模块,借助这两个bridge所传达的明确的因果线索,准确推理出目标情绪的原因。而上述三个模块构成了知识桥接的因果交互(KBCI)模块,它作为多个注意力头的并列,充分地建模了对话语句之间的相互依赖关系,并将目标情绪与候选语篇精确地联系起来。

为了评估所提出的模型的性能,我们在基准数据集[4]上进行了广泛的实验。我们与CEE、情绪原因抽取(ECE)和情感-原因对提取(ECPE)任务上的基线模型相比,取得了最先进的性能。

这项工作的主要贡献总结如下:

我们将常识性知识引入到因果情感实体化任务中,以填补候选语句和目标语句之间的推理空白。

我们提出了一个新的模型KBCIN,以常识性知识为桥梁,进行全面的对话语境建模和准确的情感原因推理。

在基准数据集上对比大多数强基线的实验结果证明了我们模型的优越性。

2. 模型方法

469478aa-e041-11ed-bfe3-dac502259ad0.png

图3: 整体模型架构图

2.1 特征提取

语句级特征提取。Transformer encoder(Vaswani等人,2017)被作为语句encoder来提取语料级特征。具体来说,对于每条语句,一个特殊的标记[CLS]被拼接到语句的开头。然后,我们将该序列送入语句编码器,从最后一个隐藏层中得到的最大池化后的表示作为每条语句的语句级特征。

46aca27c-e041-11ed-bfe3-dac502259ad0.png

知识获取。在这项工作中,我们使用ATOMIC- 2020[7]作为我们的常识性知识(CSK)基础。它是一个常识知识图,涵盖日常推理知识的社会、物理和时间相关方面。

46bce6a0-e041-11ed-bfe3-dac502259ad0.png

图2: 常识知识图事件中心CSK和社会交互CSK示例

为了充分理解对话中各语句之间的语义依赖关系,并填补候选语句与目标之间的推理空白,我们将CSK作为三座桥梁,分别命名为语义级桥梁(S-bridge)、情绪级桥梁(E-bridge)和动作级桥梁(A-bridge)。更具体地说,我们从ATOMIC-2020中探索了六种CSK,它们被归类为以事件为中心的CSK和社会交互CSK。图2中显示了CSK的例子。一方面,根据事件中心CSK isAfter和isBefore所体现的对话发展的脉络和因果关系,语句之间的深层语义依赖将由此来建立。因此,S-bridge的构建是为了对对话语境进行全面的了解。另一方面,另外两座桥,E-bridge和A-bridge是由社会交互CSK xReact, oReact, xWant和oWant构建的。而x(o)Want是对自身(他人)在事件发生后可能想做什么的描述,而x(o)React体现了自身(他人)在事件发生后的情绪感受。它们从人的感觉和行动倾向的角度出发,填补了候选语词和目标语词之间的推理空白。

为了生成给定语句的CSK表示,我们采用了生成性常识模型COMET[9],该模型是在ATOMIC-2020上训练的。更具体地说,我们使用基于BART[10]的COMET变体。给出对话中的每个语句,形成输入格式,其中r是我们选择的CSK类型,COMET会在关系r下生成推理内容的描述,而COMET最后一层的隐状态表示被用作CSK代表。通过这种方式,对于每个语句,有六种CSK表示,用于对话语境建模和情绪原因推理。它们被表示为,分别是关系类型isAfter、isBefore、xReact、oReact、xWant和oWant的缩写。

2.2 并行的知识桥接因果互动

受多头注意力机制的启发[11],我们提出了并行的知识桥接因果交互块,其目的是为了充分理解对话语境,准确推理出目标语气中的非中性情绪的原因。对于每个模块,它由三个部分组成:CSK增强的图形注意模块,情感互动模块和行为互动模块。

CSK-增强的图注意力模块。我们没有把CEE定义为一个没有明确的语境交互建模的语句对分类问题,而是把对话中的语句抽象为一个对话图,其中当前的语句只与对话历史中的过去的语句相联系。通过这种方式,我们确保语句的互动符合因果关系的性质,即原因只能从过去推理出来。每个节点的表示都是由相应的语句级特征初始化的。此外,我们计算目标语句和候选语句之间的相对距离,并利用相对位置信息来丰富语句的表示。由于每个语句的情绪标签被证明在CEE中起着重要作用[4],我们也考虑到了这一点。因此,每个节点的最终表示是通过以下方式获得的:

46d36f24-e041-11ed-bfe3-dac502259ad0.png

基于原始图注意网络[12],我们设计了CSK增强的图注意力来传播对话图上的信息,并利用以事件为中心的CSK作为S-bridge来测量语句间的语义依赖:

46e04046-e041-11ed-bfe3-dac502259ad0.png

权重被用来衡量当前节点和其邻居之间的相关性。我们将以事件为中心的CSK 和融入进入这个过程:

46f5a210-e041-11ed-bfe3-dac502259ad0.png

与原始的计算语句表示之间的注意力分数的注意力函数不同[12],我们利用以事件为中心的CSK 和作为S-bridge来衡量语句的依赖关系。

47099306-e041-11ed-bfe3-dac502259ad0.png

情绪交互模块。在S-bridge的帮助下对对话语境进行了全面的建模后,我们用两种社会交互 CSK、 和 或作为E-bridge来填补推理空白,并根据情绪因果线索来推理目标情绪。这个想法的灵感来自于这样一个理论:感受是人类情感中最重要的组成部分[8]。因此,目标语句与相应的情绪对那些能够产生与目标语句最相似的情绪或感觉的候选句来说更相关。此外,为了区分说话人内部的依赖性和说话人之间的依赖性,和分别作为说话人内部E-bridge和说话人之间E-bridge。情绪相似度得分可以通过以下方式获得:

4718ccfe-e041-11ed-bfe3-dac502259ad0.png

其中 都是线性变换。是目标语句的索引, 是对话历史中的候选语句的索引。如果目标语句 与候选语句 是同一说话人,则,否则 。然后我们利用情绪相似度得分 来对候选语句的重要性进行加权,并用目标语句的表述来丰富它们:

47340014-e041-11ed-bfe3-dac502259ad0.png

行动交互模块。由于行动倾向是推理人类被引发的情绪的另一个重要组成部分,其他两类社会交互CSK 和 作为A-bridge,使候选语词与目标语句产生关联,并暗示一致的行动倾向。此外,还形成了说话人内部A-bridge和说话人之间A-brige。行动相似性得分为:

474b4288-e041-11ed-bfe3-dac502259ad0.png

行动交互后的权重表示为:

475a22c6-e041-11ed-bfe3-dac502259ad0.png

最后,在每个知识桥接的因果交互块结束时,为了综合推理过程中的结果,我们将对话表征 、情绪表征 和行动表征 加在一起,每个语句的最终表示为:

476da152-e041-11ed-bfe3-dac502259ad0.png

2.3 因果语句预测

在这里,将每个并行的KBCI头的因果表征连接起来作为输入,我们利用一个因果语句预测器来决定候选 是否是目标 的原因:

477c27fe-e041-11ed-bfe3-dac502259ad0.png

3. 实验

3.1 数据集

478a69a4-e041-11ed-bfe3-dac502259ad0.png

表1: 经处理的RECCON-DD的统计数据

我们在基准数据集RECCON-DD上进行了实验。它是在数据集DailyDialog[13]的基础上,标注了情绪原因标签。我们只考虑对话历史中的原因,重复的因果对被删除。表1显示了经过处理的RECCON-DD的统计数据。

3.2 主实验结果及分析

47a11abe-e041-11ed-bfe3-dac502259ad0.png

表2: 主实验结果

如表2所示,我们提出的模型在REECON-DD数据集上取得了最好的结果。由于RoBERTa-Base/Large的结果和ECPE的方法是在与我们相同的数据集规模下实现的,我们直接参考了Poria等人[4]的结果,我们在相同的环境下重新实现了KEC和ECE任务下的方法。受益于通过S-bridge进行的有效对话语境建模和通过E-bridge和A-bridge进行的准确情绪原因推理,KBCIN取得了最先进的Pos. F1和macro F1分数,分别为68.59和79.12。

3.3 消融实验

47aea9d6-e041-11ed-bfe3-dac502259ad0.png

表3: 消融实验结果

我们进行了消融实验,以验证我们模型中提出的不同模块的有效性。从表3的结果可以看出,三个bridge均对情绪原因的推理起到正向的增强作用。

3.4 情绪信息的影响

47c00a5a-e041-11ed-bfe3-dac502259ad0.png

表4: 情绪信息影响分析

为了进一步研究对话历史中每条语句的情绪信息的影响,我们要么删除情绪信息,要么用情绪识别模型预测的标签替换真实情感标签。结果展示在表4中。我们之所以用预测的标签来测试KBCIN的性能,是因为在实际应用的情况下,情绪识别是情绪原因提取的前置过程,这意味着在实际应用中的情绪原因抽取系统中,对话历史中语句的这种真实情感标签可能无法获得。使用预测的情绪标签导致的结果下降,提醒我们要尝试在对话中联合进行情绪识别和情绪原因提取,这样可以在两个任务之间共享相关的情绪信息,缓解两阶段使用情绪信息带来的错误级联传播问题。

3.5 知识桥接块的数量

47cfaeec-e041-11ed-bfe3-dac502259ad0.png

图4: 知识桥接块数量影响分析

由于KBCI是我们模型的创新和关键部分,用于有效的对话语境建模和准确的情绪原因推理,我们调整了不同数量的KBCI块来深入分析性能。结果显示在图4中。随着KBCI块的数量从1到5的增加,配有2个KBCI块的模型取得了最好的性能。

4. 结论

在本文中,我们提出了知识桥接的因果交互网络(KBCIN),用于情绪原因的推理。常识知识(CSK)被用作三个桥梁来进行有效的对话语境建模和准确的情绪原因推理。具体来说,我们将对话抽象为一个对话图,并利用以事件为中心的CSK作为语义层面的桥梁(S-bridge),通过CSK增强的图注意力模块在图上进行消息传递,来增强深层次的语义间的依赖性。而社会交互CSK作为情绪级桥梁(E-bridge)和行动级桥梁(A-bridge),从人的感觉和行动倾向的角度为情绪交互模块和行动交互模块提供显示的因果线索,填补了候选语句与目标语句之间的推理空白。基准数据集的实验结果证明了我们提出的KBCIN的有效性。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据集
    +关注

    关注

    4

    文章

    1179

    浏览量

    24360
  • 自然语言处理

    关注

    1

    文章

    509

    浏览量

    13105
  • nlp
    nlp
    +关注

    关注

    1

    文章

    464

    浏览量

    21830

原文标题:参考文献

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NX2206建模—曲线与简化曲线使用方法#电路原理

    建模
    电子学习
    发布于 :2022年12月03日 13:42:08

    Linux网络和VM网络经验

    Vmware有三种网络模式:1、 :如果网络中能够提供多个IP地址的时候使用模式(我在实
    发表于 07-20 23:11

    关于模式遇到的问题

    VMware使用模式,已经手动设置ip地址和主机ip同一网段,但是ifconfig显示的ip地址却和vmnet8(NAT)同一网段?怎么解决?
    发表于 10-16 15:06

    UART至Wi-Fi设计

    TIDA-00375板连接在一起。还提供了双向通信。现有系统硬件节点之间的UART通信看似在两个UART之间有一条电缆连接。 图1:一个现有Wi-Fi网络上的无线 虽然在参考设计中记录了这个方法
    发表于 08-06 04:45

    设置了网络模式为但连不通怎么回事

    设置了网络模式为 就是连不通
    发表于 05-04 05:55

    EMC设计中的介绍及作用

    在过去的几十年的硬件设计里,这个词对国人来说非常陌生,特别是我们50HZ、60HZ系统。何谓?维基百科中的解释是关于通讯网络协议的。
    发表于 02-20 07:00

    RW007该怎么配置才能实现功能或者lwip的bridge正确使用方法呢

    为了实现以太网到wifi的透传,想采用方式,wifi模块采用了rw007,lwip的怎么都调试不成功,调试发现数据包的交互如下:上图
    发表于 10-13 10:21

    信号链中的""知识介绍

    R1 均非常近似。传感器几乎总是以这种方法来构建。请注意,关系仍为非线性。图 3 绘制的传统方法 图 3 所示的电路与图…
    发表于 11-23 07:40

    使用因果图设计测试用例

    利用因果图导出测试用例需要经过般步骤1.分析规格介绍说明描述中哪些是原因哪些是结果2.分析规格介绍说明描述中语义内容并将其表示成连接各个原因和各个结果因果图3
    发表于 09-03 10:01 24次下载

    典型因果推断CCI算法在无线网络性能中应用优化

    现有的无线网络性能优化方法主要基于指标间的相关关系分析,无法有效指导网络优化等干预行为。为此,提出典型因果推断(CCI)算法,并将其应用于无线网络性能优化。首先,针对无线
    发表于 12-13 11:19 0次下载
    典型<b class='flag-5'>因果</b>推断CCI算法在无线<b class='flag-5'>网络</b>性能中应用优化

    基于因果知识和时空关联的攻击场景重构技术

    片段,难以发现和识别多步攻击模式,无法还原攻击者完整的攻击渗透过程。针对这一问题,提出了基于因果知识和时空关联的攻击场景重构技术。首先,利用贝叶斯网络因果
    发表于 04-14 16:13 14次下载
    基于<b class='flag-5'>因果</b><b class='flag-5'>知识</b>和时空关联的攻击场景重构技术

    基于深度神经网络因果形式语音增强方法

    传统的基于深度神经网络(DNN)的语音增强方法由于采用非因果形式的输入,在处理过程中具有固定延时,不适用于实时性要求较高的场合。针对这一问题,从网络结构角度展开研究,通过实验对不同网络
    发表于 06-10 11:29 8次下载

    基于e-CARE的因果推理相关任务

    因果推理是人类的一项核心认知能力。借助因果推理能力,人类得以理解已观测到的各种现象,并预测将来可能发生的事件。然而,尽管当下的各类因果推理模型已经在现有的因果推理数据集上取得了令人印象
    的头像 发表于 05-16 16:21 1119次阅读

    基准数据集(CORR2CAUSE)如何测试大语言模型(LLM)的纯因果推理能力

      因果推理是人类智力的标志之一。因果关系NLP领域近年来引起了人们的极大兴趣,但其主要依赖于从常识知识中发现因果关系。本研究提出了一个基准数据集(CORR2CAUSE)来测试大语言模
    的头像 发表于 06-20 15:39 1311次阅读
    基准数据集(CORR2CAUSE)如何测试大语言模型(LLM)的纯<b class='flag-5'>因果</b>推理能力

    ChatGPT是一个好的因果推理器吗?

    因果推理能力对于许多自然语言处理(NLP)应用至关重要。最近的因果推理系统主要基于经过微调的预训练语言模型(PLMs),如BERT [1] 和RoBERTa [2]。
    的头像 发表于 01-03 09:55 491次阅读
    ChatGPT是一个好的<b class='flag-5'>因果</b>推理器吗?