知识桥接的因果交互网络（KBCIN）-电子发烧友网

1. 动机介绍

对话中的情感分析已经成为自然语言处理（Natural Language Processing, NLP）界的一个新兴话题。大多数现有的工作主要集中在对话情绪识别上（Emotion Recognition in Conversations, ERC），其目的是预测对话中每个话语的情绪标签[1,2,3]。然而，情感推理任务，如识别对话中情绪背后的原因，还没有被充分研究。最近，Poria等人[4]认为，在对话中识别情绪原因（RECCON）有利于提高情绪分析模型的可解释性和性能。同时，它在一些领域有潜在的应用，如情绪支持系统[5]和共情对话系统[6]。因此，Poria等人[4]引入了一个名为RECCON的新任务，该任务有一个标注情绪原因的数据集。它包括两个不同的子任务：原因跨度抽取（Causal Span Extraction, CSE）和情绪原因蕴含（Causal Emotion Entailment, CEE）。在本文中，我们重点关注CEE子任务，其目标是预测对话历史中哪些特定的语句会引发目标语句中的非中性情绪。

在CEE任务中，有两个主要的挑战。首先，为了捕捉对话者之间相互交织的情感动态变化，有必要通过有效的语境模型来理解语境中的深层语义关联。其次，要准确地将候选语句推理到目标情感上可能很困难，因为因果线索并不总是在语境中明确提及，而是应该通过基于推理来暗示，这就导致了候选语句和目标语句之间存在推理空缺。然而，Poria等人[4]简单地将CEE表述为一个语句对分类问题，这是缺乏足够的对话语境模型和有效的情感原因推理的。因此，为了应对这样的两个挑战，我们将常识性知识（Commonsense Knowledge, CSK）[7]引入CEE。

图1: 数据集RECCON-DD示例

一方面，以事件为中心的CSK，对语句中提到的事件前后可能发生的事情进行揭示，可以被视为语义层面的桥梁（S-bridge），连接对话的发展，加强相关语句之间的语义依赖，从而深入理解对话的语境信息。如图1左侧所示，语句#7中PersonA想单独离开的事件发生在PersonA告诉PersonB离开的事件之后，这与语句#1和#5相关。

另一方面，根据Moors等人[8],人类的感觉和行动倾向是情绪的两个重要组成部分，并在很大程度上为目标情绪的产生提供了潜在的因果线索。为此，社会交互CSK被用作情绪层面的桥梁（E-bridge）和行动层面的桥梁（A-bridge），根据对话者的感觉和行动倾向所传达的因果线索，将候选语词与目标语词连接起来。在图1中，话语#4中PersonB的狡辩和批评使PersonA感到愤怒，这与目标语句#7所持有的情绪是一致的。此外，语句#5的内容暗示了PersonA的行动倾向是独处，它直接导致了她在目标语句#7中表达的内容。

在本文中，我们提出了知识桥接因果交互网络(Knowledge Bridged Causal Interaction Network, KBCIN)，以有效地进行语境建模和情绪原因推理。具体来说，我们将一个对话抽象为一个对话图，以建模对话中的语句间依赖关系。然后，我们引入了以事件为中心的CSKs，包括两种类型isAfter和isBefore，并设计了知识增强的图注意力模块（CSK-Enhanced Graph Attention），将CSKs作为S-bridge在图上进行消息传递。此外，为了填补候选语句和目标语句之间的推理空缺，我们利用社会交互CSKs，x(o)Want和x(o)React作为A-bridge和E-bridge。我们设计了情绪交互模块和行动交互模块，借助这两个bridge所传达的明确的因果线索，准确推理出目标情绪的原因。而上述三个模块构成了知识桥接的因果交互（KBCI）模块，它作为多个注意力头的并列，充分地建模了对话语句之间的相互依赖关系，并将目标情绪与候选语篇精确地联系起来。

为了评估所提出的模型的性能，我们在基准数据集[4]上进行了广泛的实验。我们与CEE、情绪原因抽取（ECE）和情感-原因对提取（ECPE）任务上的基线模型相比，取得了最先进的性能。

这项工作的主要贡献总结如下：

我们将常识性知识引入到因果情感实体化任务中，以填补候选语句和目标语句之间的推理空白。

我们提出了一个新的模型KBCIN，以常识性知识为桥梁，进行全面的对话语境建模和准确的情感原因推理。

在基准数据集上对比大多数强基线的实验结果证明了我们模型的优越性。

2. 模型方法

图3: 整体模型架构图

2.1 特征提取

语句级特征提取。Transformer encoder（Vaswani等人，2017）被作为语句encoder来提取语料级特征。具体来说，对于每条语句，一个特殊的标记[CLS]被拼接到语句的开头。然后，我们将该序列送入语句编码器，从最后一个隐藏层中得到的最大池化后的表示作为每条语句的语句级特征。

知识获取。在这项工作中，我们使用ATOMIC- 2020[7]作为我们的常识性知识（CSK）基础。它是一个常识知识图，涵盖日常推理知识的社会、物理和时间相关方面。

图2: 常识知识图事件中心CSK和社会交互CSK示例

为了充分理解对话中各语句之间的语义依赖关系，并填补候选语句与目标之间的推理空白，我们将CSK作为三座桥梁，分别命名为语义级桥梁（S-bridge）、情绪级桥梁（E-bridge）和动作级桥梁（A-bridge）。更具体地说，我们从ATOMIC-2020中探索了六种CSK，它们被归类为以事件为中心的CSK和社会交互CSK。图2中显示了CSK的例子。一方面，根据事件中心CSK isAfter和isBefore所体现的对话发展的脉络和因果关系，语句之间的深层语义依赖将由此来建立。因此，S-bridge的构建是为了对对话语境进行全面的了解。另一方面，另外两座桥，E-bridge和A-bridge是由社会交互CSK xReact, oReact, xWant和oWant构建的。而x(o)Want是对自身（他人）在事件发生后可能想做什么的描述，而x(o)React体现了自身（他人）在事件发生后的情绪感受。它们从人的感觉和行动倾向的角度出发，填补了候选语词和目标语词之间的推理空白。

为了生成给定语句的CSK表示，我们采用了生成性常识模型COMET[9]，该模型是在ATOMIC-2020上训练的。更具体地说，我们使用基于BART[10]的COMET变体。给出对话中的每个语句，形成输入格式，其中r是我们选择的CSK类型，COMET会在关系r下生成推理内容的描述，而COMET最后一层的隐状态表示被用作CSK代表。通过这种方式，对于每个语句，有六种CSK表示，用于对话语境建模和情绪原因推理。它们被表示为，分别是关系类型isAfter、isBefore、xReact、oReact、xWant和oWant的缩写。

2.2 并行的知识桥接因果互动

受多头注意力机制的启发[11]，我们提出了并行的知识桥接因果交互块，其目的是为了充分理解对话语境，准确推理出目标语气中的非中性情绪的原因。对于每个模块，它由三个部分组成：CSK增强的图形注意模块，情感互动模块和行为互动模块。

CSK-增强的图注意力模块。我们没有把CEE定义为一个没有明确的语境交互建模的语句对分类问题，而是把对话中的语句抽象为一个对话图，其中当前的语句只与对话历史中的过去的语句相联系。通过这种方式，我们确保语句的互动符合因果关系的性质，即原因只能从过去推理出来。每个节点的表示都是由相应的语句级特征初始化的。此外，我们计算目标语句和候选语句之间的相对距离，并利用相对位置信息来丰富语句的表示。由于每个语句的情绪标签被证明在CEE中起着重要作用[4]，我们也考虑到了这一点。因此，每个节点的最终表示是通过以下方式获得的：

基于原始图注意网络[12]，我们设计了CSK增强的图注意力来传播对话图上的信息，并利用以事件为中心的CSK作为S-bridge来测量语句间的语义依赖：

权重被用来衡量当前节点和其邻居之间的相关性。我们将以事件为中心的CSK 和融入进入这个过程：

与原始的计算语句表示之间的注意力分数的注意力函数不同[12]，我们利用以事件为中心的CSK 和作为S-bridge来衡量语句的依赖关系。

情绪交互模块。在S-bridge的帮助下对对话语境进行了全面的建模后，我们用两种社会交互 CSK、和或作为E-bridge来填补推理空白，并根据情绪因果线索来推理目标情绪。这个想法的灵感来自于这样一个理论：感受是人类情感中最重要的组成部分[8]。因此，目标语句与相应的情绪对那些能够产生与目标语句最相似的情绪或感觉的候选句来说更相关。此外，为了区分说话人内部的依赖性和说话人之间的依赖性，和分别作为说话人内部E-bridge和说话人之间E-bridge。情绪相似度得分可以通过以下方式获得：

其中都是线性变换。是目标语句的索引，是对话历史中的候选语句的索引。如果目标语句与候选语句是同一说话人，则，否则。然后我们利用情绪相似度得分来对候选语句的重要性进行加权，并用目标语句的表述来丰富它们：

行动交互模块。由于行动倾向是推理人类被引发的情绪的另一个重要组成部分，其他两类社会交互CSK 和作为A-bridge，使候选语词与目标语句产生关联，并暗示一致的行动倾向。此外，还形成了说话人内部A-bridge和说话人之间A-brige。行动相似性得分为：

行动交互后的权重表示为：

最后，在每个知识桥接的因果交互块结束时，为了综合推理过程中的结果，我们将对话表征、情绪表征和行动表征加在一起，每个语句的最终表示为：

2.3 因果语句预测

在这里，将每个并行的KBCI头的因果表征连接起来作为输入，我们利用一个因果语句预测器来决定候选是否是目标的原因：

3. 实验

3.1 数据集

表1: 经处理的RECCON-DD的统计数据

我们在基准数据集RECCON-DD上进行了实验。它是在数据集DailyDialog[13]的基础上，标注了情绪原因标签。我们只考虑对话历史中的原因，重复的因果对被删除。表1显示了经过处理的RECCON-DD的统计数据。

3.2 主实验结果及分析

表2: 主实验结果

如表2所示，我们提出的模型在REECON-DD数据集上取得了最好的结果。由于RoBERTa-Base/Large的结果和ECPE的方法是在与我们相同的数据集规模下实现的，我们直接参考了Poria等人[4]的结果，我们在相同的环境下重新实现了KEC和ECE任务下的方法。受益于通过S-bridge进行的有效对话语境建模和通过E-bridge和A-bridge进行的准确情绪原因推理，KBCIN取得了最先进的Pos. F1和macro F1分数，分别为68.59和79.12。

3.3 消融实验

表3: 消融实验结果

我们进行了消融实验，以验证我们模型中提出的不同模块的有效性。从表3的结果可以看出，三个bridge均对情绪原因的推理起到正向的增强作用。

3.4 情绪信息的影响

表4: 情绪信息影响分析

为了进一步研究对话历史中每条语句的情绪信息的影响，我们要么删除情绪信息，要么用情绪识别模型预测的标签替换真实情感标签。结果展示在表4中。我们之所以用预测的标签来测试KBCIN的性能，是因为在实际应用的情况下，情绪识别是情绪原因提取的前置过程，这意味着在实际应用中的情绪原因抽取系统中，对话历史中语句的这种真实情感标签可能无法获得。使用预测的情绪标签导致的结果下降，提醒我们要尝试在对话中联合进行情绪识别和情绪原因提取，这样可以在两个任务之间共享相关的情绪信息，缓解两阶段使用情绪信息带来的错误级联传播问题。

3.5 知识桥接块的数量

图4: 知识桥接块数量影响分析

由于KBCI是我们模型的创新和关键部分，用于有效的对话语境建模和准确的情绪原因推理，我们调整了不同数量的KBCI块来深入分析性能。结果显示在图4中。随着KBCI块的数量从1到5的增加，配有2个KBCI块的模型取得了最好的性能。

4. 结论

在本文中，我们提出了知识桥接的因果交互网络（KBCIN），用于情绪原因的推理。常识知识（CSK）被用作三个桥梁来进行有效的对话语境建模和准确的情绪原因推理。具体来说，我们将对话抽象为一个对话图，并利用以事件为中心的CSK作为语义层面的桥梁（S-bridge），通过CSK增强的图注意力模块在图上进行消息传递，来增强深层次的语义间的依赖性。而社会交互CSK作为情绪级桥梁（E-bridge）和行动级桥梁（A-bridge），从人的感觉和行动倾向的角度为情绪交互模块和行动交互模块提供显示的因果线索，填补了候选语句与目标语句之间的推理空白。基准数据集的实验结果证明了我们提出的KBCIN的有效性。

审核编辑：李倩

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉