0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于论辩图谱的互动论点对识别

深度学习自然语言处理 来源:复旦DISC 作者:复旦DISC 2021-06-15 16:28 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

引言

本文介绍了复旦大学数据智能与社会计算实验室(Fudan DISC)在Findings of ACL 2021上录用的一篇关于论辩挖掘的工作:Leveraging Argumentation Knowledge Graph for Interactive Argument Pair Identification,通过构建论辩领域的知识图谱并融合其中的相关知识,提升互动论点对识别任务的准确性。

互动论点对识别(Interactive Argument Pair Interaction)是对话式论辩挖掘研究领域中的一个核心任务。现有对于互动论点对识别的研究将其视为句子匹配问题,并且在很大程度上依赖于文本信息来计算文本相似性。然而,论点之间的互动通常会涉及论题的背景知识,并需要知识概念之间的推理,这超出了文本相似度层面的信息。

在本文中,我们提出利用外部知识来增强交互式论点对的识别。我们从在线论坛中不同主题的讨论语料中构建论辩知识图谱。在此基础上,被引用论点和回复论点之间的交互便可被表示为知识图谱中的推理路径。在实际中,我们利用图卷积网络 (GCN) 来学习知识图中的概念实体表示,并使用基于 Transformer 的编码器来学习推理路径的表示。

最后,采用信息对齐网络来捕获概念信息(实体级和路径级)和文本信息的交互。实验结果表明,我们的模型在基准数据集中达到了最先进的性能。进一步的实验分析证明了我们模型通过知识图谱中的概念路径来执行知识推理的合理性及有效性。

研究背景

论辩挖掘旨在分析论辩性文本中的语义和逻辑结构。目前论辩挖掘的研究方向大致可以分为单篇式论辩(Monological Argumentation)以及对话式论辩(Dialogical Argumentation)。

二者的主要区别在于,单篇式论辩的研究对象通常为单篇式的论辩场景,如学生议论文、公开演讲等一整篇论辩性文章或一段论辩文本,相关的任务包括论辩部件预测、说服力评估和论辩总结等;而对话式论辩的研究对象通常为辩论赛或者在线论坛场景下,由持有不同观点的多方参与者之间的互动所产生的文本,相关任务包含互动论点对识别、抽取等。

现有对于互动论点对识别的研究将其视为句子匹配问题,并且在很大程度上依赖于文本信息来计算文本相似性。虽然相关深度学习模型取得了一定的判别效果,但对于互动论点对中真正具有互动关系的概念实体的利用程度仍有不足,也就是说该任务需要超出文本相似度的知识信息。

两条现有模型无法正确识别的互动论点对示例。在第一个例子中,两句论点之间的联系由“president”和“Obama”以及“John Boehner”和“speaker of the house”所构建,这属于自然语言中常见的常识类知识;而在第二个例子中,两句论点之间的联系则需要通过“global warming”导致“sea level”提高来体现,这段推理过程中所出现的关系为论辩领域中所特有的因果联系。

因此,我们希望在互动论点对识别的任务中融入上述两类知识,来提升该任务上模型的效果,并提供更直接的可解释性。具体做法上,本文构建了论辩领域的知识图谱,并以图谱中推理路径的方式来融合相关知识。在模型层面,本文通过使用图卷积网络(GCN)编码相关实体,并使用Transformer编码器编码相关推理路径,再将这两个级别的概念编码与文本编码进行信息对齐,从而完成对于互动论点对识别任务的增强。

图谱构建

原始图谱构建

本文在Tan等人所构建的CMV文本数据集的基础上,采用OpenIE来抽取出其中的(实体、关系、实体)三元组,将所有的实体作为节点,所有的关系作为边,得到了原始的知识图谱。该阶段中加入的知识对应于研究背景中提到的第二类知识——因果联系。该阶段的图谱统计信息如下图所示。

概念对齐

为了进一步提升我们所构建的图谱质量,同时也为了加入研究背景中所提到的第一类常识知识,本文在得到上述原始图谱后,进行了概念对齐操作。对于两个知识图谱中的实体,如果它们在Wiikipedia中的搜索结果相同,则将它们之间加入”等价“的实体关系。概念对齐后的知识图谱相关统计信息如下图所示。结果显示概念对齐后,图谱的连通性明显增加,稀疏性的问题得到了一定程度上的解决。

方法描述

本文提出了将论辩图谱知识融入互动论点对识别任务的模型框架。该框架主要包含三个模块,文本编码器、概念编码器以及信息对齐网络。

论点对文本信息建模

给定一对候选引用-回复论点对,我们将其拼接后通入BERT句子对分类模型,取出其中的[CLS]符号的表示即可得到论点对的文本层面表示。

论点对概念信息建模

给定一对候选引用-回复论点对的上下文,我们抽取出其中所包含的概念实体,接下来从实体和路径两个层面进行概念信息建模。

2.1 实体级别

我们采用平均池化的BERT词向量得到每个节点的初始化表示,接着使用二层GCN网络来对每个节点信息进行汇总融合,从而得到了每个提及的实体的概念表示。

2.2 路径级别

在本文中,推理路径定义为论辩双方所提到的概念实体对之间在知识图谱中经过遍历而顺次连接得到的序列。在得到上述实体的表示后,我们从图谱中枚举出双方所有的概念实体对之间的最短路径,再经过Transformer编码器来对其进行编码表示,进而得到了每条推理路径的表示

信息对齐网络

得到基于每个实体以及每条路径的概念表示之后,我们构建了信息对齐网络来将不同的实体以及路径汇总得到概念层面的总表示。具体来说,我们利用文本信息表示来对所有的推理路径进行注意力池化汇总得到推理路径的总表示,在利用推理路径总表示来对所有的实体进行注意力池化汇总得到概念实体的总表示。

在得到以上文本和概念层面的总表示后,我们将这些维度的特征拼接并通过一个线性层,来预测当前候选论点对成为互动论点对的匹配分数,从而得到最终的判别结果。

实验

互动论点对识别性能

下表展示了在互动论点对识别数据集上的各模型性能。实验结果显示本文提出的模型在P@1和MRR指标上均优于已有模型,一方面体现在文本信息建模方面,预训练模型BERT的性能超过了之前最先进的DVAE模型;另一方面体现在上下文信息建模方面,通过融入论辩图谱对于论点概念的编码表示的组件超过了之前的层次化CNN上下文建模给模型所带来的提升。

消融实验

下表展示了本文所提模型的消融实验,从结果中可以发现三个主要模块中对模型性能影响最大的是文本信息编码;在概念编码中对于模型性能提升最明显的是路径编码器。

进一步分析

本文对于得到的知识图谱中推理路径进行了进一步探究,主要分为四个子实验:

(a)概念对连通性:实验显示对于存在互动关系的正确论点对以及不存在互动关系的负样本,双方概念中存在推理路径(即联通)的实体对分别占54%和41%,即连通性对于判断是否存在互动关系有一定判别作用;

(b)推理路径长度分布:实验显示在正确论点对中的推理路径平均长度会略低于负样本中的推理路径,即更长的推理路径倾向于出现在无关的论点对中;

(c)推理路径中的关系分布:我们通过统计出现在所有推理路径中的关系,并应用一些词典资源(如+/-EffectWordnet/Connotation Frames等)对关系进行分类,结果显示在所有推理路径中,常识知识的关系和因果知识的关系占比非常接近,各占了所有关系的40%左右;

(d)路径长度截断:本文通过对路径长度做限制,去掉超过限制长度的推理路径并重复实验,结果显示对于互动论点对识别的任务,当推理路径的长度限制设置在4的时候达到最好效果,经分析这可能是推理路径数量(路径长度越大路径数越多)和推理路径质量(路径长度越小越有可能为正样本中的路径)之间的权衡。

总结

本文提出了一个模拟人类辩论推理过程的模型框架。具体实践中,我们首先从在线辩论论坛ChangeMyView出发,利用OpenIE工具、词典资源和Wikipedia相关API进行概念对齐,构建了一个对话式辩论领域的知识图谱。

接着利用基于路径的图模型对辩论双方的概念对之间的推理路径进行编码,并将概念信息与预先训练好的语言模型BERT获得的语义信息进行对齐。在互动论点对识别任务上的实验表明该模型能够有效、透明地利用外部知识,进一步关于推理路径的实验也显示出基于我们构建的知识图谱所生成的推理路径具有较高的质量。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编码器
    +关注

    关注

    45

    文章

    3904

    浏览量

    141453
  • ACL
    ACL
    +关注

    关注

    0

    文章

    61

    浏览量

    12755

原文标题:基于论辩图谱的互动论点对识别

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    风机异响 “找不准”?声纹图谱分析,故障点精准定位

    风机异响找不准,本质是没读懂设备的 “求救信号”。声纹图谱分析就像给风机配了 “私人医生”,24 小时不间断监测,把隐性故障转化为明确数据,让每一次维修都精准高效。
    的头像 发表于 12-04 09:45 73次阅读
    风机异响 “找不准”?声纹<b class='flag-5'>图谱</b>分析,故障点精准定位

    光伏组件IV曲线测试仪:解锁光伏组件性能的“能量图谱仪”

    光伏组件IV曲线测试仪:解锁光伏组件性能的“能量图谱仪”柏峰【BF-CV1500】光伏组件的输出特性是决定电站发电效率的核心,而IV(电流-电压)曲线作为组件性能的“指纹图谱”,包含了短路电流、开路电压、最大功率点等关键参数
    的头像 发表于 10-15 10:49 345次阅读
    光伏组件IV曲线测试仪:解锁光伏组件性能的“能量<b class='flag-5'>图谱</b>仪”

    人脸方向识别算法

    人脸识别
    深蕾半导体
    发布于 :2025年07月22日 09:58:29

    中软国际入选中国信通院AI Agent智能体产业图谱1.0

    近日,中国信息通信研究院(以下简称“中国信通院”)《AI Agent智能体产业图谱1.0》正式发布。该图谱是国内系统性梳理智能体产业生态的重要成果,聚焦“基础底座、智能体平台、场景智能体与行业智能体
    的头像 发表于 07-14 14:55 1223次阅读

    基于LockAI视觉识别模块:手写数字识别

    手写数字识别是一种经典的模式识别和图像处理问题,旨在通过计算机自动识别用户手写的数字。本文将教会你如何使用基于RV1106的LockAI视觉识别模块进行手写数字
    的头像 发表于 06-30 15:44 859次阅读
    基于LockAI视觉<b class='flag-5'>识别</b>模块:手写数字<b class='flag-5'>识别</b>

    从传统到互动:树莓派如何重塑博物馆体验?

    RaspberryPi驱动的数字化装置让伦敦旗舰博物馆更具互动性和吸引力ClayInteractive互动重新设计了维多利亚与阿尔伯特童年博物馆(V&AMuseumofChildhood
    的头像 发表于 06-06 15:37 440次阅读
    从传统到<b class='flag-5'>互动</b>:树莓派如何重塑博物馆体验?

    松下娱乐互动(中国)公司正式成立

    近日,以“融合·无界未来”为主题的“松下娱乐互动(中国)公司成立仪式暨新品发布会”在上海隆重举行。松下集团宣布完成消费影像与专业视音频事业整合,正式成立松下娱乐互动(中国)公司(PEACCN
    的头像 发表于 05-16 16:07 696次阅读

    智慧教室互动平板:赋能未来教育的新利器

    在现代教育环境中,智慧教室设备的多样化不断推动着教学方式的变革。其中,智慧教室互动平板作为核心设备之一,正在改变传统课堂的教学模式,促进教师与学生之间的高效互动。本文将探讨智慧教室互动平板的主要功能及其在智慧教室
    的头像 发表于 05-09 11:43 766次阅读
    智慧教室<b class='flag-5'>互动</b>平板:赋能未来教育的新利器

    东软集团入选中国央国企数字化平台厂商图谱

    2025年4月,国际数据公司(IDC)发布《中国央国企数字化平台厂商图谱及领导者实践》(Doc#CHC52296525,2025年3月)报告,深度剖析央国企数字化转型趋势、市场竞争格局,梳理行业
    的头像 发表于 04-18 16:15 649次阅读

    HDJF-5A超声波局部放电检测仪使用时域信号波形与PRPD图谱

    一、PRPD与PRPS图谱的定义与核心差异‌PRPD图谱‌(PhaseResolvedPartialDischarge)全称为相位解析局部放电图谱,以‌工频相位‌(0°-360°)为横坐标、‌放电幅
    的头像 发表于 03-20 15:29 1664次阅读
    HDJF-5A超声波局部放电检测仪使用时域信号波形与PRPD<b class='flag-5'>图谱</b>

    AR互动与传统的交互方式相比更加丰富多元

    AR 互动的另一个显著特点,是其丰富多元的互动方式。与传统的交互方式相比,AR 互动不再局限于鼠标、键盘、触摸屏等有限的输入方式,而是通过多种先进的技术手段,实现了更加自然、丰富的人机交互 。
    的头像 发表于 03-10 17:48 864次阅读
    AR<b class='flag-5'>互动</b>与传统的交互方式相比更加丰富多元

    讯维高清互动教育录播系统:引领教育信息化新篇章!

    随着信息技术的不断进步和教育改革的深入推进,高清互动教育录播系统在教育领域的应用越来越广泛。通过高清互动录播系统,教师可以方便地录制和保存课堂教学视频,并且这些视频可以用于课堂评价或上传到校本资源库
    的头像 发表于 02-10 14:57 617次阅读

    摩根士丹利发布全球机器人百强图谱,3家国产传感器公司入榜

    在这些新兴产业的发展动力。     近日,国际知名投行摩根士丹利,发布了一份关于全球人形机器人产业的深度报告——《The Humanoid 100: Mapping the Humanoid Robot Value Chain》(人形机器人100:绘制人形机器人价值链图谱
    的头像 发表于 02-08 09:20 4886次阅读
    摩根士丹利发布全球机器人百强<b class='flag-5'>图谱</b>,3家国产传感器公司入榜

    维智科技入选2025年泰伯智库数字孪生城市产业链图谱

    近日,泰伯智库发布《数字孪生城市产业链图谱(2025)》,从基础设施层、技术平台层到集成应用层三大层面切入,勾画最新版数字孪生城市产业格局。
    的头像 发表于 01-17 11:28 989次阅读

    Tata Communications发布Kaleyra AI:重塑客户互动新体验

    全球通信技术巨头Tata Communications近日宣布,即将推出其革命性的人工智能驱动产品组合——Kaleyra AI,旨在为客户互动领域带来颠覆性的全新体验。 Kaleyra AI作为
    的头像 发表于 12-23 18:24 1031次阅读