0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

论辩挖掘在不同领域下的应用

深度学习自然语言处理 来源:复旦DISC 作者:李寅子 2022-03-30 16:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

引言

论辩研究和推理是一个涉及到逻辑、语言、计算机等多学科领域的过程,在人工智能兴起的时代,计算论辩试图将人类对于论辩领域的知识和人工智能结合起来,用计算机深度模型来挖掘论辩语义、论辩结构等方面,达到自动推理的效果。论辩挖掘是计算论辩中的一个重要任务,它的主要任务有单篇式论辩挖掘,包括提论点分类、论点评估等;交互式论辩挖掘,包括论点对抽取等。此次的三篇论文将阐述论辩挖掘在司法领域、论辩领域、同行评议领域等的证据链支持、反驳证据评估、论点对抽取等方面应用。

文章概览

1.Argumentation-Driven Evidence Association in Criminal Cases

刑事案件中的证据关联是将一组司法证据划分为若干不重叠的子集,提高定罪的可解释性和合法性。可以观察到,分成同一子集的证据通常支持同一主张。在证据关联步骤中,此篇文章提出了一种基于论证驱动(argumentation-driven)的监督学习方法来计算证据对之间的联系。在实际数据集上的实验结果证明了该方法的有效性。

2. Knowledge-Enhanced Evidence Retrieval for Counterargument Generation

找到对陈述的反证是许多任务的关键。此篇文章建立了一个系统,给出一个陈述,从Web上不同的来源检索反证据。该系统的核心是一个自然语言推理(natural language inference, NLI)模型,它可以判断一个候选句子是否为有效反证。作者提出了一个知识增强的NLI模型,旨在通过整合知识图来处理基于因果关系和实例的推理。在实际数据集上的实验结果证明了该方法的有效性。

3. Argument Pair Extraction with Mutual Guidance and Inter-sentence Relation Graph

此篇文章通过一个相互引导的框架来处理论点对抽取(APE)任务,利用一个段落中一个论点的信息来指导识别另一个段落中可以与之配对的论点。此外,此篇文章还提出了一个句间关系图来有效地模拟两个句子之间的相互关系,从而有利于论点对的提取。实验结果表明,我们的方法明显优于目前SOTA的模型。

论文细节

1

31e12e0c-afe7-11ec-aa7f-dac502259ad0.png

动机

司法证据的作用是用来支持有利于定罪的诉讼请求,证据描述是刑事判决书的重要组成部分。然而,在不同的法律文件中,证据的组织是不同的。证据关联的形式主要有收集式(collection)和论证驱动式(argumentation-driven)。

31fca178-afe7-11ec-aa7f-dac502259ad0.png

在目前大多数的刑事裁判文书中,证据只是以集合的形式罗列出来,没有明确的主张,这被认为是集合的形式。但仅在5%左右的刑事判决文书中,依据相关主张将证据收集分为几个子集,被认为是论证驱动的形式。

由此,此篇文章提出了一项刑事案件中的证据关联任务,通过有监督的方法学习距离度量,无需额外的人工标注即可进行后续证据的聚类。

任务定义

给定证据集合,此篇文章将证据分为不重叠的个子集。

模型

(1)聚合方法

每一种情况下的聚类数量是不同的,所以不能像K-Means方法那样设置一个特定的聚类数量。作者通过层次聚类来聚类证据(Day and Edelsbrunner, 1984),它可以学习停止阈值,该阈值决定何时停止合并两个聚类。

(2)距离度量

本文提出了三种距离度量的概念,分别是Latent Distance、Explicit Distance和Ensemble Distance。

Latent Distance是证据之间的距离。在不给出明确主张的情况下,只能利用证据对的信息来计算它们之间的距离。支持同一主张的证据对之间的距离被标记为0,支持不同主张的证据对之间的距离被标记为1。

Explicit Distance是证据与主张之间的距离。证据和相应的主张之间有很强的相关性,例如,交通事故责任证明可以支持交通事故的责任划分。证据与相应主张的相关性分值为1,证据与其他主张的相关性分值为0。

Latent Distance仅利用证据之间的语义信息来计算相似度。Explicit Distance仅利用证据与主张之间的推理关系来计算证据之间的距离。Ensemble Distance将这两种方法融合在一起,同时利用证据之间的语义信息和证据与主张之间的推理信息,定义为这两个距离的加权和。

数据集及实验

作者以China Judgements Online中已发表的法律文件构建了一个数据集,选择如下图所示证据描述为论证驱动形式的法律文件进行实验。

321a08f8-afe7-11ec-aa7f-dac502259ad0.png

作者主要采用ESIM和BERT进行有监督学习的距离预测,结果如下表所示。

32355220-afe7-11ec-aa7f-dac502259ad0.png

表中的结果显示,有监督方法的性能较好。同时,BERT模型优于ESIM模型。可能的原因是,支持同一观点的证据对有共现趋势,这可以在BERT模型的下一个句子预测(next sentence prediction)任务中学习到。

Latent distance算法利用了证据对之间的语义信息,其性能优于explicit distance。基于ensemble distance的聚类结果由于整合了证据对之间和证据主张之间的关系,比单一距离的聚类结果有很大的提高。

3250a840-afe7-11ec-aa7f-dac502259ad0.png

如上图所示,claim1和claim2分别代表受害人的出生日期和死亡日期。受害者的户籍证明和死亡证明都能部分支持受害者的身份信息,但由于在使用Latent distance时只考虑证据对之间的关系,误将它们聚在一起。Claim4和claim5是相似的,它们都是对交通事故现场的描述,但由于在使用explicit distance时几乎没有考虑证据对之间的语义关系,将被告人王某的供述和证人董某的证言误聚在一起。从而将证据对之间的语义关系与证据主张之间的信息相结合,通过ensemble distance得到的聚类结果是正确的。

2

326bb46e-afe7-11ec-aa7f-dac502259ad0.png

动机

先前的研究大多集中于对长论点的主要结论提出反驳。虽然这样的反驳是有用的,但辩论式的对话通常是互动的,例如,在Change-MyView (CMV)中,挑战者经常引用特定的陈述来进行反驳。因此,本文的目标是为论点中的特定陈述找到反证,而不是为一个完整的论点生成一个反证。

任务定义

自然语言推理(natural language inference, NLI)模型是本文的核心,给定一个要反驳的陈述,系统对相关文档进行检索和排序,然后得到一组反证候选句。对于每个候选句,NLI模型决定它和陈述的关系是否包含、矛盾,或两者都不是。

模型

在本篇文章中,作者提出了知识增强NLI模型(KENLI),如下图所示。

3280ee42-afe7-11ec-aa7f-dac502259ad0.png

KENLI(图左)是基于RoBERTa-base ,以一对前提P和假设H为输入,计算其关系是蕴含、矛盾还是中性的概率。为了连接P和H之间的实体,知识增强(Knowledge Enhancement, KE)网被插入到某两层之间,将RoBERTa分为Encoder1和Encoder2。最后的预测是基于【CLS】进行的。

KE Net(图中)利用了知识图谱(knowledge graph, KG),其中节点是实体,边是实体之间的有向关系。KG目标是让信息通过KG在P和H的实体之间流动。KE Net是由一堆KE单元组成,每个KE单元使用两个transformer TR1和TR2处理KG上的单跳推理。TR1根据相邻实体更新每个实体embedding,TR2根据实体embedding更新词项embedding。本篇文章中使用了两个知识图谱CauseNet和Wikidata。

数据集及实验

此篇文章的数据主要来自公开的NLI数据集:MNLI (Williams et al., 2018)、ANLI (Nie et al., 2020b)、SNLI (Bowman et al., 2015)和FEVER-NLI (Nie et al., 2019)。实验的结果如下表所示,显示了每个模型5次实验的平均F1得分。

32a33cae-afe7-11ec-aa7f-dac502259ad0.png

表中可以看出KENLI(6-9行)基本上优于Baseline模型(1-5行)。这表明KENLI有效地整合了知识,有利于预测陈述之间的关系。

最后作者建立了反证检索系统,是在DeSePtion (Hidey et al., 2020)的基础上建立的。如下图所示。

32c2ae22-afe7-11ec-aa7f-dac502259ad0.png

给定一个要验证的陈述语句,检索相关文档并对其进行排序,对候选证据句进行排序,并预测该语句是被支持、被反驳还是都不支持。作者通过提出的知识增强NLI模型来强化了最后一个阶段。

3

32ddfc18-afe7-11ec-aa7f-dac502259ad0.png

动机

论点对抽取(Argument pair extraction, APE)的目的是从讨论的两段中抽取出交互式的论证对。

32f88ede-afe7-11ec-aa7f-dac502259ad0.png

以往的研究将该任务应用在同行评议中,但是缺乏论点对之间的论点级别交互的显式建模。此篇文章通过一个相互引导的框架来处理APE任务,利用一个段落中一个论点的信息来指导识别另一个段落中可以与之配对的论点。此外,此篇文章还提出了一个句间关系图来有效地模拟两个句子之间的相互关系,从而有利于论点对的提取。实验结果表明,我们的方法明显优于目前SOTA的模型。

模型

此篇文章提出了一个具有句间关系图的APE相互引导框架MGF,如下图所示。

3325aaa4-afe7-11ec-aa7f-dac502259ad0.png

(1)Inter-sentence Relation Graph

该图将review和rebuttal中的每一个句子作为节点,从两个角度进行构建。

In-passage Edge:根据句子(同一个段落中)在review/rebuttal段落中的相对位置,构建句子之间的边。两个in-passage句子之间边的权重的定义为:

Cross-passage Edge:基于两句之间的共现词,构建跨段落的句子边缘。两个in-passage句子之间边的权重的定义为:

(2)Mutual Guidance Framework

相互引导框架(mutual Guided Framework, MGF)首先使用BERT对句子进行编码,然后通过图卷积得到面向关系的句子表示法后,使用两个相互引导的标记器提取论点对。

数据集及实验

此篇文章使用Cheng等人(2020)提出的Review-Rebuttal (RR)数据集进行实验,该数据集包含从openreview.net收集的4,764篇ICLR的review/rebuttal文本对。Baseline是Cheng等人(2020)提出的PL-H-LSTM-CRF和MT-H-LSTM-CRF 。实验的结果如下表。

334e342e-afe7-11ec-aa7f-dac502259ad0.png

从表中可以看出,作者提出的模型MGF在数据集上取得了最好的性能。在不使用BERT微调的情况下,Non-FT-MGF的性能仍然优于MT-H-LSTM-CRF,这表明MDF实现的性能增益不仅仅是由于BERT微调。通过对MGF和Non-FT-MGF的比较,可以发现BERT微调可以进一步改善模型结果。

参考文献

[1] Yefei Teng and WenHan Chao. 2021.Argumentation-Driven Evidence Association in Criminal Cases. InFindings of the Association for Computational Linguistics: EMNLP 2021, pages 2997–3001, Punta Cana, Dominican Republic. Association for Computational Linguistics.

[2] Yohan Jo, Haneul Yoo, JinYeong Bak, Alice Oh, Chris Reed, and Eduard Hovy. 2021.Knowledge-Enhanced Evidence Retrieval for Counterargument Generation. InFindings of the Association for Computational Linguistics: EMNLP 2021, pages 3074–3094, Punta Cana, Dominican Republic. Association for Computational Linguistics.

[3] Jianzhu Bao, Bin Liang, Jingyi Sun, Yice Zhang, Min Yang, and Ruifeng Xu. 2021.Argument Pair Extraction with Mutual Guidance and Inter-sentence Relation Graph. InProceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, pages 3923–3934, Online and Punta Cana, Dominican Republic. Association for Computational Linguistics.

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1820

    文章

    50324

    浏览量

    266937
  • 模型
    +关注

    关注

    1

    文章

    3818

    浏览量

    52268
  • 数据集
    +关注

    关注

    4

    文章

    1240

    浏览量

    26261

原文标题:EMNLP 2021 | 论辩挖掘在不同领域下的应用

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    生成式AI赋能工程师挖掘非结构化数据价值

    您是否知道,生成式 AI(GenAI)可以帮助工程师几秒钟内诊断汽车故障,甚至设备出现问题之前预测潜在失效?GenAI 正在通过加速数据分析和算法开发,让这些场景从设想走向现实,使工程师能够充分发挥专业知识,挖掘可执行的洞察
    的头像 发表于 02-28 10:24 608次阅读

    探索RISC-V机器人领域的潜力

    探索RISC-V机器人领域的潜力 测评人:洄溯 测评时间: 2025年11月 测评对象: MUSE Pi Pro开发板(基于进迭时空K1系列高性能RISC-V CPU) 一、 开篇引言
    发表于 12-03 14:40

    Lora技术应用领域

    :Lora技术工业控制领域也有着广泛的应用。通过Lora技术,可以实现设备之间的远程监控和控制,提高工业生产的效率和安全性。 3. 环境监测:Lora技术的低功耗和长距离传输特性使其环境监测
    发表于 11-26 08:10

    IMU P/N 616-4042卡特彼勒装载机与挖掘机中的精准运动控制与可靠性实践

    IMU P/N 616-4042通过PWM输出和工业级接插件设计,为卡特彼勒装载机、挖掘机提供精准的姿态监测。其可部署于动臂、斗杆等关键部位,实时反馈设备运动状态,有效提升作业精度与安全性。该产品具备良好的环境适应性和抗干扰能力,复杂工况
    的头像 发表于 11-07 09:25 534次阅读
    IMU P/N 616-4042<b class='flag-5'>在</b>卡特彼勒装载机与<b class='flag-5'>挖掘</b>机中的精准运动控制与可靠性实践

    IMU P/N 596-7347卡特彼勒挖掘机、装载机与物料操作机中的精准运动监测应用解析

    IMU P/N 596-7347通过实时监测工程机械的姿态与运动数据,为设备精准控制和安全运行提供关键支持。其挖掘机、装载机等复杂工况展现的测量稳定性与环境适应性,有效提升了作业效率与设备可靠性,符合现代施工对智能化的需求。
    的头像 发表于 11-05 09:50 476次阅读
    IMU P/N 596-7347<b class='flag-5'>在</b>卡特彼勒<b class='flag-5'>挖掘</b>机、装载机与物料操作机中的精准运动监测应用解析

    奥松电子协办第二届智能计算与数据挖掘国际学术会议

    2025年10月24日至26日,第二届智能计算与数据挖掘国际学术会议(ICDM 2025)中国广州隆重举行。本次会议由广州航海学院、汕头大学、广东省数智科技研究会联合主办,广州奥松电子股份有限公司作为协办单位之一,携手多家产业机构,共同推动智能计算与数据
    的头像 发表于 11-03 14:18 745次阅读

    IMU P/N 470-4959卡特彼勒挖掘机和平地机坡度控制中的应用

    IMU P/N 470-4959通过6轴惯性测量数据,为卡特彼勒挖掘机和平地机提供高精度坡度控制。该传感器具备抗振动、宽温域工作特性,可实时监测设备姿态,自动调整铲斗轨迹与刮刀横坡,有效提升边坡修整与精平作业的精度与效率,保障复杂工况的施工质量。
    的头像 发表于 10-28 10:44 377次阅读
    IMU P/N 470-4959<b class='flag-5'>在</b>卡特彼勒<b class='flag-5'>挖掘</b>机和平地机坡度控制中的应用

    IMU P/N312-0755卡特彼勒挖掘机上的应用实践

    直川科技通过持续优化IMU传感器的环境适应性与数据可靠性,为卡特彼勒挖掘机提供了兼顾精度与稳健性的姿态感知方案。其P/N312-0755产品多个大型项目中的实践表明,基于工业标准设计的IMU已成为重型机械智能升级的关键组件。
    的头像 发表于 10-11 11:04 684次阅读
    IMU P/N312-0755<b class='flag-5'>在</b>卡特彼勒<b class='flag-5'>挖掘</b>机上的应用实践

    环氧树脂领域的应用

    环氧树脂的卓越特性与应用领域环氧树脂凭借其卓越的物理机械性能、电绝缘性能以及与多种材料的出色粘接性能,众多领域展现出独特优势。其使用工艺的灵活性更是使其国民经济的各个
    的头像 发表于 09-11 14:43 1640次阅读
    环氧树脂<b class='flag-5'>在</b>各<b class='flag-5'>领域</b>的应用

    2025年中国RFID产业未挖掘市场深度研究报告

    当前,其部分关键领域仍处于“低渗透、高潜力”阶段,尚未形成产业化规模。本文旨在梳理这些尚未被充分挖掘的市场,分析其技术可行性、市场空间与发展障碍,并提出针对性建议,助力产业突破式成长。
    的头像 发表于 09-01 14:08 733次阅读

    无线数传模块助力挖掘机工厂实现高效无线通信系统

    应用背景​ 山东某挖掘机机械有限公司的核心产品涵盖装载机、挖掘机、道路机械及核心关键零部件等系列工程机械。为加速新旧动能转换,企业引入全新挖掘机整机装配线,并配合劳动组合调整,不仅显著提升了装配水平
    的头像 发表于 08-27 15:12 627次阅读
    无线数传模块助力<b class='flag-5'>挖掘</b>机工厂实现高效无线通信系统

    宽带采集存储回放系统卫星领域的应用

    以其强大的功能特点被应用于卫星轨测试与验证、空间态势感知、卫星侦听、深空探测任务等场景中。复杂电磁环境与高动态场景,卫星系统对射频信号的采集精度、实时处理效率、存储可靠性等提出了严苛要求。本文将针对卫
    的头像 发表于 08-26 17:53 1428次阅读
    宽带采集存储回放系统<b class='flag-5'>在</b>卫星<b class='flag-5'>领域</b>的应用

    用树莓派挖掘5种顶级加密货币!

    加密货币是用于在线交易的数字货币。挖掘这些货币通常需要专门的硬件,如ASIC矿机或高性能GPU。然而,有些加密货币仍可用树莓派来挖掘本文中,我将为您介绍可在树莓派上挖掘的最佳加密货
    的头像 发表于 07-21 16:34 1806次阅读
    用树莓派<b class='flag-5'>挖掘</b>5种顶级加密货币!

    中科曙光与中科星图太空计算领域达成合作

    伴随空天信息产业的高速发展,太空计算正成为战略新兴技术高地。在此背景,近日,中科曙光与中科星图合肥“2025空天信息大会”上,签署了《太空计算领域的合作开发框架协议》。按协议,双方将围绕技术研发、太空算网建设等课题,共同推动
    的头像 发表于 07-11 10:56 1379次阅读

    超声波换能器:原理与多领域应用解析

    这一关键技术,更能为其更多领域的创新应用提供思路和方向。 二、超声波换能器的工作原理 (一)压电效应的基础 超声波换能器的工作原理主要基于压电效应。某些晶体材料,如压电陶瓷,具备独特的压电特性。当对这些
    发表于 06-28 15:09