0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

论辩挖掘在不同领域下的应用

深度学习自然语言处理 来源:复旦DISC 作者:李寅子 2022-03-30 16:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

引言

论辩研究和推理是一个涉及到逻辑、语言、计算机等多学科领域的过程,在人工智能兴起的时代,计算论辩试图将人类对于论辩领域的知识和人工智能结合起来,用计算机深度模型来挖掘论辩语义、论辩结构等方面,达到自动推理的效果。论辩挖掘是计算论辩中的一个重要任务,它的主要任务有单篇式论辩挖掘,包括提论点分类、论点评估等;交互式论辩挖掘,包括论点对抽取等。此次的三篇论文将阐述论辩挖掘在司法领域、论辩领域、同行评议领域等的证据链支持、反驳证据评估、论点对抽取等方面应用。

文章概览

1.Argumentation-Driven Evidence Association in Criminal Cases

刑事案件中的证据关联是将一组司法证据划分为若干不重叠的子集,提高定罪的可解释性和合法性。可以观察到,分成同一子集的证据通常支持同一主张。在证据关联步骤中,此篇文章提出了一种基于论证驱动(argumentation-driven)的监督学习方法来计算证据对之间的联系。在实际数据集上的实验结果证明了该方法的有效性。

2. Knowledge-Enhanced Evidence Retrieval for Counterargument Generation

找到对陈述的反证是许多任务的关键。此篇文章建立了一个系统,给出一个陈述,从Web上不同的来源检索反证据。该系统的核心是一个自然语言推理(natural language inference, NLI)模型,它可以判断一个候选句子是否为有效反证。作者提出了一个知识增强的NLI模型,旨在通过整合知识图来处理基于因果关系和实例的推理。在实际数据集上的实验结果证明了该方法的有效性。

3. Argument Pair Extraction with Mutual Guidance and Inter-sentence Relation Graph

此篇文章通过一个相互引导的框架来处理论点对抽取(APE)任务,利用一个段落中一个论点的信息来指导识别另一个段落中可以与之配对的论点。此外,此篇文章还提出了一个句间关系图来有效地模拟两个句子之间的相互关系,从而有利于论点对的提取。实验结果表明,我们的方法明显优于目前SOTA的模型。

论文细节

1

31e12e0c-afe7-11ec-aa7f-dac502259ad0.png

动机

司法证据的作用是用来支持有利于定罪的诉讼请求,证据描述是刑事判决书的重要组成部分。然而,在不同的法律文件中,证据的组织是不同的。证据关联的形式主要有收集式(collection)和论证驱动式(argumentation-driven)。

31fca178-afe7-11ec-aa7f-dac502259ad0.png

在目前大多数的刑事裁判文书中,证据只是以集合的形式罗列出来,没有明确的主张,这被认为是集合的形式。但仅在5%左右的刑事判决文书中,依据相关主张将证据收集分为几个子集,被认为是论证驱动的形式。

由此,此篇文章提出了一项刑事案件中的证据关联任务,通过有监督的方法学习距离度量,无需额外的人工标注即可进行后续证据的聚类。

任务定义

给定证据集合,此篇文章将证据分为不重叠的个子集。

模型

(1)聚合方法

每一种情况下的聚类数量是不同的,所以不能像K-Means方法那样设置一个特定的聚类数量。作者通过层次聚类来聚类证据(Day and Edelsbrunner, 1984),它可以学习停止阈值,该阈值决定何时停止合并两个聚类。

(2)距离度量

本文提出了三种距离度量的概念,分别是Latent Distance、Explicit Distance和Ensemble Distance。

Latent Distance是证据之间的距离。在不给出明确主张的情况下,只能利用证据对的信息来计算它们之间的距离。支持同一主张的证据对之间的距离被标记为0,支持不同主张的证据对之间的距离被标记为1。

Explicit Distance是证据与主张之间的距离。证据和相应的主张之间有很强的相关性,例如,交通事故责任证明可以支持交通事故的责任划分。证据与相应主张的相关性分值为1,证据与其他主张的相关性分值为0。

Latent Distance仅利用证据之间的语义信息来计算相似度。Explicit Distance仅利用证据与主张之间的推理关系来计算证据之间的距离。Ensemble Distance将这两种方法融合在一起,同时利用证据之间的语义信息和证据与主张之间的推理信息,定义为这两个距离的加权和。

数据集及实验

作者以China Judgements Online中已发表的法律文件构建了一个数据集,选择如下图所示证据描述为论证驱动形式的法律文件进行实验。

321a08f8-afe7-11ec-aa7f-dac502259ad0.png

作者主要采用ESIM和BERT进行有监督学习的距离预测,结果如下表所示。

32355220-afe7-11ec-aa7f-dac502259ad0.png

表中的结果显示,有监督方法的性能较好。同时,BERT模型优于ESIM模型。可能的原因是,支持同一观点的证据对有共现趋势,这可以在BERT模型的下一个句子预测(next sentence prediction)任务中学习到。

Latent distance算法利用了证据对之间的语义信息,其性能优于explicit distance。基于ensemble distance的聚类结果由于整合了证据对之间和证据主张之间的关系,比单一距离的聚类结果有很大的提高。

3250a840-afe7-11ec-aa7f-dac502259ad0.png

如上图所示,claim1和claim2分别代表受害人的出生日期和死亡日期。受害者的户籍证明和死亡证明都能部分支持受害者的身份信息,但由于在使用Latent distance时只考虑证据对之间的关系,误将它们聚在一起。Claim4和claim5是相似的,它们都是对交通事故现场的描述,但由于在使用explicit distance时几乎没有考虑证据对之间的语义关系,将被告人王某的供述和证人董某的证言误聚在一起。从而将证据对之间的语义关系与证据主张之间的信息相结合,通过ensemble distance得到的聚类结果是正确的。

2

326bb46e-afe7-11ec-aa7f-dac502259ad0.png

动机

先前的研究大多集中于对长论点的主要结论提出反驳。虽然这样的反驳是有用的,但辩论式的对话通常是互动的,例如,在Change-MyView (CMV)中,挑战者经常引用特定的陈述来进行反驳。因此,本文的目标是为论点中的特定陈述找到反证,而不是为一个完整的论点生成一个反证。

任务定义

自然语言推理(natural language inference, NLI)模型是本文的核心,给定一个要反驳的陈述,系统对相关文档进行检索和排序,然后得到一组反证候选句。对于每个候选句,NLI模型决定它和陈述的关系是否包含、矛盾,或两者都不是。

模型

在本篇文章中,作者提出了知识增强NLI模型(KENLI),如下图所示。

3280ee42-afe7-11ec-aa7f-dac502259ad0.png

KENLI(图左)是基于RoBERTa-base ,以一对前提P和假设H为输入,计算其关系是蕴含、矛盾还是中性的概率。为了连接P和H之间的实体,知识增强(Knowledge Enhancement, KE)网被插入到某两层之间,将RoBERTa分为Encoder1和Encoder2。最后的预测是基于【CLS】进行的。

KE Net(图中)利用了知识图谱(knowledge graph, KG),其中节点是实体,边是实体之间的有向关系。KG目标是让信息通过KG在P和H的实体之间流动。KE Net是由一堆KE单元组成,每个KE单元使用两个transformer TR1和TR2处理KG上的单跳推理。TR1根据相邻实体更新每个实体embedding,TR2根据实体embedding更新词项embedding。本篇文章中使用了两个知识图谱CauseNet和Wikidata。

数据集及实验

此篇文章的数据主要来自公开的NLI数据集:MNLI (Williams et al., 2018)、ANLI (Nie et al., 2020b)、SNLI (Bowman et al., 2015)和FEVER-NLI (Nie et al., 2019)。实验的结果如下表所示,显示了每个模型5次实验的平均F1得分。

32a33cae-afe7-11ec-aa7f-dac502259ad0.png

表中可以看出KENLI(6-9行)基本上优于Baseline模型(1-5行)。这表明KENLI有效地整合了知识,有利于预测陈述之间的关系。

最后作者建立了反证检索系统,是在DeSePtion (Hidey et al., 2020)的基础上建立的。如下图所示。

32c2ae22-afe7-11ec-aa7f-dac502259ad0.png

给定一个要验证的陈述语句,检索相关文档并对其进行排序,对候选证据句进行排序,并预测该语句是被支持、被反驳还是都不支持。作者通过提出的知识增强NLI模型来强化了最后一个阶段。

3

32ddfc18-afe7-11ec-aa7f-dac502259ad0.png

动机

论点对抽取(Argument pair extraction, APE)的目的是从讨论的两段中抽取出交互式的论证对。

32f88ede-afe7-11ec-aa7f-dac502259ad0.png

以往的研究将该任务应用在同行评议中,但是缺乏论点对之间的论点级别交互的显式建模。此篇文章通过一个相互引导的框架来处理APE任务,利用一个段落中一个论点的信息来指导识别另一个段落中可以与之配对的论点。此外,此篇文章还提出了一个句间关系图来有效地模拟两个句子之间的相互关系,从而有利于论点对的提取。实验结果表明,我们的方法明显优于目前SOTA的模型。

模型

此篇文章提出了一个具有句间关系图的APE相互引导框架MGF,如下图所示。

3325aaa4-afe7-11ec-aa7f-dac502259ad0.png

(1)Inter-sentence Relation Graph

该图将review和rebuttal中的每一个句子作为节点,从两个角度进行构建。

In-passage Edge:根据句子(同一个段落中)在review/rebuttal段落中的相对位置,构建句子之间的边。两个in-passage句子之间边的权重的定义为:

Cross-passage Edge:基于两句之间的共现词,构建跨段落的句子边缘。两个in-passage句子之间边的权重的定义为:

(2)Mutual Guidance Framework

相互引导框架(mutual Guided Framework, MGF)首先使用BERT对句子进行编码,然后通过图卷积得到面向关系的句子表示法后,使用两个相互引导的标记器提取论点对。

数据集及实验

此篇文章使用Cheng等人(2020)提出的Review-Rebuttal (RR)数据集进行实验,该数据集包含从openreview.net收集的4,764篇ICLR的review/rebuttal文本对。Baseline是Cheng等人(2020)提出的PL-H-LSTM-CRF和MT-H-LSTM-CRF 。实验的结果如下表。

334e342e-afe7-11ec-aa7f-dac502259ad0.png

从表中可以看出,作者提出的模型MGF在数据集上取得了最好的性能。在不使用BERT微调的情况下,Non-FT-MGF的性能仍然优于MT-H-LSTM-CRF,这表明MDF实现的性能增益不仅仅是由于BERT微调。通过对MGF和Non-FT-MGF的比较,可以发现BERT微调可以进一步改善模型结果。

参考文献

[1] Yefei Teng and WenHan Chao. 2021.Argumentation-Driven Evidence Association in Criminal Cases. InFindings of the Association for Computational Linguistics: EMNLP 2021, pages 2997–3001, Punta Cana, Dominican Republic. Association for Computational Linguistics.

[2] Yohan Jo, Haneul Yoo, JinYeong Bak, Alice Oh, Chris Reed, and Eduard Hovy. 2021.Knowledge-Enhanced Evidence Retrieval for Counterargument Generation. InFindings of the Association for Computational Linguistics: EMNLP 2021, pages 3074–3094, Punta Cana, Dominican Republic. Association for Computational Linguistics.

[3] Jianzhu Bao, Bin Liang, Jingyi Sun, Yice Zhang, Min Yang, and Ruifeng Xu. 2021.Argument Pair Extraction with Mutual Guidance and Inter-sentence Relation Graph. InProceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, pages 3923–3934, Online and Punta Cana, Dominican Republic. Association for Computational Linguistics.

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1813

    文章

    49756

    浏览量

    261668
  • 模型
    +关注

    关注

    1

    文章

    3649

    浏览量

    51719
  • 数据集
    +关注

    关注

    4

    文章

    1231

    浏览量

    26050

原文标题:EMNLP 2021 | 论辩挖掘在不同领域下的应用

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    探索RISC-V机器人领域的潜力

    探索RISC-V机器人领域的潜力 测评人:洄溯 测评时间: 2025年11月 测评对象: MUSE Pi Pro开发板(基于进迭时空K1系列高性能RISC-V CPU) 一、 开篇引言
    发表于 12-03 14:40

    Lora技术应用领域

    :Lora技术工业控制领域也有着广泛的应用。通过Lora技术,可以实现设备之间的远程监控和控制,提高工业生产的效率和安全性。 3. 环境监测:Lora技术的低功耗和长距离传输特性使其环境监测
    发表于 11-26 08:10

    IMU P/N 616-4042卡特彼勒装载机与挖掘机中的精准运动控制与可靠性实践

    IMU P/N 616-4042通过PWM输出和工业级接插件设计,为卡特彼勒装载机、挖掘机提供精准的姿态监测。其可部署于动臂、斗杆等关键部位,实时反馈设备运动状态,有效提升作业精度与安全性。该产品具备良好的环境适应性和抗干扰能力,复杂工况
    的头像 发表于 11-07 09:25 171次阅读
    IMU P/N 616-4042<b class='flag-5'>在</b>卡特彼勒装载机与<b class='flag-5'>挖掘</b>机中的精准运动控制与可靠性实践

    IMU P/N 596-7347卡特彼勒挖掘机、装载机与物料操作机中的精准运动监测应用解析

    IMU P/N 596-7347通过实时监测工程机械的姿态与运动数据,为设备精准控制和安全运行提供关键支持。其挖掘机、装载机等复杂工况展现的测量稳定性与环境适应性,有效提升了作业效率与设备可靠性,符合现代施工对智能化的需求。
    的头像 发表于 11-05 09:50 192次阅读
    IMU P/N 596-7347<b class='flag-5'>在</b>卡特彼勒<b class='flag-5'>挖掘</b>机、装载机与物料操作机中的精准运动监测应用解析

    奥松电子协办第二届智能计算与数据挖掘国际学术会议

    2025年10月24日至26日,第二届智能计算与数据挖掘国际学术会议(ICDM 2025)中国广州隆重举行。本次会议由广州航海学院、汕头大学、广东省数智科技研究会联合主办,广州奥松电子股份有限公司作为协办单位之一,携手多家产业机构,共同推动智能计算与数据
    的头像 发表于 11-03 14:18 411次阅读

    IMU P/N312-0755卡特彼勒挖掘机上的应用实践

    直川科技通过持续优化IMU传感器的环境适应性与数据可靠性,为卡特彼勒挖掘机提供了兼顾精度与稳健性的姿态感知方案。其P/N312-0755产品多个大型项目中的实践表明,基于工业标准设计的IMU已成为重型机械智能升级的关键组件。
    的头像 发表于 10-11 11:04 350次阅读
    IMU P/N312-0755<b class='flag-5'>在</b>卡特彼勒<b class='flag-5'>挖掘</b>机上的应用实践

    环氧树脂领域的应用

    环氧树脂的卓越特性与应用领域环氧树脂凭借其卓越的物理机械性能、电绝缘性能以及与多种材料的出色粘接性能,众多领域展现出独特优势。其使用工艺的灵活性更是使其国民经济的各个
    的头像 发表于 09-11 14:43 562次阅读
    环氧树脂<b class='flag-5'>在</b>各<b class='flag-5'>领域</b>的应用

    2025年中国RFID产业未挖掘市场深度研究报告

    当前,其部分关键领域仍处于“低渗透、高潜力”阶段,尚未形成产业化规模。本文旨在梳理这些尚未被充分挖掘的市场,分析其技术可行性、市场空间与发展障碍,并提出针对性建议,助力产业突破式成长。
    的头像 发表于 09-01 14:08 475次阅读

    用树莓派挖掘5种顶级加密货币!

    加密货币是用于在线交易的数字货币。挖掘这些货币通常需要专门的硬件,如ASIC矿机或高性能GPU。然而,有些加密货币仍可用树莓派来挖掘本文中,我将为您介绍可在树莓派上挖掘的最佳加密货
    的头像 发表于 07-21 16:34 943次阅读
    用树莓派<b class='flag-5'>挖掘</b>5种顶级加密货币!

    热重分析仪能源领域中的应用

    热重分析仪是通过准确测量物质受控温度程序的质量变化,为能源领域提供关键的数据支持。通过对能源材料的测量,从而评估其材料的稳定性反应机理解析、燃烧特性分析等。热重分析仪能源
    的头像 发表于 03-27 15:21 573次阅读
    热重分析仪<b class='flag-5'>在</b>能源<b class='flag-5'>领域</b>中的应用

    三一挖掘机一键启动开关易坏的原因及更换注意事项

    三一挖掘机一键启动开关易坏的原因虽然三一挖掘机的一键启动系统设计旨在提高便利性和安全性,但在实际使用中,可能会出现一些问题导致开关易坏。这些问题可能包括:频繁使用:挖掘施工过程中频
    发表于 03-12 09:29

    通信领域适配:SMA 接头不同频段的应用与频率范围

    SMA接头通信领域的各个频段都发挥着重要的作用,从低频到高频都有着不可替代的应用。随着通信技术的飞速发展,对信号传输的要求也越来越高,这对SMA接头更高频率和更复杂环境的性能提出
    的头像 发表于 02-07 08:43 1205次阅读
    通信<b class='flag-5'>领域</b>适配:SMA 接头<b class='flag-5'>在</b>不同频段的应用与频率范围

    AI主导科技领域的蓬勃发展与变革

    24 位行业领袖的深度访谈,为我们揭示了 2025 年极具影响力的科技趋势,展现出 AI 主导科技领域的蓬勃发展与变革。 一、AI 驱动的科技变革核心地位 AI 和生成式 AI 是贯穿报告中诸多科技趋势的核心驱动力。从企业运营到科技创新,从能源
    的头像 发表于 01-23 13:58 1094次阅读

    多线示波器的原理和应用领域

    多线示波器是一种电子测量仪器,其原理和应用领域可以归纳如下:一、原理多线示波器普通示波器原理的基础上,采用了双线(或多线)示波法。这种方法使得示波器能够同时显示多个波形。其基本原理是,示波器利用
    发表于 01-07 15:34

    risc-v芯片在电机领域的应用展望

    RISC-V作为一种开源的指令集架构,近年来芯片设计领域崭露头角,并逐渐电机控制领域展现出其独特优势。随着电机技术的不断进步和应用需求的多样化,RISC-V芯片有望为电机控制带来更
    发表于 12-28 17:20