论文中指出,以往关于ED的工作都是考虑如何提升模型的性能,而较少考虑模型的鲁棒性和泛化能力,作者将模型的鲁棒性和泛化能力定义为如下三条,并通过设计模型进行研究:
抗攻击性能:当训练数据中被加入扰动,会如何影响模型性能;
新类型的预测:模型能否预测出训练集中未见过的事件类型;
事件类型的模糊性: 根据统计,70%的事件触发词能够触发不同类型的事件,如何正确识别出这些模糊性触发词在各自上下文中所触发的具体事件类型。
基于以上问题,作者提出一种新的学习方式,主要包括一下两部分:
Contextselective discriminative learning: 根据句子内部的不同words的重要性得到trigger的上下文表示,目标是基于trigger的上下文表示预测句子中被mask的trigger的事件类型。
Contextualized similarity learning:基于"相同类型的事件触发词应当具有相似上下文"的假设,以mask-contraining的句子对为输入,如何输入中的两个句子表达的是同一事件类型,则训练目标是使他们的masked triggers具有语义相近的上下文表示。
作者分别将本文的模型与以往的SOTA模型进行了对比实验,证明了本文模型能较好地应对对抗攻击、未知类型预测和事件模糊性区分的问题。
原文标题:【每日一读】EMNLP2020:如何提高事件检测(ED)模型的鲁棒性和泛化能力?
文章出处:【微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。
责任编辑:haq
-
模型
+关注
关注
1文章
3648浏览量
51694 -
深度学习
+关注
关注
73文章
5590浏览量
123890
原文标题:【每日一读】EMNLP2020:如何提高事件检测(ED)模型的鲁棒性和泛化能力?
文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
构建CNN网络模型并优化的一般化建议
海康威视大模型精准检测守护高速安全
具备光照鲁棒和自适应特征剔除的VSLAM前端框架
明晚开播 |数据智能系列讲座第7期:面向高泛化能力的视觉感知系统空间建模与微调学习
直播预约 |数据智能系列讲座第7期:面向高泛化能力的视觉感知系统空间建模与微调学习
直流电机控制方法的Matlab仿真研究
高通展示AI模型在不同物理环境下的鲁棒性
VirtualLab Fusion应用:光栅的鲁棒性分析与优化
【「基于大模型的RAG应用开发与优化」阅读体验】+大模型微调技术解读
自动驾驶中常提的鲁棒性是个啥?
【「具身智能机器人系统」阅读体验】2.具身智能机器人大模型
【「大模型启示录」阅读体验】营销领域大模型的应用
AI模型部署边缘设备的奇妙之旅:目标检测模型
用于任意排列多相机的通用视觉里程计系统

如何提高事件检测(ED)模型的鲁棒性和泛化能力?
评论