0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何提高事件检测(ED)模型的鲁棒性和泛化能力?

深度学习自然语言处理 来源:深度学习的知识小屋 作者:深度学习的知识小 2020-12-31 10:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

论文中指出,以往关于ED的工作都是考虑如何提升模型的性能,而较少考虑模型的鲁棒性和泛化能力,作者将模型的鲁棒性和泛化能力定义为如下三条,并通过设计模型进行研究:

抗攻击性能:当训练数据中被加入扰动,会如何影响模型性能;

新类型的预测:模型能否预测出训练集中未见过的事件类型;

事件类型的模糊性: 根据统计,70%的事件触发词能够触发不同类型的事件,如何正确识别出这些模糊性触发词在各自上下文中所触发的具体事件类型。

基于以上问题,作者提出一种新的学习方式,主要包括一下两部分:

Contextselective discriminative learning: 根据句子内部的不同words的重要性得到trigger的上下文表示,目标是基于trigger的上下文表示预测句子中被mask的trigger的事件类型。

Contextualized similarity learning:基于"相同类型的事件触发词应当具有相似上下文"的假设,以mask-contraining的句子对为输入,如何输入中的两个句子表达的是同一事件类型,则训练目标是使他们的masked triggers具有语义相近的上下文表示。

作者分别将本文的模型与以往的SOTA模型进行了对比实验,证明了本文模型能较好地应对对抗攻击、未知类型预测和事件模糊性区分的问题。

原文标题:【每日一读】EMNLP2020:如何提高事件检测(ED)模型的鲁棒性和泛化能力?

文章出处:【微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3648

    浏览量

    51694
  • 深度学习
    +关注

    关注

    73

    文章

    5590

    浏览量

    123890

原文标题:【每日一读】EMNLP2020:如何提高事件检测(ED)模型的鲁棒性和泛化能力?

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    构建CNN网络模型并优化的一般建议

    :Dropout层随机跳过神经网络模型中某些神经元之间的连接,通过随机制造缺陷进行训练提升整个神经网络的。 6)指定合理的学习率策略:一旦神经网络的准确率饱和,那么学习率应当
    发表于 10-28 08:02

    海康威视大模型精准检测守护高速安全

    这一成绩的背后,是海康威视大模型事件检测服务器的科技助力。系统升级视觉大模型,针对抛洒物、行人、违停等事件的常见误检漏检进行优化,能够有效抑制背景误检,具备更强的
    的头像 发表于 08-21 11:16 1091次阅读

    具备光照和自适应特征剔除的VSLAM前端框架

    现有的基于特征的VSLAM系统依赖于固定的前端参数,这使得它们在面对光照突变时显得十分脆弱,且特征跟踪也不稳定。为应对这些挑战,我们提出了“IRAF-SLAM”,这是一种具备光照且能自适应特征筛选的前端设计,旨在提升VSL
    的头像 发表于 07-30 10:38 462次阅读
    具备光照<b class='flag-5'>鲁</b><b class='flag-5'>棒</b>和自适应特征剔除的VSLAM前端框架

    明晚开播 |数据智能系列讲座第7期:面向高能力的视觉感知系统空间建模与微调学习

    构建高效、物理一致且具备良好能力的视觉感知系统,是视觉智能、边缘计算与具身机器人中的关键挑战。为提升系统的与适应
    的头像 发表于 06-24 08:01 821次阅读
    明晚开播 |数据智能系列讲座第7期:面向高<b class='flag-5'>泛</b><b class='flag-5'>化</b><b class='flag-5'>能力</b>的视觉感知系统空间建模与微调学习

    AI技术加持,宏工科技锂电包装自动化装备新突破

    2024年11月。专利摘要显示,一种基于YOLOv8模型的包装袋袋口检测方法能够防止模型过度拟合训练集,提高整体的化性能和
    的头像 发表于 06-17 09:26 735次阅读
    AI技术加持,宏工科技锂电包装自动化装备新突破

    直播预约 |数据智能系列讲座第7期:面向高能力的视觉感知系统空间建模与微调学习

    鹭岛论坛数据智能系列讲座第7期「面向高能力的视觉感知系统空间建模与微调学习」6月25日(周三)20:00精彩开播期待与您云相聚,共襄学术盛宴!|直播信息报告题目面向高
    的头像 发表于 05-29 10:04 461次阅读
    直播预约 |数据智能系列讲座第7期:面向高<b class='flag-5'>泛</b><b class='flag-5'>化</b><b class='flag-5'>能力</b>的视觉感知系统空间建模与微调学习

    直流电机控制方法的Matlab仿真研究

    速度控制模型,以提高无刷直流电机速度控制系统的稳定性和抗干扰能力 。使用 Matlab/Simulink 工具箱建立无刷直流电机的仿真模型,研究结果表明,模糊自适应 PID 算法能够使
    发表于 03-27 12:15

    高通展示AI模型在不同物理环境下的

    高通技术公司和诺基亚贝尔实验室持续合作,展示了无线网络中可互操作的多厂商AI的价值。在2024年世界移动通信大会(MWC 2024)上,我们首次展示了AI增强信道状态反馈编码器和解码器模型的OTA互操作,该模型分别运行在搭载高
    的头像 发表于 02-27 15:59 1083次阅读
    高通展示AI<b class='flag-5'>模型</b>在不同物理环境下的<b class='flag-5'>鲁</b><b class='flag-5'>棒</b><b class='flag-5'>性</b>

    VirtualLab Fusion应用:光栅的分析与优化

    一个场景,在这个场景中,我们分析了二元光栅的偏振依赖,并对结构进行了优化,使其在任意偏振角入射光下均能表现良好。 倾斜光栅的优化 这个用例演示了一个具有稍微变化的填充因子的倾
    发表于 02-19 08:54

    【「基于大模型的RAG应用开发与优化」阅读体验】+大模型微调技术解读

    重复项或使用编辑距离算法比较文本相似度。数据标注:高质量的数据标注直接影响模型的性能。标注过程应遵循明确标注规则、选择合适的标注工具、进行多轮审核和质量控制等原则。数据增强:提高模型
    发表于 01-14 16:51

    自动驾驶中常提的是个啥?

    持稳定的运行能力,这是自动驾驶实现从技术验证到实际落地的关键要求。然而,这一概念对大多数人来说可能较为抽象,其在自动驾驶中的具体表现、技术实现与挑战却充满了值得探讨的内容。 什么
    的头像 发表于 01-02 16:32 8331次阅读
    自动驾驶中常提的<b class='flag-5'>鲁</b><b class='flag-5'>棒</b><b class='flag-5'>性</b>是个啥?

    【「具身智能机器人系统」阅读体验】2.具身智能机器人大模型

    ,能够利用\"思维链\"的技术将复杂任务分解为多个子任务,以渐进的方式解决问题。这不仅提高了任务的成功率,也显著增强了系统的,使得机器人可以更高效地应对复杂环境和多样
    发表于 12-29 23:04

    【「大模型启示录」阅读体验】营销领域大模型的应用

    效地制定针对不同客户群体的营销策略,提高营销活动的针对和有效。 大模型在内容生成方面也具有显著优势。它可以快速、高效地生成高质量的营销文案、广告语、海报、视频等营销素材。这种
    发表于 12-24 12:48

    AI模型部署边缘设备的奇妙之旅:目标检测模型

    介绍了如何使用分类任务进行手写数字的分类。相信大家脑海中可能会产生如下疑问: 数据依赖强:分类模型的表现通常依赖于大量的标注数据进行训练。获取高质量、大规模的数据集既耗时又昂贵。
    发表于 12-19 14:33

    用于任意排列多相机的通用视觉里程计系统

    如何让多相机视觉SLAM系统更易于部署且对环境更具?本文提出了一种适用于任意排列多相机的通用视觉里程计系统。在KITTI-360和MultiCamData数据集上验证了该方法对于任意放置相机的
    的头像 发表于 12-13 11:22 1144次阅读
    用于任意排列多相机的通用视觉里程计系统