0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何提高事件检测(ED)模型的鲁棒性和泛化能力?

深度学习自然语言处理 来源:深度学习的知识小屋 作者:深度学习的知识小 2020-12-31 10:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

论文中指出,以往关于ED的工作都是考虑如何提升模型的性能,而较少考虑模型的鲁棒性和泛化能力,作者将模型的鲁棒性和泛化能力定义为如下三条,并通过设计模型进行研究:

抗攻击性能:当训练数据中被加入扰动,会如何影响模型性能;

新类型的预测:模型能否预测出训练集中未见过的事件类型;

事件类型的模糊性: 根据统计,70%的事件触发词能够触发不同类型的事件,如何正确识别出这些模糊性触发词在各自上下文中所触发的具体事件类型。

基于以上问题,作者提出一种新的学习方式,主要包括一下两部分:

Contextselective discriminative learning: 根据句子内部的不同words的重要性得到trigger的上下文表示,目标是基于trigger的上下文表示预测句子中被mask的trigger的事件类型。

Contextualized similarity learning:基于"相同类型的事件触发词应当具有相似上下文"的假设,以mask-contraining的句子对为输入,如何输入中的两个句子表达的是同一事件类型,则训练目标是使他们的masked triggers具有语义相近的上下文表示。

作者分别将本文的模型与以往的SOTA模型进行了对比实验,证明了本文模型能较好地应对对抗攻击、未知类型预测和事件模糊性区分的问题。

原文标题:【每日一读】EMNLP2020:如何提高事件检测(ED)模型的鲁棒性和泛化能力?

文章出处:【微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3873

    浏览量

    52337
  • 深度学习
    +关注

    关注

    73

    文章

    5614

    浏览量

    124748

原文标题:【每日一读】EMNLP2020:如何提高事件检测(ED)模型的鲁棒性和泛化能力?

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    人工智能多模态与视觉大模型开发实战 - 2026必会

    。同时,还会学习到如何使用数据增强技术扩充数据集,进一步提升模型
    发表于 04-15 16:06

    瞻芯电子G2 650V SiC MOSFET的验证试验

    瞻芯电子(IVCT)基于经典寿命模型,对大样本量的第二代(G2)650V SiC MOSFET 进行了验证试验(Robustness-Validation)。该试验严格遵循AEC
    的头像 发表于 12-18 16:35 6894次阅读
    瞻芯电子G2 650V SiC MOSFET的<b class='flag-5'>鲁</b><b class='flag-5'>棒</b><b class='flag-5'>性</b>验证试验

    自动驾驶大模型中常提的能力是指啥?

    [首发于智驾最前沿微信公众号]在讨论自动驾驶大模型时,常会有几个评价维度,如感知是否准确、决策是否稳定、系统是否足够,以及模型有没有“
    的头像 发表于 12-10 09:15 1001次阅读
    自动驾驶大<b class='flag-5'>模型</b>中常提的<b class='flag-5'>泛</b><b class='flag-5'>化</b><b class='flag-5'>能力</b>是指啥?

    ElfBoard技术贴|如何在【RK3588】ELF 2开发板上完成PPOC本地部署

    PPOCR是由百度开发的一款开源深度学习OCR(光学字符识别)模型,专注于文本检测、识别与理解任务,具备多场景、多语言的字符识别能力。该模型基于大规模多样
    的头像 发表于 11-14 10:54 7562次阅读
    ElfBoard技术贴|如何在【RK3588】ELF 2开发板上完成PPOC本地<b class='flag-5'>化</b>部署

    基于级联分类器的人脸检测基本原理

    基于级联分类器的人脸检测。把这两种扩展运算结合在一起,就可以大幅度提高检测器的。 上图是决策树示意图。
    发表于 10-30 06:14

    构建CNN网络模型并优化的一般建议

    :Dropout层随机跳过神经网络模型中某些神经元之间的连接,通过随机制造缺陷进行训练提升整个神经网络的。 6)指定合理的学习率策略:一旦神经网络的准确率饱和,那么学习率应当
    发表于 10-28 08:02

    海康威视大模型精准检测守护高速安全

    这一成绩的背后,是海康威视大模型事件检测服务器的科技助力。系统升级视觉大模型,针对抛洒物、行人、违停等事件的常见误检漏检进行优化,能够有效抑制背景误检,具备更强的
    的头像 发表于 08-21 11:16 1635次阅读

    自动驾驶数据标注主要是标注什么?

    的结构标签。这些标签不仅构成了模型训练与评估的数据基础,也直接影响系统在实际道路环境中的识别、理解和决策能力。准确、系统的数据标注能够有效提升感知算法的
    的头像 发表于 07-30 11:54 1822次阅读
    自动驾驶数据标注主要是标注什么?

    具备光照和自适应特征剔除的VSLAM前端框架

    现有的基于特征的VSLAM系统依赖于固定的前端参数,这使得它们在面对光照突变时显得十分脆弱,且特征跟踪也不稳定。为应对这些挑战,我们提出了“IRAF-SLAM”,这是一种具备光照且能自适应特征筛选的前端设计,旨在提升VSL
    的头像 发表于 07-30 10:38 1009次阅读
    具备光照<b class='flag-5'>鲁</b><b class='flag-5'>棒</b>和自适应特征剔除的VSLAM前端框架

    无轴承异步电机转子径向位移白检测

    训练构建转子位移预测模型,利用位移预测模型能力,进行转子位移估计。仿真结果表明,提出的位移估计方法能够准确
    发表于 07-14 17:45

    模型在半导体行业的应用可行分析

    有没有这样的半导体专用大模型,能缩短芯片设计时间,提高成功率,还能帮助新工程师更快上手。或者软硬件可以在设计和制造环节确实有实际应用。会不会存在AI缺陷检测。 能否应用在工艺优化和预测
    发表于 06-24 15:10

    明晚开播 |数据智能系列讲座第7期:面向高能力的视觉感知系统空间建模与微调学习

    构建高效、物理一致且具备良好能力的视觉感知系统,是视觉智能、边缘计算与具身机器人中的关键挑战。为提升系统的与适应
    的头像 发表于 06-24 08:01 1294次阅读
    明晚开播 |数据智能系列讲座第7期:面向高<b class='flag-5'>泛</b><b class='flag-5'>化</b><b class='flag-5'>能力</b>的视觉感知系统空间建模与微调学习

    AI技术加持,宏工科技锂电包装自动化装备新突破

    2024年11月。专利摘要显示,一种基于YOLOv8模型的包装袋袋口检测方法能够防止模型过度拟合训练集,提高整体的化性能和
    的头像 发表于 06-17 09:26 1021次阅读
    AI技术加持,宏工科技锂电包装自动化装备新突破

    直播预约 |数据智能系列讲座第7期:面向高能力的视觉感知系统空间建模与微调学习

    鹭岛论坛数据智能系列讲座第7期「面向高能力的视觉感知系统空间建模与微调学习」6月25日(周三)20:00精彩开播期待与您云相聚,共襄学术盛宴!|直播信息报告题目面向高
    的头像 发表于 05-29 10:04 811次阅读
    直播预约 |数据智能系列讲座第7期:面向高<b class='flag-5'>泛</b><b class='flag-5'>化</b><b class='flag-5'>能力</b>的视觉感知系统空间建模与微调学习

    改进电压模型的异步电机无速度传感器矢量控制

    控制系统,克服了一般电压模型低速观测不准确的缺点。另外,为了消除外界干扰的影响,对模型做了抗噪声处理。利用PSCAD进行系统仿真,仿真结果表明该方法具有较好的低速控制效果和较强的
    发表于 05-28 15:43