0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Few-shot NER的三阶段

深度学习自然语言处理 来源:深度学习自然语言处理 作者:深度学习自然语言 2022-08-24 16:12 次阅读

01

方法介绍


Few-shot NER的三阶段:Train、Adapt、Recognize,即在source域训练,在target域的support上微调,在target域的query上测试。

baafda2a-22c5-11ed-ba43-dac502259ad0.png

如上图,左边(1-3)表示的是原型的loss1(训练目标为各个原型分散分布),右边(4-7)表示的是span的representation获取,中间(8)是一个多层FFN(为了使得原型表示和span表示最终映射到同一个向量空间),中间(9-10)则是计算原型和span在同一个空间的loss2(为了使得实体span更靠近原型表示)

02

和过往工作相比


1、使得Adapt阶段不只是通过对support集中的实体词表示平均得到实体原型表示,而是能够进行finetune(文中提到Ma et al. (2022) claim that the finetuning method is far more effective in using the limited information in support sets.)

2、过往的原型网络的训练方法使得最终的原型表示较接近,本文通过构造loss1(上一段提到的)使得原型表示分散开

03

实验结果

这里仅挑选附录部分的FEW-NERD实验结果

bac556ca-22c5-11ed-ba43-dac502259ad0.png

从实验结果来看,在INTRA上效果较好,在INTER上不如ESD。其中INTRA是指source和target之间的实体的粗粒度类型无交集,INTER则在粗粒度上有交集(细粒度上无交集)。(另外,2022年还有一篇SOTA文章Decomposed metalearning for few-shot named entity recognition,这里没有进行对比)

04

消融实验

1、使用token-level

2、缺少loss1(把原型打散的loss,方法介绍中有说)

3、使用cosine similarity而不是Euclidean distance来衡量span-prototype相似度

bad9b7dc-22c5-11ed-ba43-dac502259ad0.png

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 网络
    +关注

    关注

    14

    文章

    7251

    浏览量

    87443
  • Target
    +关注

    关注

    0

    文章

    13

    浏览量

    8349

原文标题:COLING2022 | 少样本NER:分散分布原型增强的实体级原型网络

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于将 CLIP 用于下游few-shot图像分类的方案

    对比性图像语言预训练模型(CLIP)在近期展现出了强大的视觉领域迁移能力,可以在一个全新的下游数据集上进行 zero-shot 图像识别。
    的头像 发表于 09-27 09:46 3764次阅读

    CDMA_协议测试规范_第三阶段(CDG3)

    CDMA_协议测试规范_第三阶段(CDG3)
    发表于 11-03 09:13

    关于蓄电池的三阶段充电疑点

    三段式充电:第一个阶段叫恒流阶段(即主充),第二个阶段叫恒压阶段(即均充),第
    发表于 07-07 22:21

    三阶段充电器的关键参数疑点

    最近在研究蓄电池的充电 看了一些资料学习三阶段充电。三阶段充电:恒流 恒压 浮充其中恒流阶段充电器的输出电压是怎样的?恒压阶段充电器的输出电流是怎样的?浮充
    发表于 01-14 23:25

    高通范博士分享职场干货:工程师职业生涯三阶段如何跨越

    范明熙博士,毕业于麻省理工学院电气工程学,拥有30余个美国专利,现任Qualcomm(高通)研发系统部门工程技术副总裁。职场必经三阶段:dependent、independent
    发表于 01-03 16:25

    自动布线第三阶段成果实现整版或者局部全自动铺铜皮

    程序功能:实现整版或者局部全自动铺铜皮。全自动铺铜皮程序,是自动布线研究的第三阶段成果。第一阶段成果为短线全自动布线,第二阶段成果为整版全自动或者局部全自动打过孔,这两个以前已经公布使用,这
    发表于 09-27 22:16

    欧盟ERP能效认证第三阶段 ErP指令范围

    欧盟ERP能效认证现在已经进入第三阶段,ErP指令对灯具的认证范围:EC 244/2009 集成电路的非定向灯的生态设计要求:1.涉及非定向的白炽灯、卤素灯、CFL、LED灯等2.提出能效指数要求
    发表于 04-22 09:55

    stm32+RTOS阶段

    目录一.作者:懒懒土拨鼠第一阶段称为stm32+RTOS阶段。第二阶段称为多核+Linux阶段。第三阶段最后荐书环节二.作者:程序员良许转折
    发表于 08-06 09:56

    清华联合阿里达摩院开发行业首个人工标注的少样本NER数据集

    中找到各种实体,并将其分为合适的类别。且避免出现“江大桥同志到底就任了多少年南京市长”这样的问题 但在数据缺乏,样本不足的前提下,如何基于先验知识进行分类和学习,这就是目前NLPer面临的一道难题——少样本(Few-Shot)。 虽然已有越来越多
    的头像 发表于 05-28 14:59 1232次阅读
    清华联合阿里达摩院开发行业首个人工标注的少样本<b class='flag-5'>NER</b>数据集

    样本量极少可以训练机器学习模型吗?

    本文首先介绍了用小样本训练模型会导致的问题,再介绍了Few-Shot Learning的基本原理即三大思路下的方法。
    的头像 发表于 06-23 15:02 6327次阅读

    介绍两个few-shot NER中的challenge

    此部分着重介绍了两个few-shot NER中的challenge:limited information challenge和knowledge mismatch challenge。前者主要
    的头像 发表于 08-24 10:01 622次阅读

    基于GLM-6B对话模型的实体属性抽取项目实现解析

    Zero-shot、One-shot以及Few-shot让人傻傻分不清,读了很多文章,也没搞清楚他们的差别,究竟什么叫zero-shot,其在应用过程中的no gradient upd
    的头像 发表于 03-28 10:11 6017次阅读

    迈向多模态AGI之开放世界目标检测

    OVD的基础概念:OVD的使用主要涉及到 few-shot 和 zero-shot两大类场景,few-shot是指有少量人工标注训练样本的目标类别,zero-shot则是指不存在任何人
    的头像 发表于 06-15 16:08 452次阅读
    迈向多模态AGI之开放世界目标检测

    基于多任务预训练模块化提示

    Few-shot 场景时,PT 的调优方法还是存在一定的局限性。针对这个问题, 复旦提出了多任务预训练模块化 Prompt(简称为:),来提高模型在 Few-shot 场景下的 PT 效果,使模型能够快速适应下游
    的头像 发表于 06-20 11:04 393次阅读
    基于多任务预训练模块化提示

    基于显式证据推理的few-shot关系抽取CoT

    最近,上下文学习策略已被证明在没有训练的情况下显示出显著的结果。很少有研究利用上下文学习进行zero-shot信息提取。不幸的是,推理的证据在思维链提示的构建过程中没有被考虑或隐式建模。
    的头像 发表于 11-20 17:44 367次阅读
    基于显式证据推理的<b class='flag-5'>few-shot</b>关系抽取CoT