Few-shot NER的三阶段-电子发烧友网

—

方法介绍

Few-shot NER的三阶段：Train、Adapt、Recognize，即在source域训练，在target域的support上微调，在target域的query上测试。

如上图，左边（1-3）表示的是原型的loss1（训练目标为各个原型分散分布），右边（4-7）表示的是span的representation获取，中间（8）是一个多层FFN（为了使得原型表示和span表示最终映射到同一个向量空间），中间（9-10）则是计算原型和span在同一个空间的loss2（为了使得实体span更靠近原型表示）

—

和过往工作相比

1、使得Adapt阶段不只是通过对support集中的实体词表示平均得到实体原型表示，而是能够进行finetune（文中提到Ma et al. (2022) claim that the finetuning method is far more effective in using the limited information in support sets.）

2、过往的原型网络的训练方法使得最终的原型表示较接近，本文通过构造loss1（上一段提到的）使得原型表示分散开

—

实验结果

这里仅挑选附录部分的FEW-NERD实验结果

从实验结果来看，在INTRA上效果较好，在INTER上不如ESD。其中INTRA是指source和target之间的实体的粗粒度类型无交集，INTER则在粗粒度上有交集（细粒度上无交集）。（另外，2022年还有一篇SOTA文章Decomposed metalearning for few-shot named entity recognition，这里没有进行对比）

—

消融实验

1、使用token-level

2、缺少loss1（把原型打散的loss，方法介绍中有说）

3、使用cosine similarity而不是Euclidean distance来衡量span-prototype相似度

审核编辑：彭静

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

网络

网络

+关注

关注
14

文章
7251

浏览量
87443
Target

Target

+关注

关注
0

文章
13

浏览量
8349

原文标题：COLING2022 | 少样本NER：分散分布原型增强的实体级原型网络

文章出处：【微信号：zenRRan，微信公众号：深度学习自然语言处理】欢迎添加关注！文章转载请注明出处。

基于将 CLIP 用于下游few-shot图像分类的方案

对比性图像语言预训练模型（CLIP）在近期展现出了强大的视觉领域迁移能力，可以在一个全新的下游数据集上进行 zero-shot 图像识别。

发表于 09-27 09:46 •3764次阅读

CDMA_协议测试规范_第三阶段（CDG3）

CDMA_协议测试规范_第三阶段（CDG3）

发表于 11-03 09:13

关于蓄电池的三阶段充电疑点

三段式充电：第一个阶段叫恒流阶段（即主充），第二个阶段叫恒压阶段（即均充），第三个

发表于 07-07 22:21

三阶段充电器的关键参数疑点

最近在研究蓄电池的充电看了一些资料学习三阶段充电。三阶段充电：恒流恒压浮充其中恒流阶段充电器的输出电压是怎样的？恒压阶段充电器的输出电流是怎样的？浮充

发表于 01-14 23:25

高通范博士分享职场干货：工程师职业生涯三阶段如何跨越

范明熙博士，毕业于麻省理工学院电气工程学，拥有30余个美国专利，现任Qualcomm（高通）研发系统部门工程技术副总裁。职场必经三阶段：dependent、independent

发表于 01-03 16:25

自动布线第三阶段成果实现整版或者局部全自动铺铜皮

程序功能：实现整版或者局部全自动铺铜皮。全自动铺铜皮程序，是自动布线研究的第三阶段成果。第一阶段成果为短线全自动布线，第二阶段成果为整版全自动或者局部全自动打过孔，这两个以前已经公布使用，这三

发表于 09-27 22:16

欧盟ERP能效认证第三阶段 ErP指令范围

欧盟ERP能效认证现在已经进入第三阶段，ErP指令对灯具的认证范围：EC 244/2009 集成电路的非定向灯的生态设计要求：1.涉及非定向的白炽灯、卤素灯、CFL、LED灯等2.提出能效指数要求

发表于 04-22 09:55

stm32+RTOS阶段

目录一．作者：懒懒土拨鼠第一阶段称为stm32+RTOS阶段。第二阶段称为多核+Linux阶段。第三阶段最后荐书环节二．作者：程序员良许转折

发表于 08-06 09:56

清华联合阿里达摩院开发行业首个人工标注的少样本NER数据集

中找到各种实体，并将其分为合适的类别。且避免出现“江大桥同志到底就任了多少年南京市长”这样的问题但在数据缺乏，样本不足的前提下，如何基于先验知识进行分类和学习，这就是目前NLPer面临的一道难题——少样本（Few-Shot）。虽然已有越来越多

发表于 05-28 14:59 •1232次阅读

样本量极少可以训练机器学习模型吗？

本文首先介绍了用小样本训练模型会导致的问题，再介绍了Few-Shot Learning的基本原理即三大思路下的方法。

发表于 06-23 15:02 •6327次阅读

介绍两个few-shot NER中的challenge

此部分着重介绍了两个few-shot NER中的challenge：limited information challenge和knowledge mismatch challenge。前者主要

发表于 08-24 10:01 •622次阅读

基于GLM-6B对话模型的实体属性抽取项目实现解析

Zero-shot、One-shot以及Few-shot让人傻傻分不清，读了很多文章，也没搞清楚他们的差别，究竟什么叫zero-shot，其在应用过程中的no gradient upd

发表于 03-28 10:11 •6017次阅读

迈向多模态AGI之开放世界目标检测

OVD的基础概念：OVD的使用主要涉及到 few-shot 和 zero-shot两大类场景，few-shot是指有少量人工标注训练样本的目标类别，zero-shot则是指不存在任何人

发表于 06-15 16:08 •452次阅读

基于多任务预训练模块化提示

对 Few-shot 场景时，PT 的调优方法还是存在一定的局限性。针对这个问题，复旦提出了多任务预训练模块化 Prompt（简称为：），来提高模型在 Few-shot 场景下的 PT 效果，使模型能够快速适应下游

发表于 06-20 11:04 •393次阅读

基于显式证据推理的few-shot关系抽取CoT

最近，上下文学习策略已被证明在没有训练的情况下显示出显著的结果。很少有研究利用上下文学习进行zero-shot信息提取。不幸的是，推理的证据在思维链提示的构建过程中没有被考虑或隐式建模。

发表于 11-20 17:44 •367次阅读

搜索历史

Few-shot NER的三阶段

评论

基于将 CLIP 用于下游few-shot图像分类的方案

CDMA_协议测试规范_第三阶段（CDG3）

关于蓄电池的三阶段充电疑点

三阶段充电器的关键参数疑点

高通范博士分享职场干货：工程师职业生涯三阶段如何跨越

自动布线第三阶段成果实现整版或者局部全自动铺铜皮

欧盟ERP能效认证第三阶段 ErP指令范围

stm32+RTOS阶段

清华联合阿里达摩院开发行业首个人工标注的少样本NER数据集

样本量极少可以训练机器学习模型吗？

介绍两个few-shot NER中的challenge

基于GLM-6B对话模型的实体属性抽取项目实现解析

迈向多模态AGI之开放世界目标检测

基于多任务预训练模块化提示

基于显式证据推理的few-shot关系抽取CoT