0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

胶囊网络在小样本做文本分类中的应用(下)

智能生物识别说 来源:KuAI_KST 作者:KuAI_KST 2021-09-27 17:46 次阅读

论文提出Dynamic Memory Induction Networks (DMIN) 网络处理小样本文本分类。

pIYBAGCnY4mABa0KAACqrnD7xg418.jpeg

两阶段的(two-stage)few-shot模型:

在监督学习阶段(绿色的部分),训练数据中的部分类别被选为base set,用于finetune预训练Encoder和分类器也就是Pretrained Encoder和Classfiier图中的部分。

在元学习阶段(红色的部分),数据被构造成一个个episode的形式用于计算梯度和更新模型参数。对于C-way K-shot,一个训练episode中的Support Set是从训练数据中随机选择C个类别,每个类别选择K个实例构成的。每个类别剩下的样本就构成Query Set。也就是在Support Set上训练模型,在Query Set上计算损失更新参数。

Pretrained Encoder

用[CLS]预训练的句子的Bert-base Embedding来做fine-tune。$W_{base}$ 就作为元学习的base特征记忆矩阵,监督学习得到的。

Dynamic Memory Module

在元学习阶段,为了从给定的Support Set中归纳出类级别的向量表示,根据记忆矩阵 $W_{base}$ 学习Dynamic Memory Module(动态记忆模块)。

pIYBAGCnY6mATu11AACt6b83rQg92.jpeg

给定一个 $M$ ( $W_{base}$ )和样本向量 q , q 就是一个特征胶囊,所以动态记忆路由算法就是为了得到适应监督信息 $ W_{base} $ 的向量 $q^{'}$ ,

pIYBAGCnZCuAfxHgAAANyMjahgg865.jpg

$$ q^{'} \leftarrow DMR(M, q) $$ 学习记忆矩阵 $M$ 中的每个类别向量 $M^{'} $ 进行更新,

pIYBAGCnY9SAUs5YAAAY8n18FQ8274.jpg

其中

o4YBAGCnZFSAXoF4AAAQ5xcaJKE275.jpg

这里的 $W_j$ 就是一个权重。因此变换权重 $W_j$ 和偏差 $b_j$ 在输入时候是可以共享的, 因此计算 $\hat{m}{ij}$ 和 $\hat{q}_j$ 之间的皮尔逊相关系数

pIYBAGCnZVGAW4_CAAAUK-tFvfw171.jpg

其中

o4YBAGCnZZSAc4R5AABHPGmry5I894.png

接下来就是进行动态路由算法学习最佳的特征映射(这里添加了$p_{ij}$到路由协议中),到第11行为止。从第12行开始也会根据监督学习的记忆矩阵和胶囊的皮尔逊相关系数来更新$p_{ij}$,最后把部分胶囊

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    6512

    浏览量

    87601
  • Query
    +关注

    关注

    0

    文章

    11

    浏览量

    9269
  • 小样本
    +关注

    关注

    0

    文章

    7

    浏览量

    6799
  • 动态路由
    +关注

    关注

    0

    文章

    16

    浏览量

    23075
  • 网络处理
    +关注

    关注

    0

    文章

    5

    浏览量

    6312
收藏 人收藏

    评论

    相关推荐

    了解如何使用PyTorch构建图神经网络

    图神经网络直接应用于图数据集,您可以训练它们以预测节点、边缘和与图相关的任务。它用于图和节点分类、链路预测、图聚类和生成,以及图像和文本分类
    发表于 02-21 12:19 225次阅读
    了解如何使用PyTorch构建图神经<b class='flag-5'>网络</b>

    新技术在生物样本冷冻的应用案例分析

    可以提供关于样本冻结和解冻过程的重要信息,还可用于研究生物分子低温条件的行为,从而推动了相关领域的研究进展。   二、新技术在生物样本冷冻
    发表于 12-26 13:30

    人工智能中文本分类的基本原理和关键技术

    在本文中,我们全面探讨了文本分类技术的发展历程、基本原理、关键技术、深度学习的应用,以及从RNN到Transformer的技术演进。文章详细介绍了各种模型的原理和实战应用,旨在提供对文本分类技术深入理解的全面视角。
    的头像 发表于 12-16 11:37 550次阅读
    人工智能中<b class='flag-5'>文本分类</b>的基本原理和关键技术

    什么是零样本学习?为什么要搞零样本学习?

    样本分类的技术目前正处于高速发展时期, 所涉及的具体应用已经从最初的图像分类任务扩展到了其他计算机视觉任务乃至自然语言处理等多个相关领域。 对此, 本文将其称为广义零样本分类。 相应地, 我们将针对图像
    发表于 09-22 11:10 1057次阅读
    什么是零<b class='flag-5'>样本</b>学习?为什么要搞零<b class='flag-5'>样本</b>学习?

    如何在8x8 LED点矩阵屏幕上滚动文本

    。 在这种情况, LED 屏幕需要能够滚动到文本 。 此样本代码主要用于演示如何在 8x8 LED 点矩阵屏幕上滚动文本。 我们希望
    发表于 09-01 06:15

    什么是卷积神经网络?为什么需要卷积神经网络

    卷积神经网络(Convolutional Neural Network,CNN)是一种用于处理具有类似网格结构的数据的神经网络。它广泛用于图像和视频识别、文本分类等领域。CNN可以自动从训练数据中学习出合适的特征,并以此对新输入
    发表于 08-22 18:20 1529次阅读

    yolov5和YOLOX正负样本分配策略

    整体上在正负样本分配中,yolov7的策略算是yolov5和YOLOX的结合。因此本文先从yolov5和YOLOX正负样本分配策略分析入手,后引入到YOLOv7的解析中。
    发表于 08-14 11:45 1772次阅读
    yolov5和YOLOX正负<b class='flag-5'>样本分</b>配策略

    81.7 5 循环神经网络实战文本分类 #硬声创作季

    网络函数应用程序
    充八万
    发布于 :2023年07月20日 18:41:20

    华为云ModelArts入门开发(完成物体分类、物体检测)

    利用ModelArts框架可以完成图像分类、物体检测、预测分析、声音分类文本分类等功能。介绍如何使用ModelArts完成图像分类、物体检测、自我学习等功能运用。
    的头像 发表于 07-10 16:26 1308次阅读
    华为云ModelArts入门开发(完成物体<b class='flag-5'>分类</b>、物体检测)

    基于GAN的零缺陷样本产品表面缺陷检测

    少的情况下实现高精度的检测呢?目前有两种方法,一种是小样本学习,另一种是用GAN。本文将介绍一种GAN用于无缺陷样本产品表面缺陷检测。
    的头像 发表于 06-26 09:49 620次阅读
    基于GAN的零缺陷<b class='flag-5'>样本</b>产品表面缺陷检测

    小样本学习领域的未来发展方向

    什么是小样本学习?它与弱监督学习等问题有何差异?其核心问题是什么?来自港科大和第四范式的这篇综述论文提供了解答。 数据是机器学习领域的重要资源,在数据缺少的情况下如何训练模型呢?小样本学习是其中
    的头像 发表于 06-14 09:59 610次阅读
    <b class='flag-5'>小样本</b>学习领域的未来发展方向

    NLP中的迁移学习:利用预训练模型进行文本分类

    迁移学习彻底改变了自然语言处理(NLP)领域,允许从业者利用预先训练的模型来完成自己的任务,从而大大减少了训练时间和计算资源。在本文中,我们将讨论迁移学习的概念,探索一些流行的预训练模型,并通过实际示例演示如何使用这些模型进行文本分类。我们将使用拥抱面转换器库来实现。
    发表于 06-14 09:30 311次阅读

    PyTorch教程-4.3. 基本分类模型

    4.3. 基本分类模型¶ Colab [火炬]在 Colab 中打开笔记本 Colab [mxnet] Open the notebook in Colab Colab [jax
    的头像 发表于 06-05 15:43 322次阅读

    PyTorch教程4.3之基本分类模型

    电子发烧友网站提供《PyTorch教程4.3之基本分类模型.pdf》资料免费下载
    发表于 06-05 15:43 0次下载
    PyTorch教程4.3之基<b class='flag-5'>本分类</b>模型

    机器学习相关介绍:支持向量机(低维到高维的映射)

    根据机器学习相关介绍(9)——支持向量机(线性不可分情况),通过引入松弛变量δi将支持向量机推广至解决非线性可分训练样本分类的方式不能解决所有非线性可分训练样本分类问题。因此,支持向量机的可选函数范围需被扩展以提升其解决非线性
    的头像 发表于 05-16 11:20 1433次阅读
    机器学习相关介绍:支持向量机(低维到高维的映射)