0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

胶囊网络在小样本做文本分类中的应用(下)

智能生物识别说 来源:KuAI_KST 作者:KuAI_KST 2021-09-27 17:46 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

论文提出Dynamic Memory Induction Networks (DMIN) 网络处理小样本文本分类。

pIYBAGCnY4mABa0KAACqrnD7xg418.jpeg

两阶段的(two-stage)few-shot模型:

在监督学习阶段(绿色的部分),训练数据中的部分类别被选为base set,用于finetune预训练Encoder和分类器也就是Pretrained Encoder和Classfiier图中的部分。

在元学习阶段(红色的部分),数据被构造成一个个episode的形式用于计算梯度和更新模型参数。对于C-way K-shot,一个训练episode中的Support Set是从训练数据中随机选择C个类别,每个类别选择K个实例构成的。每个类别剩下的样本就构成Query Set。也就是在Support Set上训练模型,在Query Set上计算损失更新参数。

Pretrained Encoder

用[CLS]预训练的句子的Bert-base Embedding来做fine-tune。$W_{base}$ 就作为元学习的base特征记忆矩阵,监督学习得到的。

Dynamic Memory Module

在元学习阶段,为了从给定的Support Set中归纳出类级别的向量表示,根据记忆矩阵 $W_{base}$ 学习Dynamic Memory Module(动态记忆模块)。

pIYBAGCnY6mATu11AACt6b83rQg92.jpeg

给定一个 $M$ ( $W_{base}$ )和样本向量 q , q 就是一个特征胶囊,所以动态记忆路由算法就是为了得到适应监督信息 $ W_{base} $ 的向量 $q^{'}$ ,

pIYBAGCnZCuAfxHgAAANyMjahgg865.jpg

$$ q^{'} \leftarrow DMR(M, q) $$ 学习记忆矩阵 $M$ 中的每个类别向量 $M^{'} $ 进行更新,

pIYBAGCnY9SAUs5YAAAY8n18FQ8274.jpg

其中

o4YBAGCnZFSAXoF4AAAQ5xcaJKE275.jpg

这里的 $W_j$ 就是一个权重。因此变换权重 $W_j$ 和偏差 $b_j$ 在输入时候是可以共享的, 因此计算 $\hat{m}{ij}$ 和 $\hat{q}_j$ 之间的皮尔逊相关系数

pIYBAGCnZVGAW4_CAAAUK-tFvfw171.jpg

其中

o4YBAGCnZZSAc4R5AABHPGmry5I894.png

接下来就是进行动态路由算法学习最佳的特征映射(这里添加了$p_{ij}$到路由协议中),到第11行为止。从第12行开始也会根据监督学习的记忆矩阵和胶囊的皮尔逊相关系数来更新$p_{ij}$,最后把部分胶囊

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7357

    浏览量

    95108
  • Query
    +关注

    关注

    0

    文章

    11

    浏览量

    9663
  • 小样本
    +关注

    关注

    0

    文章

    7

    浏览量

    6940
  • 动态路由
    +关注

    关注

    0

    文章

    17

    浏览量

    23499
  • 网络处理
    +关注

    关注

    0

    文章

    5

    浏览量

    6490
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    FreeRTOS 的 RT595 上使用 DMIC DMA 进行音频录制时遇到的问题求解决

    种情况,fifo_data 和 DMA 缓冲区都包含有效的非零音频样本。该问题仅发生在 FreeRTOS 。 问题: 是否有人在 RT595 上 FreeRTOS
    发表于 04-16 06:42

    新一代单目标 AI 跟踪算法,解决典型困难场景的跟踪稳定性问题

    帧用训练好的分类器寻找最优区域。但是这样的算法很多场景会出现高概率的丢失目标,所以经过我司算法工程师的努力,新一代单目标AI跟踪算法
    的头像 发表于 03-17 17:59 756次阅读
    新一代单目标 AI 跟踪算法,解决典型困难场景<b class='flag-5'>下</b>的跟踪稳定性问题

    机器学习特征工程:分类变量的数值化处理方法

    编码是机器学习流程里最容易被低估的环节之一,模型没办法直接处理文本形式的分类数据,尺寸(Small/Medium/Large)、颜色(Red/Blue/Green)、城市、支付方式等都是典型的分类
    的头像 发表于 02-10 15:58 507次阅读
    机器学习特征工程:<b class='flag-5'>分类</b>变量的数值化处理方法

    海伯森点光谱应用案例之--医用胶囊盖体弧度检测

    胶囊由上盖和盖两部分套合而成,其弧度设计直接影响:密封性:正确的弧度能确保上盖和盖紧密套合,防止内容物(粉末、颗粒)泄漏或受潮。锁合强度:弧度影响套合后的机械锁紧力。弧度不当可能导致胶囊
    的头像 发表于 02-06 14:02 271次阅读
    海伯森点光谱应用案例之--医用<b class='flag-5'>胶囊</b>盖体弧度检测

    Linux Shell文本处理神器合集:15个工具+实战例子,效率直接翻倍

    Linux 系统文本是数据交互的 “通用语言”—— 日志文件、配置文件、数据报表、程序输出几乎都以文本形式存在。手动编辑文本不仅繁琐
    的头像 发表于 02-03 15:42 3137次阅读
    Linux Shell<b class='flag-5'>文本</b>处理神器合集:15个工具+实战例子,效率直接翻倍

    TDK 2022样本套件的NTC热敏电阻:工业温度测量的理想之选

    TDK 2022样本套件的NTC热敏电阻:工业温度测量的理想之选 作为电子工程师,工业应用的温度测量设计,选择合适的NTC热敏电阻至关重要。TDK推出的2022
    的头像 发表于 12-26 14:40 511次阅读

    TDK PTC热敏电阻:低压应用加热元件样本套件解析

    TDK PTC热敏电阻:低压应用加热元件样本套件解析 电子设备的设计,加热元件的选择至关重要,尤其是低压应用场景。今天我们来详细了解
    的头像 发表于 12-25 16:55 1273次阅读

    激光焊接机焊接胶囊胃镜工艺的应用

    激光焊接技术胶囊胃镜的制造过程扮演着关键角色,它以高精度和可靠的密封性,确保了这类精密医疗设备人体内部复杂环境的安全稳定运行。下面来
    的头像 发表于 11-21 17:55 1731次阅读

    基于级联分类器的人脸检测基本原理

    在于它通过对于原图的降采样,构造了一系列图像的高斯金字塔,对于金字塔的每一个尺度去进行检测。关于旋转不变性的支持,我们可以对输入的图片一次几何变换,使其旋转特定角度,然后对该角度的图片,进行
    发表于 10-30 06:14

    CNN卷积神经网络设计原理及MCU200T上仿真测试

    连接,参数共享”的特点大大降低了网络参数,保证了网络的稀疏性,防止过拟合。之所以可以“参数共享”,是因为样本存在局部相关的特性。 池化层:有MaxPool和AveragePool等。其中MaxPool
    发表于 10-29 07:49

    Ubuntu20.04系统训练神经网络模型的一些经验

    本帖欲分享Ubuntu20.04系统训练神经网络模型的一些经验。我们采用jupyter notebook作为开发IDE,以TensorFlow2为训练框架,目标是训练一个手写数字识别的神经
    发表于 10-22 07:03

    RFID垃圾分类的核心优势

    RFID垃圾分类的核心优势精准溯源每个居民或单位的垃圾桶配备唯一编码的RFID标签,系统可记录每次投放的时间、地点和责任人,实现垃圾来源可追溯。自动识别分类
    的头像 发表于 09-23 11:08 709次阅读
    RFID<b class='flag-5'>在</b>垃圾<b class='flag-5'>分类</b><b class='flag-5'>中</b>的核心优势

    模板驱动 无需训练数据 SmartDP解决小样本AI算法模型开发难题

    。但是这个平台不适用于小样本AI模型开发,特别是一些特殊行业,数据本来就不多,但又有着需求,因此陷于两难。面临这种市场困境,慧视光电推出了一个全新的AI平台Sma
    的头像 发表于 09-09 17:57 1602次阅读
    模板驱动  无需训练数据  SmartDP解决<b class='flag-5'>小样本</b>AI算法模型开发难题

    时间同步设备复杂网络环境的调试要点

    时间同步设备是保障网络系统协同运行的基础设施,尤其金融、电力、通信等领域对精度要求较高的场景,其稳定性直接影响业务连续性。实际部署
    的头像 发表于 08-13 15:48 665次阅读
    时间同步设备<b class='flag-5'>在</b>复杂<b class='flag-5'>网络</b>环境<b class='flag-5'>中</b>的调试要点

    飞书开源“RTV”富文本组件 重塑鸿蒙应用富文本渲染体验

    更高效的富文本解决方案。 富文本作为内容展示和信息交互的重要形式,在内容创作、办公协作、教育学习、企业应用等多种复杂业务场景扮演着重要角色。随着鸿蒙生态应用类型的不断丰富,富文本渲染
    的头像 发表于 07-11 15:20 820次阅读
    飞书开源“RTV”富<b class='flag-5'>文本</b>组件 重塑鸿蒙应用富<b class='flag-5'>文本</b>渲染体验