0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

超干货解读胶囊网络

智能生物识别说 来源:快商通AI 作者:快商通AI 2021-09-27 17:54 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

The pooling operation used in convolutional neural networks is a big mistake and the fact that it works so well is a disaster. ——Hinton

先引用深度学习三巨头之一Geoffrey Hinton(杰弗里·辛顿)的名人名言作为开端.

CNN是现在十分火热的模型,首先我们都知道,通过pooling层能够学到部分高阶特征,比如对于人脸而言可以激活识别到鼻子 ,嘴巴 ,眼睛 等。

大神们看到CNN模型的强大开始进行人性本质的思索,那么它有什么搞不懂的时候咩?

答:确实有。

具体来说,pooling并不能够学到这些特征具体是从哪一层特征学到的,也就意味着会损失高阶特征之间的相互空间关系,空间层级信息无法获取到。也就是混乱的 并不能够表征一张人脸。这就是pooling层存在的缺陷。

好吧,简言之就是脸盲。

我们接着来看,计算机得到图像的过程是一层一层,从图像的内部表示到整体图像表示。但是人对图像的认识恰恰相反!

科普时间到:

人脑对图像的认识关键的点在于图像位置姿态的认识,也就是即便图像进行了旋转,平移人脑依然可以认识图像,而计算机却不行。因此提出胶囊网络CapsNet。

那么我们来正经地看看到底什么是胶囊(总之不是吃的那个小药丸 )

一:胶囊定义

胶囊(Capsule)是一个,包含多个神经元的特征载体。每个神经元可以表示图像中出现的特定实体的各种属性,比如姿态(位置,大小,方向),纹理,变形等。

胶囊以向量的形式封装特征的各种属性表示。数值就是这个属性表示存在的概率,会随着特征的空间变化而变化,向量的长度保持不变的话,整个胶囊表征的高层特征就保持一致,这就是Hinton提出的活动等变性,这个不变性的意义高于pooling的不变性。

o4YBAGCwqwSAB74wAACgPqYm2fA307.png

听懂以上概念后,大神小伙伴们就接着来看它的运算过程吧。

二:胶囊卷积运算过程

1. 输入向量的矩阵乘法

2. 输入向量的标量加权

3. 加权输入向量之和

4. 向量到向量的非线性变换

总之就是先这样,再那样就好啦~

好了,回归干货:

u1、u2、u3就是来自下层的3个胶囊 ,向量的长度编码了下层胶囊相应特征的概率。

那么

w1j、w2j、w3j 就能够编码高层特征和低层特征之间的空间关系。

o4YBAGCwq0CAJfjwAAB2VSAqs9w212.png

神经网络是通过反向传播来学习参数,而胶囊网络是通过“动态路由”算法来进行更新。

低层胶囊需要决定它的输出是向哪个高层胶囊输出。通过学习cici才能够激活是向哪个方向的胶囊进行映射。

所以对于动态路由算法就是ujuj服从的某个分布,每层胶囊会相对聚集,那么接下来学习的低层胶囊向哪个高层胶囊映射,就是通过这种预测更接近的胶囊聚集来判断的。

接下来向量到向量的非线性变换就是用了一个新颖的非线性激活函数,接收一个向量,然后在不改变方向的前提下,压缩它的长度到1以下。就是squash(∙):

pIYBAGCwq2OALvVmAABDqyQ6DFs635.png

为了清晰地让大家理解,整来了一张图,更形象的描述整个学习过程:⬇️

pIYBAGCwq5aAMXp_AAHnhdbGC9w615.png

怎么样,是不是看着一下子就通透了起来呀^ ^

三:动态路由算法

好了我们继续往下肝⬇️

pIYBAGCwq7aAWpxRAACclfVoehQ556.png

从上述算法过程就能够明白,输入为低层所有的胶囊线性变换的输出$hat{u}_{j|i}$以及路由迭代次数$r$和层$l$ 。定义了一个零时变量$b_{ij}$初始化为0,在迭代过程中会更新,$c_i leftarrow softmax(b_i)$就是低层胶囊所有的权重。

举个简单的小例子⬇️

权重分配过程:$b_{ij }$初始化为0,第一次迭代,假设有3个低层胶囊,2个高层胶囊,那么$c_{ij}$都会等于0.5,所有的权重$c_{ij}$都相等。

随着迭代才会使得低层胶囊可以根据这个权重指向对应的高层胶囊。$s_j leftarrow sum_i c_{ij} hat{mathbf{u}}_{j|i}$ 就是对每一个胶囊做一个线性组合,然后通过$squash$函数得到传递方向不变的权重向量。最后更行相应的权重$b_{ij}$。

(嗯!大神们是不是觉得很简单(o^^o))

高层胶囊$j$的当前输出和从低层胶囊 $i$出接收的输入做点积,再加上上一轮的权重$b_{ij}$,得到更新的$b_{ij}$。点积可以表征胶囊之间的相似性,其实也就是将低层胶囊的特征学习过来,这就与$CNN$的学习效果一致。

pIYBAGCwq9mAX-mxAAAXnbwcpM805.jpeg

明显从上图就可以看出,$hat{u}{1|1}$和上面黑色的向量不相似,$hat{u}{2|1}$就和上面黑色的向量是相似的,那么路由权重$c_{11}$会降低,而$c_{12}$会增大。从而低层胶囊的学习就能有最优的匹配。

综上!一篇简单的科普教学文就结束啦,谁用谁知道!

所以————

听懂掌声!

那下篇我们来简单聊聊「相似三连」:DNN、RNN、CNN里的RNN吧!(递归神经网络)

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4847

    浏览量

    108395
  • 函数
    +关注

    关注

    3

    文章

    4423

    浏览量

    68064
  • 神经元
    +关注

    关注

    1

    文章

    369

    浏览量

    19221
  • 动态路由
    +关注

    关注

    0

    文章

    17

    浏览量

    23503
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    华为智能充电网络解决方案领航产业迈向兆瓦充新时代

    2026年4月23日,北京车展同期,华为智能充电网络全系列解决方案重磅发布。华为数字能源副总裁何波发表题为“迈向兆瓦充新时代,让有路的地方就有高质量充电”演讲,以高质量与新技术为坚定基础,让高效率与新方案能迅速呈现,进一步扩展充电网络
    的头像 发表于 04-28 17:22 1103次阅读

    探索 onsemi FDMA507PZ:适用于便携应用的 P 沟道 MOSFET

    探索 onsemi FDMA507PZ:适用于便携应用的 P 沟道 MOSFET 在现代便携设备的设计中,电池充电和负载切换电路的性能至关重要。onsemi 推出的 FDMA507PZ 单 P
    的头像 发表于 04-17 13:40 186次阅读

    矢量网络分析仪E5071C测量差分析步骤

    当使用Agilent E5071C矢量网络分析仪进行测量时,若出现测量结果“差”(即超出允许误差范围或与预期值偏差较大),需系统性排查问题来源,确保测量准确性。
    的头像 发表于 03-05 16:42 505次阅读
    矢量<b class='flag-5'>网络</b>分析仪E5071C测量<b class='flag-5'>超</b>差分析步骤

    海伯森点光谱应用案例之--医用胶囊盖体弧度检测

    胶囊由上盖和下盖两部分套合而成,其弧度设计直接影响:密封性:正确的弧度能确保上盖和下盖紧密套合,防止内容物(粉末、颗粒)泄漏或受潮。锁合强度:弧度影响套合后的机械锁紧力。弧度不当可能导致胶囊在包装
    的头像 发表于 02-06 14:02 277次阅读
    海伯森点光谱应用案例之--医用<b class='flag-5'>胶囊</b>盖体弧度检测

    京东金融鸿蒙端部署AI分模型实践(纯干货)

    1. 背景 这可能是全网第一篇完整讲解鸿蒙端使用CANN部署AI模型的文章, 满满干货。 社区作为用户交流、信息传递的核心载体,图片内容(如理财产品截图、投资经验分享配图、用户互动评论图片等)的展示
    的头像 发表于 01-19 17:33 1584次阅读
    京东金融鸿蒙端部署AI<b class='flag-5'>超</b>分模型实践(纯<b class='flag-5'>干货</b>)

    激光焊接机在焊接胶囊胃镜工艺中的应用

    激光焊接技术在胶囊胃镜的制造过程中扮演着关键角色,它以高精度和可靠的密封性,确保了这类精密医疗设备在人体内部复杂环境下的安全稳定运行。下面来看看激光焊接技术在焊接胶囊胃镜工艺中的应用。
    的头像 发表于 11-21 17:55 1746次阅读

    罗德与施瓦茨从测试角度解读非地面网络技术

    向中国联通和中国移动颁发卫星移动通信业务经营许可。政策和产业的频频动作推动了卫星通信产业的快速发展和落地。借此机会,罗德与施瓦茨将从测试的角度解读非地面网络(NTN)技术,为大家全面解析从“天”到“地”、面向卫星基础设施和地面终端的测试技术。
    的头像 发表于 10-28 14:22 4349次阅读
    罗德与施瓦茨从测试角度<b class='flag-5'>解读</b>非地面<b class='flag-5'>网络</b>技术

    六类非屏蔽双绞线:家庭与中小型网络的“高速引擎”

    在家庭宽带升级至千兆、企业办公追求高效协作的今天,网络传输的稳定性与速度成为关键。作为六类网线的升级版,六类非屏蔽双绞线(CAT6A UTP)凭借其高带宽、低成本和易部署的特性,成为短距离高速网络
    的头像 发表于 10-15 10:06 3336次阅读

    干货分享 | 功能安全常见疑难问题汇总

    安全干货SafetyQ&A“功能安全常见疑难问题解答”在智能驾驶及新能源汽车的飞速发展之下,功能安全已成为绕不开的关键领域。然而在实际应用中,一直面临着诸多问题和挑战。前不久,磐时举办了一场
    的头像 发表于 09-05 16:21 2591次阅读
    <b class='flag-5'>干货</b>分享 | 功能安全常见疑难问题汇总

    HarmonyOSAI编程智能代码解读

    CodeGenie > Explain Code,开始解读当前代码内容。 说明 最多支持解读20000字符以内的代码片段。 使用该功能需先完成CodeGenie登录授权。 本文主要从参考引用自HarmonyOS官方文档
    发表于 09-02 16:29

    学校做广播对讲系统干货分享

    SIP 广播对讲系统的干货: 一:系统优势 安装维护便捷:可利用校园现有网络,无需单独布线,终端设备通过网线连接,且支持远程配置、管理与升级,能大幅节省安装配置和管理的难度与成本。 功能丰富多样:除传统
    发表于 07-24 15:59

    HarmonyOS AI辅助编程工具(CodeGenie)代码智能解读

    。 选中.ets文件或者.cpp文件中需要被解释的代码行或代码片段,右键选择CodeGenie > Explain Code,开始解读当前代码内容。 说明 最多支持解读20000字符以内
    发表于 07-17 17:02

    AI网络管理新范式:精要解读以太网联盟(UEC)1.0 规范(2025Q2)

    随着AI与高性能计算(HPC)集群对网络带宽、时延和拥塞管理的要求日益严苛,传统以太网在超大规模场景下面临瓶颈。为此,以太网联盟(UEC) 在Linux联合开发基金会(JDF)下成立,致力于构建新一代高性能以太网标准。
    的头像 发表于 07-11 18:41 2635次阅读
    AI<b class='flag-5'>网络</b>管理新范式:精要<b class='flag-5'>解读</b><b class='flag-5'>超</b>以太网联盟(UEC)1.0 规范(2025Q2)

    ISO/SAE 21434标准解读 DEKRA德凯解析ISO/SAE 21434汽车网络安全产品

    国际标准,为企业构建汽车全生命周期的网络安全防护体系提供了清晰的框架。 ISO/SAE 21434标准解读 全流程网络安全护航 ISO/SAE 21434标准覆盖车辆开发的每一个阶段,从概念设计到开发、验证、确认、生产、运营,直
    的头像 发表于 06-10 14:47 1886次阅读

    2MP小尺寸医疗应用CMOS图像传感器——SC1400ME 解读

    思特威SC1400ME医疗CMOS图像传感器深度解读 一、产品定位与核心优势 SC1400ME是思特威(SmartSens)推出的首款专为医疗内窥镜设计的2MP(200万像素)CMOS图像传感器,主
    的头像 发表于 06-06 18:24 3624次阅读
    2MP<b class='flag-5'>超</b>小尺寸医疗应用CMOS图像传感器——SC1400ME <b class='flag-5'>解读</b>