0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

【连载】深度学习笔记10:三维卷积、池化与全连接

人工智能实训营 2018-10-25 20:09 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群


在上一讲中,我们对卷积神经网络中的卷积操作进行了详细的解读,但仅仅是对二维图像,即通道数为 1 的图像(灰度图)进行了卷积,对于三维或者更高维的图像卷积显然并没有这么简单。

如果图像大小为 6*6*3,那么这里的 3 指的是三个颜色通道,你可以将其理解为 3 个 6*6 的图像的堆叠,如果要对此图像进行卷积的话,我们的滤波器也需要变成三维的,假设采用一个 3*3*3 的滤波器对其进行卷积(这里需要注意的是,滤波器的通道数一定要等于输入图像的通道数),根据 ((n+2p-f)/s)+1 的计算公式我们可以知道输出图像的大小为 4*4*1,由一个滤波器进行卷积之后输出图像的通道不是 3 而是 1 了。


那么究竟如何理解三通道的卷积过程?单通道的卷积操作我们已经知道,就是直接对感受野与滤波器进行元素相乘求和,那三通道呢?我们可以将 3*3*3 的滤波器想象为一个三维的立方体,为了计算立方体滤波器在输入图像上的卷积操作,我们首先将这个三维的滤波器放到左上角,让三维滤波器的 27 个数依次乘以红绿蓝三个通道中的像素数据,即滤波器的前 9 个数乘以红色通道中的数据,中间 9 个数乘以绿色通道中的数据,最后 9 个数乘以蓝色通道中的数据。将这些数据加总起来,就得到输出像素的第一个元素值。如下图所示:


这样做可能还不够。在实际图像处理中,仅靠单滤波器很难将复杂的图像特征进行充分提取。所以,通常而言,我们用来进行卷积的滤波器远不止一个。下面我们用两个滤波器对上述图像进行卷积操作。


我们用第一个滤波器进行卷积得到一个 4*4 的输出,然后用第二个滤波器进行卷积又得到一个 4*4 的输出,将这个输出放到第一个输出后面,形成了一个 4*4*2 的输出,这里的 2 的就是滤波器的个数。

关于多通道卷积的另一种理解类似于 DNN 中的标准神经网络中的 Z=Wx+b 的线性计算,其中 x 为输入的原始图像,W 为滤波器,b 偏差项,卷积过程就类似与标准神经网络的线性计算,完了之后利用激活函数进行激活。还有一个关键问题就是卷积层有多少参数,卷积层的参数通常在于滤波器 W,根据滤波器的大小,我们可以计算一个滤波器的参数数量为 f*f*nc,其中 nc 为通道熟量,那 k 个滤波器所含的参数数量则为 f*f*nc*k

卷积过程到此就差不多解释完了。我们再看 CNN 的另一个重要操作——池化(pooling)。简单来说,池化层是用来缩减模型大小,提高模型计算速度以及提高所提取特征的鲁棒性。池化操作通常有两种,一种是常用的最大池化(max pooling),另一种是不常用的平均池化(average pooling)。池化操作过程也非常简单,假设池化层的输入为一个 4*4 的图像,我们用最大池化对其进行池化,执行最大池化的树池是一个 2*2 的矩阵,执行过程就是将输入矩阵拆分为不同区域,对于 2*2 的输出而言,输出的每个元素都是其对应区域的最大元素值。


最大池化过程就像是应用了一个 2*2 的滤波器以步幅 2 进行区域最大化输出操作。所以简单而言,池化的参数就是滤波器的大小 f 和步幅 s,池化的效果就相当于对输入图像的高度和宽度进行缩小。值得注意的是,最大池化只是计算神经网络某一层的静态属性,中间并没有什么学习过程。

池化完成之后就是标准神经网络中的全连接层了。全连接层我们在 DNN 中有详细介绍,这里就不再赘述。总之,一个典型的卷积层通常包括卷积层-池化层和全连接层。

下一讲中,我们将一起尝试如何利用 numpy 实现一个简单的典型的卷积神经网络。

本文由《自兴动脑人工智能》项目部 凯文 投稿。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4845

    浏览量

    108372
  • 人工智能
    +关注

    关注

    1821

    文章

    50511

    浏览量

    267731
  • 卷积神经网络

    关注

    4

    文章

    375

    浏览量

    12968
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    三维力传感器工作原理及应用领域是什么样的,在未来市场是占据怎么的地位?

    信号中解算出真实的三维力值。 智能演进:神经网络算法的引入 传统的矩阵法在处理非线性耦合时存在极限。近期,学术界与产业界开始引入人工智能算法。例如,通过训练神经网络(NN)来学习弹性体的复杂变形模式
    发表于 05-21 09:37

    三维感知赋能千行百业——深度相机的技术解析与应用全景

    在数字转型与智能升级的浪潮中,感知技术作为连接物理世界与数字世界的重要桥梁,正推动着各行业的变革与创新。深度相机,作为具备三维空间感知能
    的头像 发表于 04-17 14:40 211次阅读
    <b class='flag-5'>三维</b>感知赋能千行百业——<b class='flag-5'>深度</b>相机的技术解析与应用全景

    深度相机:从技术突破到全场景落地,解锁三维感知新可能

    在智能制造、智能机器人、户外巡检等领域快速升级的当今,三维感知技术已成为连接物理世界与数字世界的重要桥梁,而深度相机作为三维感知的重要载体,正逐步打破传统视觉感知的局限,从实验室走向实
    的头像 发表于 04-15 15:04 444次阅读
    <b class='flag-5'>深度</b>相机:从技术突破到全场景落地,解锁<b class='flag-5'>三维</b>感知新可能

    FPGA实现CNN卷积层的高效窗口生成模块设计与验证

    卷积神经网络(CNN)可以分为卷积层、层、激活层、链接层结构,本篇要实现的,就是CNN的卷积
    的头像 发表于 04-15 10:35 291次阅读
    FPGA实现CNN<b class='flag-5'>卷积</b>层的高效窗口生成模块设计与验证

    双目深度相机:模拟人眼视觉,解锁三维感知新可能

    三维感知技术快速迭代的现在,深度相机作为机器获取空间信息的重要“眼睛”,已渗透到工业自动、机器人导航、AR/VR、智能家居等多个领域。其中,双目深度相机凭借其被动式工作、成本可控、
    的头像 发表于 04-13 14:50 424次阅读
    双目<b class='flag-5'>深度</b>相机:模拟人眼视觉,解锁<b class='flag-5'>三维</b>感知新可能

    VirtualLab:光学系统的三维可视

    **摘要 ** 为了对光学系统的性质有一个基本的了解,对其组件的可视和光传播的提示是非常有帮助的。为此,VirtualLab Fusion提供了一个工具来显示光学系统的三维视图。这些工具可以进一步
    发表于 04-13 09:04

    【OFDR】实时感知、动态重构与历史状态回溯!昊衡科技-三维场重构软件

    路径映射三维螺旋路径映射支持TCP实时数据传输,支持导入本地TXT数据,对试验过程进行回溯分析,方便后期数据复盘与优化。数据回放功能界面从实时数据采集到三维场可视,再
    的头像 发表于 01-29 17:40 1588次阅读
    【OFDR】实时感知、动态重构与历史状态回溯!昊衡科技-<b class='flag-5'>三维</b>场重构软件

    OFDR技术与三维重构的协同价值

    概述OFDR分布式光频域反射技术具有光纤传感器体积小、重量轻、测试精度高的特性,能够精准捕捉结构各位置的微小应变或温度变化。三维重构软件可作为连接数据与实际应用的结构——通过颜色映射将数据直观呈现在三维
    的头像 发表于 11-14 17:36 1556次阅读
    OFDR技术与<b class='flag-5'>三维</b>重构的协同价值

    一文读懂 | 三维视觉领域国家级制造业单项冠军——先临三维的品牌布局

    ,推动高精度三维视觉技术的普及应用。2024年,先临三维营业收入超12亿元,业务遍及全球100+个国家和地区。 先临三维的高精度三维视觉技术深度
    的头像 发表于 11-11 14:55 999次阅读
    一文读懂 | <b class='flag-5'>三维</b>视觉领域国家级制造业单项冠军——先临<b class='flag-5'>三维</b>的品牌布局

    CNN卷积神经网络设计原理及在MCU200T上仿真测试

    CNN算法简介 我们硬件加速器的模型为Lenet-5的变型,网络粗略分共有7层,细分共有13层。包括卷积,最大层,激活层,扁平层,连接
    发表于 10-29 07:49

    数据复用高性能层设计思路分享

    大家好,本团队此次分享的内容为可实现数据复用高性能层设计思路,核心部分主要由以下3个部分组成; 1.SRAM读取模块;——使用的存
    发表于 10-29 07:10

    AI 驱动三维逆向:点云降噪算法工具与机器学习建模能力的前沿应用

    三维逆向工程领域,传统方法在处理复杂数据和构建高精度模型时面临诸多挑战。随着人工智能(AI)技术的发展,点云降噪算法工具与机器学习建模能力的应用,为三维逆向工程带来了创新性解决方案,显著提升
    的头像 发表于 08-20 10:00 934次阅读
    AI 驱动<b class='flag-5'>三维</b>逆向:点云降噪算法工具与机器<b class='flag-5'>学习</b>建模能力的前沿应用

    解锁水纹,精准溯源!凯米斯科技创新研发光谱+三维荧光技术

    CHEMINS在环境监测领域,水质污染溯源长期面临“发现滞后、定位模糊”的痛点。凯米斯科技以光谱多参数传感器为底座,研发搭载三维荧光光谱技术(水质指纹)方案,犹如为水体装上“DNA检测仪”,通过
    的头像 发表于 07-04 17:11 1247次阅读
    解锁水纹,精准溯源!凯米斯科技创新研发<b class='flag-5'>全</b>光谱+<b class='flag-5'>三维</b>荧光技术

    航天宏图栈式3DGS实景三维重建系统解决方案

    “实景三维中国”作为国家推进数字中国建设、提升空间地理信息服务能力的重要战略性工程,正在深度融入低空经济、智能交通、智慧城市、数字文旅和应急指挥等关键领域。三维重建是实现真实世界“实景三维
    的头像 发表于 06-27 09:28 2113次阅读
    航天宏图<b class='flag-5'>全</b>栈式3DGS实景<b class='flag-5'>三维</b>重建系统解决方案

    VirtualLab:光学系统的三维可视

    摘要 为了对光学系统的性质有一个基本的了解,对其组件的可视和光传播的提示是非常有帮助的。为此,VirtualLab Fusion提供了一个工具来显示光学系统的三维视图。这些工具可以进一步用于检查
    发表于 05-30 08:45