0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

【连载】深度学习笔记10:三维卷积、池化与全连接

人工智能实训营 2018-10-25 20:09 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群


在上一讲中,我们对卷积神经网络中的卷积操作进行了详细的解读,但仅仅是对二维图像,即通道数为 1 的图像(灰度图)进行了卷积,对于三维或者更高维的图像卷积显然并没有这么简单。

如果图像大小为 6*6*3,那么这里的 3 指的是三个颜色通道,你可以将其理解为 3 个 6*6 的图像的堆叠,如果要对此图像进行卷积的话,我们的滤波器也需要变成三维的,假设采用一个 3*3*3 的滤波器对其进行卷积(这里需要注意的是,滤波器的通道数一定要等于输入图像的通道数),根据 ((n+2p-f)/s)+1 的计算公式我们可以知道输出图像的大小为 4*4*1,由一个滤波器进行卷积之后输出图像的通道不是 3 而是 1 了。


那么究竟如何理解三通道的卷积过程?单通道的卷积操作我们已经知道,就是直接对感受野与滤波器进行元素相乘求和,那三通道呢?我们可以将 3*3*3 的滤波器想象为一个三维的立方体,为了计算立方体滤波器在输入图像上的卷积操作,我们首先将这个三维的滤波器放到左上角,让三维滤波器的 27 个数依次乘以红绿蓝三个通道中的像素数据,即滤波器的前 9 个数乘以红色通道中的数据,中间 9 个数乘以绿色通道中的数据,最后 9 个数乘以蓝色通道中的数据。将这些数据加总起来,就得到输出像素的第一个元素值。如下图所示:


这样做可能还不够。在实际图像处理中,仅靠单滤波器很难将复杂的图像特征进行充分提取。所以,通常而言,我们用来进行卷积的滤波器远不止一个。下面我们用两个滤波器对上述图像进行卷积操作。


我们用第一个滤波器进行卷积得到一个 4*4 的输出,然后用第二个滤波器进行卷积又得到一个 4*4 的输出,将这个输出放到第一个输出后面,形成了一个 4*4*2 的输出,这里的 2 的就是滤波器的个数。

关于多通道卷积的另一种理解类似于 DNN 中的标准神经网络中的 Z=Wx+b 的线性计算,其中 x 为输入的原始图像,W 为滤波器,b 偏差项,卷积过程就类似与标准神经网络的线性计算,完了之后利用激活函数进行激活。还有一个关键问题就是卷积层有多少参数,卷积层的参数通常在于滤波器 W,根据滤波器的大小,我们可以计算一个滤波器的参数数量为 f*f*nc,其中 nc 为通道熟量,那 k 个滤波器所含的参数数量则为 f*f*nc*k

卷积过程到此就差不多解释完了。我们再看 CNN 的另一个重要操作——池化(pooling)。简单来说,池化层是用来缩减模型大小,提高模型计算速度以及提高所提取特征的鲁棒性。池化操作通常有两种,一种是常用的最大池化(max pooling),另一种是不常用的平均池化(average pooling)。池化操作过程也非常简单,假设池化层的输入为一个 4*4 的图像,我们用最大池化对其进行池化,执行最大池化的树池是一个 2*2 的矩阵,执行过程就是将输入矩阵拆分为不同区域,对于 2*2 的输出而言,输出的每个元素都是其对应区域的最大元素值。


最大池化过程就像是应用了一个 2*2 的滤波器以步幅 2 进行区域最大化输出操作。所以简单而言,池化的参数就是滤波器的大小 f 和步幅 s,池化的效果就相当于对输入图像的高度和宽度进行缩小。值得注意的是,最大池化只是计算神经网络某一层的静态属性,中间并没有什么学习过程。

池化完成之后就是标准神经网络中的全连接层了。全连接层我们在 DNN 中有详细介绍,这里就不再赘述。总之,一个典型的卷积层通常包括卷积层-池化层和全连接层。

下一讲中,我们将一起尝试如何利用 numpy 实现一个简单的典型的卷积神经网络。

本文由《自兴动脑人工智能》项目部 凯文 投稿。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4827

    浏览量

    106797
  • 人工智能
    +关注

    关注

    1813

    文章

    49736

    浏览量

    261535
  • 卷积神经网络

    关注

    4

    文章

    371

    浏览量

    12716
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    OFDR技术与三维重构的协同价值

    概述OFDR分布式光频域反射技术具有光纤传感器体积小、重量轻、测试精度高的特性,能够精准捕捉结构各位置的微小应变或温度变化。三维重构软件可作为连接数据与实际应用的结构——通过颜色映射将数据直观呈现在三维
    的头像 发表于 11-14 17:36 1113次阅读
    OFDR技术与<b class='flag-5'>三维</b>重构的协同价值

    一文读懂 | 三维视觉领域国家级制造业单项冠军——先临三维的品牌布局

    ,推动高精度三维视觉技术的普及应用。2024年,先临三维营业收入超12亿元,业务遍及全球100+个国家和地区。 先临三维的高精度三维视觉技术深度
    的头像 发表于 11-11 14:55 274次阅读
    一文读懂 | <b class='flag-5'>三维</b>视觉领域国家级制造业单项冠军——先临<b class='flag-5'>三维</b>的品牌布局

    CNN卷积神经网络设计原理及在MCU200T上仿真测试

    CNN算法简介 我们硬件加速器的模型为Lenet-5的变型,网络粗略分共有7层,细分共有13层。包括卷积,最大层,激活层,扁平层,连接
    发表于 10-29 07:49

    数据复用高性能层设计思路分享

    大家好,本团队此次分享的内容为可实现数据复用高性能层设计思路,核心部分主要由以下3个部分组成; 1.SRAM读取模块;——使用的存
    发表于 10-29 07:10

    AI 驱动三维逆向:点云降噪算法工具与机器学习建模能力的前沿应用

    三维逆向工程领域,传统方法在处理复杂数据和构建高精度模型时面临诸多挑战。随着人工智能(AI)技术的发展,点云降噪算法工具与机器学习建模能力的应用,为三维逆向工程带来了创新性解决方案,显著提升
    的头像 发表于 08-20 10:00 450次阅读
    AI 驱动<b class='flag-5'>三维</b>逆向:点云降噪算法工具与机器<b class='flag-5'>学习</b>建模能力的前沿应用

    解锁水纹,精准溯源!凯米斯科技创新研发光谱+三维荧光技术

    CHEMINS在环境监测领域,水质污染溯源长期面临“发现滞后、定位模糊”的痛点。凯米斯科技以光谱多参数传感器为底座,研发搭载三维荧光光谱技术(水质指纹)方案,犹如为水体装上“DNA检测仪”,通过
    的头像 发表于 07-04 17:11 856次阅读
    解锁水纹,精准溯源!凯米斯科技创新研发<b class='flag-5'>全</b>光谱+<b class='flag-5'>三维</b>荧光技术

    航天宏图栈式3DGS实景三维重建系统解决方案

    “实景三维中国”作为国家推进数字中国建设、提升空间地理信息服务能力的重要战略性工程,正在深度融入低空经济、智能交通、智慧城市、数字文旅和应急指挥等关键领域。三维重建是实现真实世界“实景三维
    的头像 发表于 06-27 09:28 1075次阅读
    航天宏图<b class='flag-5'>全</b>栈式3DGS实景<b class='flag-5'>三维</b>重建系统解决方案

    VirtualLab:光学系统的三维可视

    摘要 为了对光学系统的性质有一个基本的了解,对其组件的可视和光传播的提示是非常有帮助的。为此,VirtualLab Fusion提供了一个工具来显示光学系统的三维视图。这些工具可以进一步用于检查
    发表于 05-30 08:45

    CASAIM与荣耀达成三维数字检测技术合作

    近期,CASAIM与荣耀终端股份有限公司就终端消费电子产品的三维数字检测展开深度合作,双方合作的首个项目将聚焦手机中框制造环节,借助三维数字
    的头像 发表于 05-16 18:06 794次阅读

    南方测绘推出实景三维中国整体解决方案

    新型基础测绘与实景三维中国建设持续推进,南方测绘深度聚焦,基于自主研发的SmartGIS平台,打造以地理实体数据为核心的“生产、处理、质检、管理、可视化分析”实景三维系列产品,提供
    的头像 发表于 03-26 16:44 1058次阅读

    casaim自动三维激光扫描

    CASAIM自动三维激光扫描技术通过非接触式高精度数据采集与智能分析系统,为工业检测提供流程数字化解决方案。
    的头像 发表于 02-27 10:32 657次阅读

    三维测量在医疗领域的应用

    三维测量在医疗领域的应用十分广泛,为医疗诊断、治疗及手术规划等提供了重要的技术支持。以下是对三维测量在医疗领域应用的分析: 一、医学影像的三维重建与分析 CT、MRI等影像的三维重建
    的头像 发表于 12-30 15:21 1091次阅读

    三维测量软件的使用技巧

    需要哪些功能,如点云处理、三维建模、数据分析等。 软件兼容性 :确保软件能够与现有的硬件设备兼容,如三维扫描仪、CAD软件等。 用户界面 :选择界面直观、操作简便的软件,以减少学习成本。 技术支持和社区 :选择有良好技术
    的头像 发表于 12-30 15:05 1349次阅读

    南方智能SmartGIS Inspec实景三维质检软件介绍

    新型基础测绘与实景三维中国建设持续推进,南方测绘集团旗下南方智能深度聚焦,基于自主研发的SmartGIS平台,打造以地理实体数据为核心的“生产、处理、质检、管理、可视化分析”实景三维系列软件,提供
    的头像 发表于 12-27 11:20 1944次阅读

    三维扫描与建模的区别 三维扫描在工业中的应用

    数据。这一过程是自动的,能够快速捕捉物体的三维信息。 三维建模 :则需要专业建模师使用三维建模软件,从无到有地创建三维模型。建模师可以根据
    的头像 发表于 12-19 14:55 1568次阅读