0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一维与三维卷积流程及在机器视觉中的应用

Dbwd_Imgtec 来源:互联网 作者:佚名 2018-05-03 09:08 次阅读

由于计算机视觉的大红大紫,二维卷积的用处范围最广。因此本文首先介绍二维卷积,之后再介绍一维卷积与三维卷积的具体流程,并描述其各自的具体应用。

1、二维卷积

图中的输入的数据维度为 14 × 14 ,过滤器大小为 5 × 5,二者做卷积,输出的数据维度为 10 × 10( 14 − 5 + 1 = 10 )。

上述内容没有引入channel的概念,也可以说channel的数量为1。如果将二维卷积中输入的channel的数量变为3,即输入的数据维度变为(14 × 14 × 3)。由于卷积操作中过滤器的 channel 数量必须与输入数据的channel数量相同,过滤器大小也变为 5 × 5 × 3 。在卷积的过程中,过滤器与数据在 channel 方向分别卷积,之后将卷积后的数值相加,即执行 10 × 10 次3个数值相加的操作,最终输出的数据维度为 10 × 10 。

以上都是在过滤器数量为1的情况下所进行的讨论。如果将过滤器的数量增加至16,即16个大小为10 × 10 × 3 的过滤器,最终输出的数据维度就变为10 × 10 × 16 。可以理解为分别执行每个过滤器的卷积操作,最后将每个卷积的输出在第三个维度(channel 维度)上进行拼接。

二维卷积常用于计算机视觉、图像处理领域。

2、一维卷积

图中的输入的数据维度为8,过滤器的维度为5。与二维卷积类似,卷积后输出的数据维度为8−5+1=48−5+1=4。

如果过滤器数量仍为1,输入数据的channel数量变为16,即输入数据维度为 8 × 16 。这里channel的概念相当于自然语言处理中的embedding,而该输入数据代表8个单词,其中每个单词的词向量维度大小为16。在这种情况下,过滤器的维度由5变为 5 × 16 ,最终输出的数据维度仍为 4 。

如果过滤器数量为 n,那么输出的数据维度就变为 4 × n。

• 一维卷积常用于序列模型,自然语言处理领域。

3、三维卷积

这里采用代数的方式对三维卷积进行介绍,具体思想与一维卷积、二维卷积相同。

假设输入数据的大小为 a1× a2× a3,channel数为 c,过滤器大小为f,即过滤器维度为 f × f × f × c(一般不写 channel 的维度),过滤器数量为 n。

基于上述情况,三维卷积最终的输出为 ( a1− f + 1 ) × ( a2− f + 1 ) × ( a3− f + 1 ) × n 。该公式对于一维卷积、二维卷积仍然有效,只有去掉不相干的输入数据维度就行。

三维卷积常用于医学领域(CT影响),视频处理领域(检测动作及人物行为)。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器视觉
    +关注

    关注

    161

    文章

    4045

    浏览量

    118368
  • 卷积
    +关注

    关注

    0

    文章

    95

    浏览量

    18410
  • imagination
    +关注

    关注

    1

    文章

    551

    浏览量

    60888

原文标题:卷积神经网络(CNN)之一维卷积、二维卷积、三维卷积详解

文章出处:【微信号:Imgtec,微信公众号:Imagination Tech】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    三维曲线导入到三维图形控件

    三维线条图做了个同心圆曲线,怎么才能把它导入到三维图形控件呢?如图
    发表于 10-27 13:49

    视双目产品高校科研应用的实例及优点分析

    点间的位置偏差,来获取物体三维几何信息的方法。融合两只眼睛获得的图像并观察它们之间的差别,使我们可以获得明显的深度感,建立特征间的对应关系,将同空间物理点在不同图像的映像点对应起来。目前
    发表于 01-19 16:59

    三维逆向工程的成果及应用案例

    专门为制造业提供了个全新、高效的重构手段,实现从实际物体到几何建模的直接转换。逆向工程技术涉及计算机图形学、计算机图像处理、微分几何、概率统计等学科,是CAD领域最活跃的分支之。我公司通过外业的三维
    发表于 03-02 15:12

    三维触控技术突破“二向箔”的束缚

    , AR)三维触摸屏很有潜力成为AR应用中人机交互的基础技术。AR技术,用户佩戴的专用眼镜作为显示屏,通过计算机视觉技术将AR的图像界面与现实世界有机地结合在
    发表于 12-19 15:53

    三维快速建模技术与三维扫描建模的应用

    。基于激光扫描的三维快速建模技术已成为中科院广州电子独具竞争力的数据获取手段之许多应用中都需要用三维扫描技术快速而准确的获取地形与三维
    发表于 08-07 11:14

    广西扫描服务三维检测三维扫描仪

    HandyPRO,便携式专业级Academia三维扫描仪。搭载完全集成的三维软件平台VXelements,将所有基本因素和工具都融入到个简便且流畅的工作环境。并带有扫描至CAD软
    发表于 08-29 14:42

    请问stm32支持三维数组吗?

    请问stm32支持三维数组吗?如何用查表法取值吗?
    发表于 03-26 03:44

    三维设计应用案例

    CAD是目前工业制造产品设计的重要软件之,广泛应用于机械、建筑等领域。而常用的CAD软件,也就是所谓的三维制图软件,较二的图纸和二的绘图软件,
    发表于 07-03 07:06

    Handyscan三维扫描仪对户外大型灯箱三维扫描解决方案

    `近期我们接到个与广告行业相关的客户,他们是家专业设计、改装户外广告灯箱的公司,目前是有个大型户外广告灯箱,想要通过三维扫描,获取其精准的三维
    发表于 07-15 10:52

    三维立体数字沙盘是是什么?

    `  那什么是三维立体数字沙盘呢?三维立体数字沙盘又叫三维数字沙盘、立体数字沙盘,是利用三维技术、地理遥控技术、虚拟现实技术、触控技术等实现的。
    发表于 08-28 14:40

    三维可视化的应用和优势

    的数据体现:将数据的每个信息进行分类、排序、组合和优化,操作界面更加符合人性化操作流程,数据多个属性或者变量视图更加直观。  数据信息展示更加直观:大数据在三维可视化运维系统,是可以通过应用
    发表于 12-02 11:52

    如何导入机械臂的三维模型

    目的   本文手把手教你如何在 Mathematica 软件搭建机械臂的三维仿真环境,包括以下几部分:   1. 如何导入机械臂的三维模型;   2. 如何进行(正/逆)运动学仿真;   3.
    发表于 09-07 09:25

    广州三维动画制作流程

    进行的规划与设计,主要包括:文学剧本创作、分镜头剧本创作、造型设计、场景设计。其次是三维动画片段制作,根据前期设计,计算机通过相关制作软件制作出动画片段,制作流程为建模、材质、灯光
    发表于 12-30 10:06

    安徽三维动画制作和二动画有哪些区别呢?(

    三维动画制作,“”这个字,是个几何学和空间理论的基本概念。构成空间的每个要素,如长度、宽度、高度,被称之为
    发表于 01-22 10:02

    安徽三维动画制作和二动画有哪些区别呢?(

    动画制作制作和三维动画制作除了按照在制作过程摄像机或者虚拟摄像机是否可以任意进行旋转的区别外,主流的二动画制作(不包括平面材料动画制作)和
    发表于 01-25 10:34