0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

传统卷积运算,有了一种全新的替代方法

DPVg_AI_era 来源:lp 2019-05-01 08:36 次阅读

Facebook AI、新加坡国立大学、360 人工智能研究院的研究人员提出一种新的卷积操作OctConv,可以直接替代传统卷积,持续提高图像和视频识别任务的精度,同时降低内存和计算成本。

传统卷积运算,有了一种全新的替代方法。

近日,Facebook AI、新加坡国立大学、360人工智能研究院的研究人员提出一种新的卷积操作——Octave Convolution (OctConv)。

论文地址:

https://export.arxiv.org/pdf/1904.05049

其中,论文一作陈云鹏现于新加坡国立大学读博士,师从颜水成和冯佳时,两人也是这篇论文的作者。其他作者来自Facebook AI。

作者表示,OctConv 是一种即插即用的卷积单元,可以直接替代传统的卷积,而无需对网络架构进行任何调整。

在自然的图像中,信息以不同的频率传递,其中较高的频率通常以精细的细节编码,较低的频率通常以全局结构编码。

类似地,卷积层的输出特征图也可以看做是不同频率的信息的混合。

在这项工作中,作者提出将混合特征映射根据其频率进行分解,并设计了一种全新的卷积运算:Octave Convolution (OctConv),用以存储和处理在较低空间分辨率下空间变化 “较慢” 的特征图,从而降低了内存和计算成本。

Octave 一词表示 “八音阶” 或 “八度”,音乐里降 8 个音阶表示频率减半。通过降低低频特征的分辨率,从而节省内存和计算。

实验表明,通过简单地用OctConv 替代卷积,我们可以持续提高图像和视频识别任务的精度,同时降低内存和计算成本。

采用 OctConv 的 ResNet-152 仅用 22.2 GFLOPs 就能在 ImageNet 上实现 82.9% 的top-1 分类精度。

完美替代传统卷积,即插即用无需调参

卷积神经网络 (CNNs) 在许多计算机视觉任务中都取得了显著的成功,并且随着最近的研究在降低密集模型参数和特征图通道维数的固有冗余,它们的效率不断提高。然而,CNN 生成的特征图在空间维度上也存在大量冗余,其中每个位置独立存储自己的特征描述符,忽略了可以一起存储和处理的相邻位置之间的公共信息。

图 1:(a) 动机。视觉的空间频率模型的相关研究表明,自然图像可以分解为低空间频率和高空间频率两个部分。(b) 卷积层的输出图也可以根据其空间频率进行分解和分组。(c) 所提出的多频特征表示将平滑变化的低频映射存储在低分辨率张量中,以减少空间冗余。(d) 所提出的 Octave Convolution 直接作用于这个表示。它会更新每个组的信息,并进一步支持组之间的信息交换。

如图 1(a) 所示,自然图像可以分解为描述平稳变化结构的低空间频率分量和描述快速变化的精细细节的高空间频率分量。

类似地,我们认为卷积层的输出特征映射也可以分解为不同空间频率的特征,并提出了一种新的多频特征表示方法,将高频和低频特征映射存储到不同的组中,如图 1(b) 所示。因此,通过相邻位置间的信息共享,可以安全地降低低频组的空间分辨率,减少空间冗余,如图 1(c) 所示。

为了适应新的特征表示,我们提出 Octave Convolution (OctConv),它接收包含两个频率的特征映射,并直接从低频映射中提取信息,而无需解码回到高频,如图 1(d) 所示。

作为传统卷积的替代,OctConv 消耗的内存和计算资源都大大减少。此外,OctConv利用相应的 (低频) 卷积处理低频信息,有效地扩大了原始像素空间的感受野,从而提高识别性能。

我们以一种通用的方式设计 OctConv,使它成为卷积的替代,而且即插即用。由于OctConv 主要侧重于处理多空间频率的特征映射并减少其空间冗余,它与现有的方法是相交且互补的,现有的方法侧重于构建更好的 CNN 拓扑结构,减少卷积特征映射中的信道冗余和密集模型参数中的冗余。

此外,与利用多尺度信息的方法不同,OctConv 可以很容易地部署为即插即用单元,以替代卷积,而不需要改变网络结构或需要超参数调优。

我们的实验证明,通过简单地用 OctConv 代替传统卷积,可以持续提高流行的 2D CNN 模型的 ImageNet 图像识别性能,包括 ResNet ResNeXt, DenseNet, MobileNet,以及 SE-Net。

采用 OctConv 的 Oct-ResNet-152 超过了手工设计的 state-of-the-art 网络,并且所需的内存和计算成本更低。

我们的贡献可以总结如下:

我们提出将卷积特征映射分解成不同空间频率的两个组,并分别以相应的频率处理不同的卷积,相隔一个八度 (octave)。由于可以降低低频图的分辨率,因此能够节省存储和计算。这也有助于每一层获得更大的感受野,以捕获更多的上下文信息。

我们设计了一种即插即用的运算,名为 OctConv,用来代替传统的卷积运算。OctConv直接对新的特征表示进行运算,减少了空间冗余。更重要的是,OctConv 在实践中速度很快,达到了接近理论极限的加速。

我们广泛研究了所提出的 OctConv 在用于图像和视频任务的各种骨干 CNN 上的特性,并获得了显著的性能提高,甚至可以与最好的 AutoML 网络相媲美。

Octave Convolution:方法详解

octave feature representation 减少了空间冗余,比原始表示更加紧凑。然而,由于输入特征的空间分辨率不同,传统卷积不能直接对这种表示进行操作。

避免这个问题的一种简单方法是将低频部分上采样到原始的空间分辨率,将它与连接起来,然后进行卷积,这将导致额外的计算和内存开销。

为了充分利用紧凑的多频特征表示,我们提出 Octave Convolution,它可以直接在分解张量上运行,而不需要任何额外的计算或内存开销。

传统卷积(Vanilla Convolution)

表示一个 k×k 卷积核,表示输入张量和输出张量。中的每个 feature map 可以下面的公式计算:

式中 (p, q) 为位置坐标,

定义了一个局部邻域。

Octave Convolution.

我们的设计目标是有效地处理相应频率张量中的低频和高频分量,同时使我们的 Octave特征表示的高频分量和低频分量之间能够有效地通信

设 X, Y 为分解输入和输出张量。那么输出的高频和低频特征映射将由 给出。

Octave Convolution 的设计细节。绿色箭头表示信息更新,红色箭头表示两个频率之间的信息交换。

Octave Convolution kernel。k×k Octave 卷积核与普通卷积核等价,即二者具有完全相同的参数量。

实验和评估

在实验和评估部分,我们验证了 Octave Convolution 在 2D 和 3D 网络中的有效性和效率。

我们分别进行了 ImageNet 上图像分类的研究,然后将其与目前最先进的方法进行了比较。

然后,我们用 Kinetics-400 和 dynamics 600 数据集,证明所提出的 OctConv 也适用于 3D CNN。

图 4:ImageNet 上的结果

如图 4 所示,采用 OctConv 的模型比基线模型更有效、更准确。图中每条线的黑色标记表示不采用 OctConv 的相应基线模型的精度。

表 2:ResNet-50 的结果

表 4:ImageNet 分类精度

表 5:小型模型的 ImageNet 分类精度

表 6:中型模型的 ImageNet 分类精度

表 7:大型模型的 ImageNet 分类精度

表 8:视频动作识别的结果

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4572

    浏览量

    98746
  • 图像识别
    +关注

    关注

    8

    文章

    447

    浏览量

    37908
  • Facebook
    +关注

    关注

    3

    文章

    1428

    浏览量

    54033

原文标题:完美代替传统卷积!Facebook等提出全新卷积操作OctConv,速度接近理论极限

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    verilog实现卷积运算

    在Verilog中实现卷积运算,你可以使用以下示例代码。这里假设输入数据是符号8位数,输出数据也是符号8位数。卷积在数字信号处理中通常指
    发表于 03-26 07:51

    基于labview的卷积运算

    就是信号与系统里面的相关运算,比如卷积什么的可以用labview做吗?
    发表于 03-09 14:33

    FFT 算法的一种 FPGA 实现

    本帖最后由 lee_st 于 2017-11-22 08:28 编辑 摘 要: FFT 运算在OFDM 系统中起调制和解调的作用。针对OFDM 系统中FFT 运算的要求, 研究一种
    发表于 11-21 15:55

    一种使用无源RFID替代EEPROM代码芯片来存储血糖试纸的方法介绍

    使用新的试纸时忘记更换代码芯片部件的风险。本文详细介绍一种使用无源RFID替代EEPROM代码芯片,来存储血糖试纸的有效期等重要信息的方法
    发表于 07-26 08:17

    各位大佬,求一种全新的测量熔融金属温度的方法

    请问大神分享一种全新的测量熔融金属温度的方法
    发表于 04-15 06:57

    一种在FPGA上实现单精度浮点加法运算方法

    介绍一种在FPGA上实现的单精度浮点加法运算器,运算器算法的实现考虑FPGA器件本身的特点,算法处理流程的拆分和模块的拆分,便于流水设计的实现。
    发表于 04-29 06:27

    Nexar如何为FPGA设计提供一种全新方法

     本文概述开发这种系统所必须面对的各种设计挑战,并讲解了Altium公司的最新电子设计环境Nexar如何为FPGA设计提供一种全新方法。这种方法
    发表于 05-08 06:02

    一种伺服电机的控制方法

    本发明涉及机械控制技术领域,尤其涉及一种伺服电机的控制方法。背景技术:随着机械控制领域的高速发展,对于伺服电机的需要也日益增加,因此对于伺服 电机的控制已引起越来越多人的重视。目前传统的伺服电机
    发表于 09-03 08:53

    一种基于FPGA的图神经网络加速器解决方案

    应用到GNN。下图展示个相对简单的GNN架构。 图1:典型的GNN架构但是,GNN中的图形数据卷积计算与传统CNN中的二维卷积计算不同。
    发表于 09-25 17:20

    一种运算放大器温度指示及报警电路的设计方法

    的利用自己所学的知识。本文介绍一种运算放大器温度指示及报警电路的设计方法,本电路主要由四运算放大器LM324、热敏电阻、LED发光二极管、蜂鸣器等元器件组成,并利用热敏电阻阻值随着温度
    发表于 11-12 06:04

    探索一种降低ViT模型训练成本的方法

    效的专用硬件或更高效的数据表示,如半精度。另一种正交方法是开发更有效的算法。在本文中,重点讨论第二种方法。已经开发了许多方法(例如剪枝)来降低推理成本,但数量有限的工作正在探索降低训练
    发表于 11-24 14:56

    利用卷积调制构建一种新的ConvNet架构Conv2Former

    1、利用卷积探索一种更高效的编码空域特征的方式  本文旨在通过充分利用卷积探索一种更高效的编码空域特征的方式:通过组合ConvNet与ViT的设计理念,本文利用
    发表于 12-19 17:37

    简谈卷积—幽默笑话谈卷积

    分享。据说卷积这种运算式物理学家发明的,在实际中用得不亦乐乎,而数学家却直没有把运算的意义彻底搞明白。仔细品下,还是
    发表于 05-25 18:08

    《 AI加速器架构设计与实现》+第卷积神经网络观后感

    连接块是一种模块,通常用于深度卷积神经网络中,特别是在残差网络(Residual Network,ResNet)中广泛使用,也是我比较熟悉的。组卷积块是一种
    发表于 09-11 20:34

    一种全新的深亚微米IC设计方法

    一种全新的深亚微米IC设计方法 本文分析了传统IC设计流程存在的一些缺陷,并且提出了一种基于Logical Effort理论的
    发表于 12-27 13:28 621次阅读
    <b class='flag-5'>一种</b><b class='flag-5'>全新</b>的深亚微米IC设计<b class='flag-5'>方法</b>