0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

复合模型扩展:一种更好的扩展CNN的方法

WpOh_rgznai100 来源:lq 2019-07-18 15:47 次阅读

开发一个卷积神经网络(CNN)的成本通常是固定的。在获得更多资源时,我们通常会按比例进行扩展,以便获得更优的准确性。例如,ResNet可以通过增加层数从ResNet-18扩展到ResNet-200,最近,GPipe 网络通过将基准 CNN 模型扩展四倍,在 ImageNet Top-1 上获得了 84.3% 的准确度。在模型扩展方面的操作通常是任意增加 CNN 的深度或宽度,或者在更大输入图像分辨率上进行训练和评估。虽然这些方法确实提高模型了准确性,但它们通常需要繁琐的手工调整,而且还不一定能找到最优的结构。换言之,我们是否能找到一种扩展设计方法来获得更好的准确性和效率呢?

在 Google 的 ICML 2019 论文“EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks”中,作者提出了一种新的模型尺度缩放方法,该方法使用简单且高效的复合系数以更结构化的方式来扩展 CNN。 与任意缩放网络尺寸的传统方法(例如宽度、深度和分辨率)不同,本文使用一个固定的缩放系数集合,均匀地缩放每个维度。 借助这种新的缩放方法和在AutoML 方面的最新进展,Google 开发了一系列称为 EfficientNets 的模型,它超越了 SOTA 的精度,并且将效率提高了10倍(更小、更快)。

复合模型扩展:一种更好的扩展 CNN 的方法

为了理解扩展网络的效果,本文系统地研究了扩展模型不同维度带来的影响。虽然扩展各个维度可以提高模型性能,但作者观察到,平衡网络宽度、深度和输入图像大小这些维度比增加计算资源,可以更好地提高整体性能。

复合扩展方法的第一步是执行网格搜索,用来找到在固定资源下基准网络不同扩展维度之间的关系。这决定了上文提到的每个维度的缩放系数。然后,作者用这些系数将基准网络扩展到所需的目标模型大小或预算的计算力。

不同缩放方法的比较。 与传统仅缩放单个维度的方法(b)-(d)不同,我们的复合缩放方法以某种方式统一扩展所有维度。

与传统的缩放方法相比,这种复合缩放方法可以用于提高多个模型的准确性和效率,如MobileNet(+ 1.4%图像网精度)和ResNet(+ 0.7%)。

高效的网络架构

模型缩放的有效性也在很大程度上依赖于基准网络。 因此,为了进一步提高性能,作者使用了 AutoML MNAS 框架(该框架在准确性和效率上都做了优化),利用神经架构搜索来开发新的基准网络。 由此产生的架构使用了移动端的逆向 bottleneck 卷积(MBConv),类似于 MobileNetV2 和 MnasNet,但由于有更多的 FLOP 预算,因此结构略大。最终,作者扩展了这个基准网络以获得一系列模型,称为 EfficientNets。

本文的基准网络 EfficientNet-B0,其架构简单干净,便于扩展。

EfficientNet 网络的性能

文中将 EfficientNets 与 ImageNet 上其他现有的 CNN 进行了比较。 总的来说,EfficientNet 模型实现了比现有 CNN 更高的精度和更高的效率,将参数大小和 FLOPS 降低了一个数量级。 例如,在高精度下,EfficientNet-B7 在 ImageNet 上达到了 SOTA 的Top-1,84.4% 的准确率与 Top-5 97.1% 的准确率,同时在 CPU 上的开销比之前的 Gpipe 小 8.4 倍和 6.1 倍。与广泛使用的 ResNet-50 相比,EfficientNet-B4 在保持相同 FLOPS 开销情况下,将 Top-1 的精度从ResNet-50 的 76.3% 提高到 82.6%(+ 6.3%)。

模型尺寸与精度比较。 EfficientNet-B0 是由 AutoML MNAS 开发的基准网络,而 Efficient-B1 到 B7 是通过扩展基准网络得到。特别是,EfficientNet-B7 实现了 SOTA 的 Top-1,84.4% 准确率与 Top-5,97.1% 的准确率,同时比现有最佳的 CNN 小 8.4 倍。

尽管 EfficientNets 在 ImageNet 上表现较好,但为了验证它的泛化能力,也应该在其他数据集上进行测试。 为了评估这一点,作者在八个广泛使用的迁移学习数据集上测试了EfficientNets。EfficientNets 在 8 个数据集中的 5 个中实现了 SOTA 的精度,例如 CIFAR-100(91.7%)和 Flowers(98.8%),模型参数减少了一个数量级(减少了21倍),这表明EfficientNets 也能很好的进行迁移。

由于 EfficientNets 显著提高了模型效率,作者预计它可能在未来会成为计算机视觉任务的新基础。 因此,作者开源了所有 EfficientNet 模型。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10442

    浏览量

    206537
  • 神经网络
    +关注

    关注

    42

    文章

    4572

    浏览量

    98743
  • cnn
    cnn
    +关注

    关注

    3

    文章

    327

    浏览量

    21297

原文标题:谷歌开源新模型EfficientNet,或成计算机视觉任务新基础

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    IN100 MP Tool 扩展功能开发

    扩展功能
    橙群微电子
    发布于 :2023年02月21日 12:12:14

    一种基于路测数据的传播模型校正方法

    准确性等问题,提出了一种利用现网路测数据进行传播模型校正的方法.从理论上证明了路测信号可以替代连续波测试信号用于传播模型校正,通过增加路测次数和利用历史数据、邻区数据等
    发表于 04-23 11:52

    请问这两机械手模型哪种实验性能更好,可扩展更好

    `我打算买个六轴机械手模型用来验证自动运行算法,但不知道从机械角度上来来说哪种实验性能更好,可扩展更好,这两都是数字舵机带动的。麻烦给出
    发表于 07-15 17:00

    大家是怎么压榨CNN模型

    【技术综述】为了压榨CNN模型,这几年大家都干了什么
    发表于 05-29 14:49

    一种新的扩展探头带宽以提高信号保真度的方法介绍

    ,消除DDR BGA探头探测效应后的裕量可用于设计中容限更低的元器件。本文将介绍一种新的、可扩展DDR BGA探头带宽的探头校正方法,以增加信号完整性测试的裕量,并最大程度降低DDR BGA探头引起的误差。
    发表于 07-23 07:10

    一种扩展的嵌入式网络平台的解决方案

    一种扩展的嵌入式网络平台的解决方案
    发表于 05-26 07:10

    一种基于扩展反电动势的永磁同步电机无位置控制算法

    一种基于扩展反电动势的永磁同步电机无位置控制算法,全部C语言 编写,含有矢量控制大部分功能(弱磁,解耦,过调制,死区补偿等),为了方便学习和工作,该产品结合S-Function进行仿真,且属于量产
    发表于 08-27 07:04

    一种基于扩展反电动势的永磁同步电机无位置控制算法

    一种基于扩展反电动势的永磁同步电机无位置控制算法,全部C语言 编写,含有矢量控制大部分功能(弱磁,解耦,过调制,死区补偿等)为了方便学习和工作,该产品结合S-Function进行仿真,且属于量产产品
    发表于 08-27 07:30

    如何利用simulink去设计一种四则运算仿真模型

    STM32扩展工具怎样去安装并使用呢?如何利用simulink去设计一种四则运算仿真模型
    发表于 11-19 06:28

    探索一种降低ViT模型训练成本的方法

    其上的实验来评估性能,当每次实验的训练成本过高时,这不是一种扩展方法。通过降低训练成本,缩短了开发周期。2 更容易接近。大多数ViT模型都是通过使用多个GPU或TPU从头开始训练的
    发表于 11-24 14:56

    语音带宽扩展的激励分段扩展方法

    语音带宽扩展通过人为恢复窄带语音的频谱带宽来提高语音听觉质量。针对源滤波器扩展模型的激励扩展问题,提出一种分段
    发表于 11-29 16:29 0次下载
    语音带宽<b class='flag-5'>扩展</b>的激励分段<b class='flag-5'>扩展</b><b class='flag-5'>方法</b>

    基于语义向量表示的查询扩展方法的应用设计

    针对传统查询扩展方法在专业领域中扩展词与原始查询之间缺乏语义关联的问题,提出一种基于语义向量表示的查询扩展
    发表于 12-12 16:11 0次下载

    基于扩展状态空间模型扩展非最小状态空间模型方法电子书免费下载

    本书的目的是(1)提出新的扩展状态空间模型和基于扩展非最小状态空间模型模型预测控制(MPC)、预测函数控制(PFC)、PID控制优化以及相
    发表于 04-26 08:00 0次下载
    基于<b class='flag-5'>扩展</b>状态空间<b class='flag-5'>模型</b>和<b class='flag-5'>扩展</b>非最小状态空间<b class='flag-5'>模型</b>的<b class='flag-5'>方法</b>电子书免费下载

    基于狄利克雷过程的可扩展高斯混合模型

    ,以提升其可解释性。此外,对高斯混合模型的推理过程进行优化,给出一种基于批次处理方式的可扩展变分推理算法,求解图像去噪中所有隐变量的变分后验分布,实现先验学习。实验结果表明,该模型在图
    发表于 04-29 11:17 7次下载
    基于狄利克雷过程的可<b class='flag-5'>扩展</b>高斯混合<b class='flag-5'>模型</b>

    结合基扩展模型和深度学习的信道估计方法

    结合基扩展模型和深度学习的信道估计方法
    发表于 06-30 10:43 62次下载