0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

卷积网络最新研究:通过AutoML和模型规模化提升精度与效率

nlfO_thejiangme 来源:YXQ 2019-06-04 17:26 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

卷积网络的部署通常在固定资源的情况下进行,如果想要提高精度就需要更多的资源来部署更大、更深的网络。实际应用中,人们可以把ResNet-18拓展到ResNet-200增加层数提高精度,谷歌近期提出的GPipe也利用提升规模的方法在ImageNet上实现了84.3%的top-1精度

Gpipe模型与ResNet不同规模的模型

对于扩大模型的规模,通常的做法是增加卷积网络的深度或宽度,或者利用更大的输入分辨率来训练和测评。虽然能够大幅度提升精度,但需要复杂的手工调校来进行优化。

那么我们能不能找到一种更为通用的方法来使扩大CNNs的规模以得到更好的精度和速度呢?谷歌在今年的ICML会议上给出了一种可行的解决方案。研究中提出了一种名为EfficientNet,通过简单高效地混合系数来结构化地扩大CNNs的规模。与先前提高网络维度参数不同,这种新的方法不会去调整宽度、深度和分辨率,而是利用固定的规模系数集均匀化地对每个维度进行扩增。

基于这种规模化方法和自动机器学习,研究人员开发出了新的网络家族EfficientNets,不仅在精度上超过了前辈,更在效率上有了10倍的提升。

混合模型规模化—扩大CNNs规模的好方法

研究人员首先系统地分析了不同维度上的规模化对于模型的影响。

在深度、宽度和分辨率等维度上记性扩充后的模型效果提升,但单个维度在达到80%后很快趋近于饱和。

分别对于不同的维度进行规模化后,研究人员发现对于网络宽度、深度和图像分辨率等所有维度的平衡下对于模型的表现提升最好。所以混合而不是单一的改变模型的规模是提升性能的较好选择。混合规模化方法的第一步是进行栅格搜索,在固定资源限制的条件下寻找不同规模维度下的关系。这将为不同的维度寻找适宜的规模化系数来实现最好的效果。随后利用这些搜索到的系数来对基准网络进行扩充,在给定的计算资源和模型大小下实现目标模型。

上图显示了不同规模化的方法,与先前的方法不同,新提出的混合规模化方法在所有的维度上进行了规模化提升。

实验表明这种混合规模化方法比mobileNet(+1.4%)和ResNet(+0.7%)都有提升。

EfficientNet架构

前述的模型在规模化的时候依然高度依赖于基础网络模型。所以为了更好的提高模型的表现,研究人员提出了新型基准网络模型。利用自动机器学习框架来进行神经架构搜索,同时优化了精度和效率(FLOPS)。

最终的架构类似MobileNetV2和MnasNet,使用了移动反转瓶颈卷积结构(mobile inverted bottleneck),但在规模上有些许扩大。基于这一基础网络,研究人员利用不同的扩充方式得到了规模化的网络家族EfficientNets。

简单的基准模型更容易扩展和规模化

EfficientNet的表现

为了测试模型的性能,研究人员在ImageNet上对现有的先进模型与EfficientNet进行了比较,结果表明EfficientNet在精度和效率上都超过了现有的模型,甚至在相同精度下将模型参数和操作减小了一个数量级。

在下图中可以看到,在左上角的高精度区域,B7型EfficientNet在ImageNet上达到了84.4%的top-1精度和97.1%的top-5精度,但与先前的GPipe相比在CPU上的运行使用的参数减小了8.4倍同时速度提升了6.1倍。与广泛使用的ResNet-50相比,相同参数的情况下提升了6.3%的top-1精度。

结果显示了新的模型家族在精度与效率上的优势。

此外,为了验证模型的其他数据集上的表现,研究人员还将模型迁移到了CIFAR-100和Flowers上,EfficientNet在参数减少一个数量级(21x)的情况下在8个测试数据集中的5个上取得了最好的精度,证明了这一方法具有稳定的泛化能力。这种新的模型有望成为计算机视觉任务的新基准,研究人员开源了所有的代码,同时可以看在这里找到基于TPU的加速实现

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6245

    浏览量

    110271
  • 卷积网络
    +关注

    关注

    0

    文章

    43

    浏览量

    3164

原文标题:谷歌最新研究EfficientNet,通过AutoML和模型规模化提升精度与效率

文章出处:【微信号:thejiangmen,微信公众号:将门创投】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    CNN卷积神经网络设计原理及在MCU200T上仿真测试

    CNN算法简介 我们硬件加速器的模型为Lenet-5的变型,网络粗略分共有7层,细分共有13层。包括卷积,最大池层,激活层,扁平层,全连接层。下面是各层作用介绍:
    发表于 10-29 07:49

    构建CNN网络模型并优化的一般建议

    通过实践,本文总结了构建CNN网络模型并优化的一般建议,这些建议将会在构建高准确率轻量级CNN神经网络
    发表于 10-28 08:02

    卷积运算分析

    的数据,故设计了ConvUnit模块实现单个感受域规模卷积运算. 卷积运算:不同于数学当中提及到的卷积概念,CNN神经网络中的
    发表于 10-28 07:31

    在Ubuntu20.04系统中训练神经网络模型的一些经验

    , batch_size=512, epochs=20)总结 这个核心算法中的卷积神经网络结构和训练过程,是用来对MNIST手写数字图像进行分类的。模型将图像作为输入,通过
    发表于 10-22 07:03

    提升钙钛矿太阳能电池环境稳定性与效率:基于Sb³⁺/S²⁻合金FAPbI₃的策略研究

    钙钛矿太阳能电池(PSCs)因其卓越的光电转换效率而受到广泛关注,大多数高效PSCs仍需在惰性气氛(如充氮手套箱)中制备,在一定程度上限制了其商业化生产的规模化发展。通过两步法在环境条件下研发高效
    的头像 发表于 09-10 09:04 441次阅读
    <b class='flag-5'>提升</b>钙钛矿太阳能电池环境稳定性与<b class='flag-5'>效率</b>:基于Sb³⁺/S²⁻合金<b class='flag-5'>化</b>FAPbI₃的策略<b class='flag-5'>研究</b>

    新型储能正从规模化扩张走向效能提升

    电子发烧友网综合报道 在全球能源转型与“双碳”目标的双重驱动下,新型储能正从技术探索阶段迈入规模化发展的关键时期。作为保障能源安全、促进新能源消纳的核心支撑,我国新型储能产业已形成技术多元、规模领先
    的头像 发表于 09-10 07:10 5884次阅读

    软通动力如何推动工业AI规模化落地

    近日,在2025世界人工智能大会(WAIC 2025)“AI数算 重构智造产链生态”2025智能趋势论坛上,软通动力集团咨询与数字创新服务线联席总裁李国亮受邀出席圆桌对话:《智造“最后一公里”》——工业AI落地的关键路径与生态协同,深入剖析了工业AI规模化落地的核心挑战
    的头像 发表于 07-30 17:27 859次阅读

    飞腾CPU在济南机场实现规模化应用

    近日,随着暑运大幕正式开启,民航自主可控领域再传捷报。中国航信和飞腾成功支持山东航空完成在济南机场自助柜机软硬件系统升级,实现了自助柜机百分百国产。这也是飞腾CPU在航空公司离港应用市场的首次规模化商业推广落地。
    的头像 发表于 07-10 15:43 704次阅读

    模型推理显存和计算量估计方法研究

    (如全连接层、卷积层等)确定所需的显存大小; (3)将各层显存大小相加,得到模型总的显存需求。 基于神经网络剪枝的显存估计 神经网络剪枝是一种减少
    发表于 07-03 19:43

    广和通加速5G+AI规模化应用

    规模化发展与丰富的行业应用,这也为AI提供连接血脉和数字通道。5G提供高带宽、低时延的确定性网络能力,支撑AI终端实时控制与数据增量训练。
    的头像 发表于 06-12 09:36 2622次阅读

    AgiBot World Colosseo:构建通用机器人智能的规模化数据平台

    AgiBot World Colosseo:构建通用机器人智能的规模化数据平台 随着人工智能在语言处理和计算机视觉领域取得突破,机器人技术仍面临现实场景泛能力的挑战。这一困境的核心在于高质量机器人
    的头像 发表于 03-12 11:42 1696次阅读
    AgiBot World Colosseo:构建通用机器人智能的<b class='flag-5'>规模化</b>数据平台

    如何使用MATLAB实现一维时间卷积网络

    本文对一维卷积操作进行介绍,包括一维扩展卷积和一维因果卷积,以及 MATLAB 对一维卷积的支持情况。在最后通过一个实例演示如何在 MATL
    的头像 发表于 03-07 09:15 1684次阅读
    如何使用MATLAB实现一维时间<b class='flag-5'>卷积</b><b class='flag-5'>网络</b>

    BP神经网络卷积神经网络的比较

    多层。 每一层都由若干个神经元构成,神经元之间通过权重连接。信号在神经网络中是前向传播的,而误差是反向传播的。 卷积神经网络(CNN) : CNN主要由
    的头像 发表于 02-12 15:53 1324次阅读

    如何通过地物光谱仪提升生态研究精度

    在生态研究中,准确的数据收集和分析是理解生态系统动态和健康状况的关键。地物光谱仪作为一种先进的遥感工具,可以显著提升生态研究精度。本文将探讨地物光谱仪在生态
    的头像 发表于 01-10 13:44 619次阅读
    如何<b class='flag-5'>通过</b>地物光谱仪<b class='flag-5'>提升</b>生态<b class='flag-5'>研究</b>的<b class='flag-5'>精度</b>?

    AI模型部署边缘设备的奇妙之旅:目标检测模型

    的是百度的Picodet模型,它是一种基于深度卷积网络(DNN)的轻量级目标检测模型,具有非常高的检测精度,可以在低算力设备进行实时的端到端
    发表于 12-19 14:33