一种利用强化学习来设计mobile CNN模型的自动神经结构搜索方法-电子发烧友网

神经结构自动搜索是最近的研究热点。谷歌大脑团队最新提出在一种在移动端自动设计CNN模型的新方法，用更少的算力，更快、更好地实现了神经网络结构的自动搜索。

为移动设备设计卷积神经网络（CNN）模型是很具挑战性的，因为移动设备的模型需要小，要快，而且仍然要求准确性。尽管在这三个维度上设计和改进模型已经有很多研究，但由于需要考虑如此多的结构可能性，手动去权衡这些维度是很有挑战性的。

在这篇论文中，谷歌大脑AutoML组的研究人员提出一种自动神经结构搜索方法，用于设计资源有限的移动端CNN模型（mobile CNN）。

Jeff Dean在推特推荐了这篇论文：这项工作提出将模型的计算损失合并到神经结构搜索的奖励函数中，以自动找到满足推理速度目标的高准确率的模型。

在以前的工作中，移动延迟（mobile latency）通常是通过另一个代理（例如FLOPS）来考虑的，这些代理经常不准确。与之前的工作不同，在我们的实验中，我们通过在特定平台（如Pixel phone）上执行模型，从而直接测量实际的推理延迟（inference latency）。

为了进一步在灵活性和搜索空间大小之间取得平衡，我们提出了一种新的分解分层搜索空间（factorized hierarchical search space），允许在整个网络中的层存在多样性。

实验结果表明，我们的方法在多个视觉任务中始终优于state-of-the-art的移动端CNN模型。在ImageNet图像分类任务中,我们的模型在Pixel phone上达到74.0%的top-1 精度（延迟为76ms）。达到相同的top-1精度的条件下，我们的模型比MobileNetV2快1.5倍，比NASNet快2.4倍。在COCO对象检测任务中，我们的模型实现了比MobileNets更高的mAP质量和更低的延迟。

Platform-Aware神经结构搜索

具体来说，我们提出一种用于设计移动端的CNN模型的自动神经结构搜索方法，称之为Platform-Aware神经结构搜索。图1是Platform-Aware神经结构搜索方法的总体视图，它与以前的方法的主要区别在于延迟感知多目标奖励（latency aware multi-objective reward）和新的搜索空间。

图1：Platform-Aware神经结构搜索的概览

这一方法主要受到两个想法的启发：

首先，我们将设计神经网络的问题表述为一个多目标优化问题，这个问题要考虑CNN模型的准确性和推理延迟。然后，我们使用基于强化学习的结构搜索来找到在准确性和延迟之间实现最佳权衡的模型。

其次，我们观察到先前的自动化结构搜索方法主要是搜索几种类型的cells，然后通过CNN网络反复堆叠相同的cell。这样搜索到的模型没有考虑由于模型的具体形状不同，卷积之类的操作在延迟上有很大差异：例如，2个3x3的卷积具有同样的理论FLOPS，但形状不同的情况下，可能 runtime latency是不同的。

在此基础上，我们提出一个分解的分层搜索空间（factorized hierarchical search space），它由很多分解后的块（factorized blocks）组成，每个block包含由分层子搜索空间定义的层的list，其中包含不同的卷积运算和连接。

图3：Factorized Hierarchical搜索空间

我们证明了，在一个架构的不同深度应该使用不同的操作，并且可以使用利用已测量的推理延迟作为奖励信号一部分的架构搜索方法来在这个巨大的选择空间中进行搜索。

总结而言，这一研究的主要贡献有：

我们提出一种基于强化学习的多目标神经结构搜索方法，该方法能够在低推理延迟的条件下找到高精度的CNN模型。

我们提出一种新的分解分层搜索空间（factorized hierarchical search space），通过在灵活性和搜索空间大小之间取得适当的平衡，最大限度地提高移动设备上模型的资源效率。

我们在ImageNet图像分类和COCO对象检测两个任务上，证明了我们的模型相对state-of-the-art的mobile CNN模型有显著改进。

MnasNet的结构

图7：MnasNet的结构

图7的(a)描绘了表1所示的baseline MnasNet的神经网络结构。它由一系列线性连接的blocks组成，每个block由不同类型的layer组成，如图7(b) - (f)所示。此外，我们还观察到一些有趣的发现:

MnasNet有什么特别之处呢？

为了更好地理解MnasNet模型与之前的 mobile CNN模型有何不同，我们注意到这些模型包含的5x5 depthwise的卷积比以前的工作（Zhang et al.1188; Huang et al.1188; Sandler et al.1188）的更多，以前的工作一般只使用3x3 的kernels。实际上，对于depthwise可分离的卷积来说，5×5 kernels 确实比3×3 kernels更具资源效率。

layer的多样性重要吗？

表3

我们将MnasNet与它的在整个网络中重复单一类型的层的变体进行了比较。如表3所示，MnasNet比这些变体在精度和延迟之间的权衡表现更好，这表明在资源有限的CNN模型中，layer的多样性相当重要。

实验结果

ImageNet分类性能

我们将所提出的方法应用于ImageNet图像分类和COCO对象检测任务。

表1展示了本模型在ImageNet上的性能。

表1：在ImageNet上进行分类的性能结果

本文将MnasNet模型与手动设计的移动模型以及其它自动化方法做了比较，其中MnasNet是基准模型。MnasNet-65和MnasNet-92是同一体系结构搜索实验中不同延迟的两种模型(用于比较)。其中，“+SE”表示附加的squeeze-and-excitation优化；“#Parameters”表示可训练参数的数量；“#Mult-Adds”表示每张图片multiply-add操作的数量；“Top-1/5 Acc.”表示在ImageNet验证集上排名第一或前五的精度；“CPU延迟”表示在Pixel1手机上批量大小为1的推断延迟。

如表1所示，与当前最优的MobileNetV2相比，我们的MnasNet模型在Pixel phone平台上，在同样的延迟下，将ImageNet top-1的准确率提高了2%。

此外，限制目标top-1准确率的条件下，我们的方法得到同样精度的速度比MobileNetV2快1.5倍，比NASNet快2.4倍。

结构搜索方法

多目标搜索方法通过在方程2中对α和β设置不同的值来设置硬性或软性延迟约束。下图展示了在典型α和β下多目标搜索的结果：

多目标搜索结果

其中，目标延迟（target latency）为T=80ms。上方图片展示了对1000个样本模型（绿色点）的柏拉图曲线（蓝色线）；下方图片展示了模型延迟的直方图。

模型扩展的灵敏度

现实世界中，各式各样的应用程序有着许多不同的需求，并且移动设备也不是统一的，所以开发人员通常会做一些扩展性方面的工作。下图便展示了不同模型扩展技术的结果：

不同模型扩展技术的性能比较

MnasNet表1中的基准模型。将该基准模型与MobileNet V2的深度倍增器（depth multiplier）和输入保持一致。

除了模型扩展之外，本文提出的方法还能为任何新的资源约束搜索新的结构。例如，一些视频应用程序可能需要低至25ms的模型延迟。为了满足这些约束，可以使用更小的输入规模和深度倍增器来扩展一个基准模型，也可以搜索更适合这个新延迟约束的模型。图6就展示了上述两个方法的性能比较。

模型扩展 vs. 模型搜索

COCO目标检测性能

对于COCO目标检测，选择与表1相同的MnasNet模型作为SSDLite的特征提取器。根据其他研究人员的建议，只用本文提出的模型与其他SSD或YOLO探测器进行比较。表2展示了在COCO上MnasNet模型的性能。

表2：在COCO上进行目标检测的性能结果

其中，“#Parameters”表示可训练参数的数量；“#Mult-Adds”表示每张图片multiply-add操作的数量；mAP表示在test-dev2017上的标准MAP值；mAPS、mAPM、mAPL表示在小型、中等、大型目标中的MAP值；“CPU延迟”表示在Pixel1手机上批量大小为1的推断延迟。

如表2所示，将我们的模型作为特征提取器插入SSD对象检测框架，在COCO数据集上我们的模型在推理延迟和mAP质量上都比MobileNetV1和MobileNetV2有提升，并且达到与 SSD300差不多的mAP质量时（22.9 vs 23.2）计算成本降低了35倍。

结论

本文提出了一种利用强化学习来设计mobile CNN模型的自动神经结构搜索方法。这种方法背后的关键想法是将platform-aware的真实的延迟信息集成到搜索过程中，并利用新的分解分层搜索空间来搜索移动模型，在准确性和延迟之间进行最佳的权衡。我们证明了这一方法可以比现有方法更好地自动地找到移动模型，并在典型的移动推理延迟约束下，在ImageNet图像分类和COCO对象检测任务上获得新的最优结果。由此产生的MnasNet架构还提供了一些有趣的发现，将指导我们设计下一代的mobile CNN模型。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4572

浏览量
98743
数据集

数据集

+关注

关注
4

文章
1178

浏览量
24349
强化学习

强化学习

+关注

关注
4

文章
259

浏览量
11114

渐进式神经网络结构搜索技术

我们提出一种学习卷积神经网络（CNN）结构的新方法，该方法

发表于 08-03 09:32 •5247次阅读

神经网络解决方案让自动驾驶成为现实

制造业而言，深度学习神经网络开辟了令人兴奋的研究途径。为了实现从诸如高速公路全程自动驾驶仪的短时辅助模式到专职无人驾驶旅行的自动驾驶，汽车制造业一

发表于 12-21 17:11

人工智能深度学习发展迅速，智能科技公司都已经涉足人工智能产品的研发！

,Deep Learning—迁移学习5,Deep Learning—深度强化学习6，深度学习的常用模型或者方法深度

发表于 09-05 10:22

反向强化学习的思路

强化学习的另一种策略（二）

发表于 04-03 12:10

深度强化学习实战

内容2:课程一： TensoRFlow入门到熟练：课程二：图像分类：课程三：物体检测：课程四：人脸识别：课程五：算法实现：1、卷积神经网络CNN2、循环神经网络RNN3、

发表于 01-10 13:42

卷积神经网络模型发展及应用

十余年来快速发展的崭新领域，越来越受到研究者的关注。卷积神经网络（CNN）模型是深度学习模型中最重要的一

发表于 08-02 10:39

简单随机搜索：无模型强化学习的高效途径

没有设计目标函数的最佳方法，并且模型是分段线性的。只要机器人的任何部位碰到坚硬物体，模型就会变化，因此会出现此前没有的作用于机器人的法向力。于是，让机器人无需处理复杂的非凸非线性模型而

发表于 04-01 09:35 •4218次阅读

自动神经结构搜索方法实现高效率卷积神经网络设计

一种自动神经结构搜索方法，用于设计资源有限的移动端CNN

发表于 08-07 14:12 •5034次阅读

一种改进的深度神经网络结构搜索方法

为提升网络结构的寻优能力，提岀一种改进的深度神经网络结构搜索方法。针对网络结构间距难以度量的问题

发表于 03-16 14:05 •3次下载

机器学习中的无模型强化学习算法及研究综述

模型化强化学习（Mode- based reinforcement Lear-ning）和无模型强化学习（ Model- ree reirη forcement Learning）。

发表于 04-08 11:41 •11次下载

模型化深度强化学习应用研究综述

化强化学习。无模型强仳学习方法的训练过程需要大量样本，当采样预算不足，无法收集大量样本时，很难达到预期效果。然而，模型化强化学习可以充分

发表于 04-12 11:01 •9次下载

基于深度强化学习仿真集成的压边力控制模型

压边为改善板料拉深制造的成品质量，釆用深度强化学习的方法进行拉深过程旳压边力优化控制。提岀一种基于深度强化学习与有限元仿真集成的压边力控制模型

发表于 05-27 10:32 •0次下载

《自动化学报》—多Agent深度强化学习综述

多Agent 深度强化学习综述来源：《自动化学报》，作者梁星星等摘要近年来,深度强化学习(Deep reinforcement learning,DRL) 在诸多复杂序贯决策问题中取得巨大

发表于 01-18 10:08 •1252次阅读

cnn卷积神经网络算法 cnn卷积神经网络模型

cnn卷积神经网络算法 cnn卷积神经网络模型卷积神经网络(

发表于 08-21 17:15 •1171次阅读

cnn卷积神经网络简介 cnn卷积神经网络代码

cnn卷积神经网络简介 cnn卷积神经网络代码卷积神经网络（Convolutional Neural Network，简称

发表于 08-21 17:16 •2025次阅读