0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

FAIR何恺明团队近日发表神经结构搜索NAS方面的最新力作

DPVg_AI_era 来源:lp 2019-04-19 14:34 次阅读

FAIR何恺明团队近日发表神经结构搜索NAS方面的最新力作,通过随机连接的神经网络,探索了更多样化的连接模式,所提出的RandWire网络ImageNet基准测试中获得了有竞争力的准确度。

用于图像识别的神经网络经过大量的人工设计,已经从简单的链状模型发展到具有多个连接路径的结构。ResNets和DenseNets的成功在很大程度上归功于它们创新的连接规划。

目前,神经结构搜索(NAS)的研究正在探索连接(wiring)与操作类型(operation types)的联合优化,然而,由于可能的连接空间受到限制,尽管采用了神经结构搜索,优化仍然是由人工设计驱动的。

近日,FAIR何恺明等人发表最新论文,探讨了在图像识别中NAS方法的优化。研究人员通过随机连接的神经网络,探索了更多样化的连接模式。

论文地址:

https://arxiv.org/pdf/1904.01569.pdf

作者首先定义了一个随机网络生成器(network generator)的概念,该生成器封装了整个网络生成过程,从而提供了NAS和随机连接网络的统一视图。

然后,研究人员采用三种经典的随机图模型来生成网络的随机连接图。

实验结果令人惊讶:这些随机生成器生成的网络实例在ImageNet基准测试中获得了有竞争力的准确度。

研究人员表示,这些结果表明,专注于设计更好的网络生成器的研究可以通过探索更少约束的搜索空间,为新设计提供更多空间,从而带来新的突破。

不过,该研究被指其思想早已在2013年PCA-Net论文中提出过,在算法设计思想方面没有本质的创新。

何恺明等人的这一新研究到底意义如何?本文对这篇论文进行了译介:

研究概述:网络生成器的设计很重要

今天我们所称的深度学习是从连接主义方法发展起来的,这一范式反映了这样一种假设,即计算网络的连接方式对构建智能机器至关重要。

与这一观点相呼应的是,计算机视觉领域的最新进展是由使用链状连接的模型向更精细的连接模式(如ResNet和DenseNet)的转变所驱动的,这些连接模式之所以有效,在很大程度上是因为它们的连接方式。

在这一趋势的推进中,神经结构搜索(neural architecture search, NAS)已经成为联合搜索连接模式和执行操作方式的一个有前景的方向。NAS方法专注于搜索,同时隐式地依赖于一个重要但常常被忽视的组件——网络生成器(network generator)。

NAS网络生成器定义了一系列可能的连接模式,并根据可学习的概率分布对网络进行采样。然而,就像ResNet和DenseNet中的连接模式一样,NAS网络生成器是手工设计的,允许的连接模式的空间被限制在所有可能的图的一个小的子集中。从这个角度来看,我们会问:如果我们放开这种约束,并设计新的网络生成器,会发生什么?

我们通过随机网络生成器采样的随机连接神经网络来探讨这个问题,其中人工设计的随机过程定义了生成。

图1:随机连接网络的计算图

我们使用了三个经典的随机图模型:Erdos-R˝enyi (ER),Barabasi-Albert (BA),以及Watts-Strogatz (WS)模型。

如图1所示,随机连接网络的三个实例在ImageNet基准测试中分别达到79.1%、79.1%和79.0%的精度,超过了ResNet-50的77.1%。

为了定义完整的网络,我们将一个随机图转换成一个有向无环图(DAG),并应用从节点到其函数角色(例如,到相同类型的卷积)的一个简单映射。

结果令人惊讶:这些随机生成器的几个变体在ImageNet上产生了准确率上具有竞争力的网络。

使用WS模型的最佳生成器生成的多个网络性能优于或可与完全手工设计的同类网络和通过各种神经结构搜索方法找到的网络相媲美。

我们还观察到,对于同一生成器生成的不同随机网络,精度的方差较低,但不同生成器之间存在明显的精度差距。这些观察结果表明,网络生成器的设计很重要。

最后,我们的工作表明,从设计单个网络到设计网络生成器的新过渡是可能的,类似于如何从设计特征过渡到设计学习特征的网络。

我们建议设计新的网络生成器来生成用于搜索的新模型家族,而不是主要关注使用固定生成器进行搜索。设计的网络生成器的重要性还意味着机器学习尚未实现自动化——底层的人工设计只是从网络工程转变到网络生成器工程(network generator engineering)。

研究方法

接下来介绍网络生成器的概念,这是随机连接神经网络的基础。

网络生成器(network generator)

我们定义一个网络生成器为从参数空间Θ到神经网络结构空间N的一个映射g,表示为g:Θ→N。对于一个给定的θ∈Θ,g(θ)返回一个神经网络实例n∈N。N通常是一组相关网络,例如VGG nets、ResNets或DenseNets。

生成器g决定了计算图的连接方式。

随机连接神经网络(Randomly Wired Neural Networks)

对NAS的分析表明,网络生成器是人工设计的,并且是人类知识的先验编码。网络生成器的设计很可能起了相当大的作用,如果是这样的话,目前的方法还没有实现“AutoML”,仍然需要大量的人工。

为了研究生成器设计的重要性,仅比较相同NAS生成器的不同优化器是不够的;有必要研究新的网络生成器,它们与NAS生成器有本质的不同。

这就引出了我们对随机连接神经网络的探索。也就是说,我们将定义网络生成器,这些生成器生成具有随机图的网络,受不同的人类特定先验影响。

我们在研究中使用了三个经典的随机图模型(如上文所述)。生成随机连接网络的方法涉及以下概念:

生成通用的图(general graphs)。

网络生成器首先生成一个general graph,包含一组节点和连接节点的边,而不受限于图和神经网络的对应关系。这允许我们自由地使用图理论中的任意通用图生成器(ER/BA/WS)。一旦生成一个图,它就被映射到一个可计算的神经网络。

边操作(Edge operations)。

假设生成的图是有方向的,我们定义边是数据流,即有向边将数据(张量)从一个节点发送到另一个节点。

节点操作(Node operations)。

有向图中的节点可以具有一些输入边和一些输出边。如图2所示。

图2:节点操作

输入和输出节点。

到目前为止,即使给定边/节点操作,通用图也不是一个有效的神经网络,因为它可能有多个输入节点和多个输出节点。对于典型的神经网络,如图像分类,最好有一个单一的输入和输出。我们应用了一个简单的后处理步骤。

阶段(Stages)。

由于具有唯一的输入和输出节点,一个图就足以表示一个有效的神经网络。然而,特别是在图像分类中,始终保持完整输入分辨率的网络是不可取的。通常的方法是将网络划分为逐步向下采样特征映射的阶段。

表1:RandWire架构

表1总结了我们实验中使用的随机连接神经网络,称为RandWire。网络以一个分类器输出结束(表1,最后一行)。

图1显示了三个随机连接网络样本的完整计算图。

实验和结果

我们对ImageNet 1000类分类任务进行了实验。训练在~1.28M图像的训练集上进行,并在50K验证图像上进行测试。

实验结果如下:

随机生成器

图3

图3比较了小型计算环境中不同生成器的结果:每个RandWire网络有~580M FLOPs。

图4

图4显示了每个生成器的一个示例图。图生成器由随机图模型(ER/BA/WS)及其参数集指定,如ER(0.2)。我们观察到:

所有随机生成器在所有5个随机网络实例上都提供良好的准确度,而且它们没有一个不收敛。

此外,随机网络实例之间的差异很小。图3中的几乎所有随机生成器的标准偏差(std)都为0.2 ~ 0.4%。

Graph damage.

我们通过随机移除一个节点或边来探索Graph damage。

图5

当删除边时,我们评估了精度损失与该边的目标节点的输入程度(图5,底部)。

节点操作

图6

图6显示了图3中列出的每个生成器的平均精度。

结果比较

小型计算设置

表2

表2比较了在较小计算条件下的结果,这是现有NAS论文中研究的一种常见设置

表3

表3比较了RandWire与ResNet和ResNeXt在与ResNet-50/101类似的FLOPs的情况下的性能。RandWire的平均准确率分别比ResNet50和ResNet-101高1.9%和1.3%,比ResNeXt高0.6%。

更大的计算条件

表4

表4比较了在更大计算条件下的结果

COCO对象检测

最后,我们报告了通过微调网络进行COCO对象检测的结果。我们使用Faster R-CNN和FPN作为目标探测器

表5

表5比较了对象检测结果。观察到的趋势与表3中的ImageNet实验相似。这些结果表明,我们的随机连接网络学习到的特征也可以迁移。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4570

    浏览量

    98710
  • NAS
    NAS
    +关注

    关注

    11

    文章

    225

    浏览量

    111860
  • 深度学习
    +关注

    关注

    73

    文章

    5235

    浏览量

    119893

原文标题:何恺明团队神经结构搜索最新力作:设计随机连接网络,效果超ResNet

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    fpga在通信方面的应用

    FPGA在通信方面的应用非常广泛,以下是一些主要的应用场景。
    的头像 发表于 03-27 14:10 179次阅读

    西电郝跃院士团队在超陡垂直晶体管器件研究方面取得重要进展

    近日,西安电子科技大学郝跃院士团队刘艳教授和罗拯东副教授在超陡垂直晶体管器件研究方面取得重要进展,相
    的头像 发表于 02-20 18:22 815次阅读
    西电郝跃院士<b class='flag-5'>团队</b>在超陡垂直晶体管器件研究<b class='flag-5'>方面</b>取得重要进展

    谷歌搜索引擎优化的各个方面和步骤

    或SEMrush等专业工具,来帮助你找到相关的关键字。注意关键字的搜索量和竞争度,选择适合你网站的关键字。 网站结构和链接优化 谷歌搜索引擎优化的一个重要方面是网站
    的头像 发表于 01-25 10:29 287次阅读

    瑞德的创新力从哪来?

    。没有人才,企业就没有创新力,无法激烈的竞争中保持优势。 作为拥有一批高素质人才的瑞德,完备的技术团队和强大的的创新力为企业在金属软磁粉芯领域开拓了一片新的天地。据悉,瑞德的核心团队
    的头像 发表于 01-08 15:02 145次阅读
    瑞德的创<b class='flag-5'>新力</b>从哪来?

    NAS设备及硬盘的选购与安装使用

    面对海量的存储需求难题,众多企业与工作室往往会首选NAS存储解决方案。但市面上NAS设备与硬盘产品繁多,如何组建适合自己的一套NAS系统也常常令人头疼。
    的头像 发表于 01-07 15:39 457次阅读
    <b class='flag-5'>NAS</b>设备及硬盘的选购与安装使用

    穿透局域网访问威联通nas

    背景: 威联通nas 可以自带的myQNAPcloud 云服务,在外网访问内网的威联通nas,如下图 问题 笔者用的时候发现访问速度很慢,访问成功率不高,可能和笔者家里的移动宽带有关,据说电信联通
    发表于 11-16 18:34

    GPS在GIS方面的应用

    电子发烧友网站提供《GPS在GIS方面的应用.pdf》资料免费下载
    发表于 10-23 10:51 0次下载
    GPS在GIS<b class='flag-5'>方面的</b>应用

    笙泉MCU在工控方面的应用

    笙泉MCU在工控方面的应用
    的头像 发表于 09-18 10:56 354次阅读
    笙泉MCU在工控<b class='flag-5'>方面的</b>应用

    交叉导轨具有那些方面的优势?

    交叉导轨具有那些方面的优势?
    的头像 发表于 09-01 17:45 568次阅读
    交叉导轨具有那些<b class='flag-5'>方面的</b>优势?

    Brocade结构视觉技术在灾难恢复方面的优势

    电子发烧友网站提供《Brocade结构视觉技术在灾难恢复方面的优势.pdf》资料免费下载
    发表于 08-30 11:29 0次下载
    Brocade<b class='flag-5'>结构</b>视觉技术在灾难恢复<b class='flag-5'>方面的</b>优势

    卷积神经网络层级结构 卷积神经网络的卷积层讲解

    卷积神经网络层级结构 卷积神经网络的卷积层讲解 卷积神经网络(Convolutional Neural Network,CNN)是一种基于深度学习的
    的头像 发表于 08-21 16:49 4370次阅读

    卷积神经网络模型原理 卷积神经网络模型结构

    卷积神经网络模型原理 卷积神经网络模型结构  卷积神经网络是一种深度学习神经网络,是在图像、语音、文本和视频等
    的头像 发表于 08-21 16:41 658次阅读

    卷积神经网络结构

    卷积神经网络结构 卷积神经网络(Convolutional Neural Network, CNN)是一种前馈神经网络,常用于图像处理、自然语言处理等领域中。它是一种深度学习(Deep
    的头像 发表于 08-17 16:30 880次阅读

    打造快捷安装全新力作,凌科推出锁螺丝款工业连接器新品

    简单,耗时短效率高,是极简快捷安装工业连接器的全新力作。BD系列和LP系列工业防水连接器是凌科两款深受市场欢迎的产品,其中BD系列荣获了德国红点设计奖,其流线型的外
    的头像 发表于 08-17 09:27 307次阅读
    打造快捷安装全<b class='flag-5'>新力作</b>,凌科推出锁螺丝款工业连接器新品

    用树莓派与OpenMediaVault打造自己的NAS

    众所皆知,云端硬盘空间免费的额度有限,真的购买付费服务几年下来也挺伤荷包的。若是买NAS,今日的NAS已添加太多额外功能服务,花了钱不启用功能感觉可惜浪费,但很多功能确实不太受用,实在让人两难。因此,或许自己搭建个简易、阳春的NAS
    的头像 发表于 06-09 11:29 3805次阅读
    用树莓派与OpenMediaVault打造自己的<b class='flag-5'>NAS</b>