0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

告别调参炼丹,使用随机共享权重足矣!

2E1k_gh_baf5b3c 来源:陈年丽 2019-08-28 17:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

谷歌大脑备受关注的“权重无关神经网络”终于开源了!其关键思想是通过不再强调权重来搜索网络结构,仅使用随机共享的权重,也可以执行各种任务的神经网络。终于可以不用调参炼丹了吗?快来复现看看!

神经网络训练中 “权重” 有多重要不言而喻。但谷歌前段时间发表的研究表明,即使抛弃神经网络权重训练,使用随机共享权重,也可以执行各种任务。

他们提出一种新的神经网络结构的搜索方法——权重无关神经网络(Weight Agnostic Neural Networks,WANN),其关键思想是通过不再强调权重来搜索网络结构。

今天,该研究的两位作者、谷歌大脑学生研究员 Adam Gaier和研究科学家David Ha在Google AI博客上撰文,介绍了该研究的核心思想和重要细节,并宣布WANN的代码已经在GitHub上开源,以便让广泛的研究社区重现WANN实验。

告别调参炼丹,使用随机共享权重足矣!

当训练神经网络完成一项给定任务时,无论是图像分类还是强化学习,通常都需要调优与网络中每个连接相关的一组权重。另一种已经取得实质性进展的成功的神经网络创建方法是神经架构搜索,它利用人工设计的组件(如卷积网络组件或transformer blocks)来构建神经网络架构。

研究表明,利用这些组件构建的神经网络结构,如深度卷积网络,对图像处理任务具有很强的归纳偏差,甚至可以在权重随机初始化的情况下执行。虽然神经架构搜索提供了一些新的方法,可以为当前的任务域安排具有已知归纳偏差的手工工程组件,但在自动发现具有此类归纳偏差的新神经网络架构(用于不同的任务域)方面几乎没有进展。

我们可以用一个先天和后天的例子作为类比。正如生物学中某些从出生起就具有反捕食行为的物种一样,他们无需学习就能执行复杂的运动和感官任务,或许我们可以构建一个不需要训练就能很好地完成任务的神经网络。当然,这些自然物种(作为类比,人工神经网络)通过训练可以得到进一步的改善,但它们即使不学习也能执行任务的能力表明,它们包含使它们非常适合于这些任务的偏差。

在“权重无关神经网络”(WANN)论文中,我们提出了搜索具有这类偏差的网络的第一步:即使使用随机共享的权重,也可以执行各种任务的神经网络架构。

我们在这项工作中的动机是,在不学习任何权重参数的情况下,仅神经网络架构能在多大程度上编码给定任务的解决方案。通过探索这样的神经网络架构,我们提出了一种无需学习权重参数就能在其环境中运行良好的智能体。

此外,为了促进该领域的进步,我们还开放了源代码,以便更广泛的研究社区重现我们的WANN实验。

左图:一个手工设计的、完全连接的深度神经网络,有2760个权重连接。利用一种学习算法,我们可以求解2760个权重参数的集合,使该网络能够执行一个双足步行任务(BipedalWalker-v2)。

右图:一个权重无关的神经网络架构,只有44个连接,但同样能够执行双足步行任务。与完全连接网络不同的是, WANN仍然可以执行任务,而不需要训练每个连接的权重参数。实际上,为了简化训练,WANN被设计成在每个权重连接的值相同或共享时执行,甚至就算共享权重参数是随机采样的,也会起作用。

搜索权重无关神经网络

我们从一组最小的神经网络架构候选对象开始,每个候选对象只有很少的连接,并使用一个完善的拓扑搜索算法(NEAT),通过逐个地添加单个连接和单个节点来演化架构。

WANN背后的关键思想是通过不再强调权重来搜索架构。与传统的神经架构搜索方法不同,新架构的所有权重参数都需要使用学习算法进行训练,我们采用了一种更简单、更有效的方法。

在搜索过程中,首先在每次迭代中为所有候选架构分配一个共享权重值,然后进行优化,以便在更宽的共享权重值范围内执行良好。

用于搜索网络拓扑空间的运算符

左:一个最小的网络拓扑结构,输入和输出仅部分连接。

中间:网络的改变有三种方式:

(1)插入节点:通过分割现有连接插入新节点。

(2)添加连接:通过连接两个先前未连接的节点来添加一个新连接。

(3)更改激活:重新分配隐藏节点的激活函数。

右:可能的激活函数(线性,阶跃,正弦, 余弦,高斯,tanh, sigmoid,inverse,绝对值,ReLU)

除了探索一系列与权重无关的神经网络之外,重要的是还要寻找只需要复杂到它们所需的程度的网络架构。我们利用多目标优化技术( multi-objective optimization),同时对网络的性能和复杂度进行优化。

权重无关神经网络搜索的概述,及其相应的网络拓扑空间搜索算子。

训练WANN架构

与传统网络不同的是,我们可以通过简单地找到最佳的单个共享权重参数来训练WANN,从而最大限度地提高其性能。在下面的例子中,可以看到我们的架构(在某种程度上)使用恒定的权重来完成一个 swing-up cartpole 任务:

WANN在不同的权重参数下执行 swing-up cartpole 任务,也使用微调的权重参数。

正如我们在上面的图中看到的,虽然WANN可以使用一系列共享权重参数来执行其任务,但是其性能仍然无法与学习每个连接的权重的网络相比较。

如果我们想进一步提高它的性能,我们可以使用WANN架构和最佳共享权重作为起点,使用学习算法微调每个连接的权重,就像通常训练神经网络的方法一样。以网络架构的权重无关特性为出发点,通过学习微调网络的性能,可能有助于为理解动物如何学习提供有洞察力的类比。

通过在性能和网络简单性方面的多目标优化,我们的方法找到了一个简单的WANN,用于赛车任务,它不需要显式地训练网络的权重。

使用随机权重的网络架构不仅易于训练,还具有其他优势。例如,通过使用相同WANN架构的副本,但是为WANN的每个副本都分配不同的权重值,我们可以为同一任务创建多个不同模型的集合。这种集合通常比单个模型能获得更好的性能。下面是一个MNIST分类器处理随机权重的例子,可以说明这一点:

MNIST分类器进化为处理随机权重。

具有随机初始化的传统网络在 MNIST 上的精度约为 10%,但这种随机权重的特殊网络架构在 MNIST 上的精度 (》 80%) 明显优于随机初始化网络。当使用一组WANNs,为每个WANN分配一个不同的共享权重时,精度提高到 》 90%。

即使不使用集成方法,也可以将网络中的权重值压缩到一个网络,从而使网络能够快速调整。快速调整权重的能力可能在持续的终身学习(lifelong learning)中很有用,在这种学习中,agent在整个生命周期中获得、适应和转移技能。这使得WANN特别适合利用 Baldwin效应, Baldwin效应是一种进化压力,即奖励那些倾向于学习有用行为的个体,而不会陷入“learning to learn”这个昂贵的计算陷阱。

结论

我们希望这项工作可以作为一个垫脚石,帮助发现新的基础神经网络组件,如卷积网络,其发现和应用已经在深度学习领域取得了令人难以置信的进展。自卷积神经网络被发现以来,研究界可用的计算资源显著增加。如果我们将这些资源投入到自动发现神经网络架构中,并希望实现网络架构的突破性改进,那么我们相信,使用新的构建块来搜索也是值得的。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6244

    浏览量

    110263
  • 神经网络
    +关注

    关注

    42

    文章

    4827

    浏览量

    106799

原文标题:“互联网 + 海关”背景下,企业关务系统的选择和应用以及与合规内控的结合

文章出处:【微信号:gh_baf5b3c5005b,微信公众号:通关机器人】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    PID实用方法

    ) 周围抖动 在讲了PI和PD系统的调节方式后,下面分享一下PID系统的调节方式,首先我们先按照PI系统进行调节,先调P在I,让系统有一定的过冲后达到稳定. 在出现了上面的 PI 波形之后,下面就开始调节D,慢慢增加D,将过冲补偿掉,直到系统稳定,最终效果如下图,PID系统就基本调节完成了
    发表于 11-28 07:17

    安信可雷达模组如何快速配网和

    安信可配网助手app介绍 安信可配网助手app是由安信可开发的一款 可拿来对安信可模组进行配网以及对雷达模组进行的APP 。 下面将对APP搭配安信可雷达模组Rd-01、Rd-03_V2
    的头像 发表于 10-31 08:59 245次阅读
    安信可雷达模组如何快速配网和<b class='flag-5'>调</b><b class='flag-5'>参</b>?

    微店关键词搜索接口核心突破:动态权重算法与语义引擎的实战落地

    本文详解微店搜索接口从基础匹配到智能推荐的技术进阶路径,涵盖动态权重、语义理解与行为闭环三大创新,助力商家提升搜索转化率、商品曝光与用户留存,实现技术驱动的业绩增长。
    的头像 发表于 10-15 14:38 231次阅读

    告别数月等待:数字孪生场景生成从此进入“日级”时代

    告别数月等待:数字孪生场景生成从此进入“日级”时代
    的头像 发表于 09-05 17:33 2277次阅读
    <b class='flag-5'>告别</b>数月等待:数字孪生场景生成从此进入“日级”时代

    随机数和伪随机数的区别

    随机数在当前程序运行环境中是一种常用参数,目前主要分为两种,伪随机数和真随机数,本期我们就来讲一下二者的区别。
    的头像 发表于 08-27 17:46 1840次阅读

    用拼多多 API 实现拼多多店铺商品搜索权重提升

    ​ 在电商平台如拼多多上,商品搜索权重直接影响曝光率和销量。权重高的商品更容易出现在搜索结果前列,吸引更多用户点击。通过拼多多 API(应用程序接口),卖家可以自动化优化商品信息,提升搜索权重。本文
    的头像 发表于 08-19 17:23 518次阅读
    用拼多多 API 实现拼多多店铺商品搜索<b class='flag-5'>权重</b>提升

    亚马逊云科技现已上线OpenAI开放权重模型

    客户现可通过Amazon Bedrock和Amazon SageMaker AI使用OpenAI开放权重模型,实现将先进的开放权重模型与全球最广泛云服务的深度集成。 亚马逊云科技首次上线OpenAI
    的头像 发表于 08-06 19:29 673次阅读

    稳压器分与稳压器统的区别

    在电力与电气设备的运行过程中,电压的稳定至关重要。自动调压器作为一种关键设备,能够有效调节电压,确保设备在合适的电压环境下运行。而在自动调压器(稳压器)的应用中,分与统是两种常见的调节模式。理解
    的头像 发表于 07-26 14:54 686次阅读

    微电机关键零部件制造误差对其质量的影响权重分析

    质量影响的权值,最后综合计算出微电机关键零部件制造误差对微电机质量影响的权重。该方法能很好解决不存在尺寸链或复杂尺寸链关系的零部件制造误差对产品质量影响的权值计算问题。 纯分享帖,需要者可点击附件免费
    发表于 06-23 07:16

    告别延迟!Ethernetip转modbustcp网关在熔炼车间监控的极速时代

    告别延迟!Ethernetip转modbustcp网关在熔炼车间监控的极速时代
    的头像 发表于 05-20 19:20 301次阅读
    <b class='flag-5'>告别</b>延迟!Ethernetip转modbustcp网关在熔炼车间监控的极速时代

    HJ55系列三相变频电源 电压可分可统

    HJ55系列三相变频电源是一种高性能的电源设备,广泛应用于工业、科研、测试等领域。它具备分调和统功能,能够满足不同场景下的电压和频率调节需求。以下是关于HJ55系列三相变频电源的分调和统功能
    的头像 发表于 03-26 11:55 2032次阅读
    HJ55系列三相变频电源 电压可分<b class='flag-5'>调</b>可统<b class='flag-5'>调</b>

    AI的“随机性”挑战:它们比人类更“不随机”?

    你有没有想过,人类真的能做出完全随机的选择吗?答案可能出乎你的意料。事实上,人类天生就不擅长“随机”,我们总能在看似无序的事物中发现规律,甚至在本该随机的场景中创造出模式。这种“伪随机
    的头像 发表于 02-20 13:11 1040次阅读
    AI的“<b class='flag-5'>随机</b>性”挑战:它们比人类更“不<b class='flag-5'>随机</b>”?

    BP神经网络的技巧与建议

    BP神经网络的是一个复杂且关键的过程,涉及多个超参数的优化和调整。以下是一些主要的技巧与建议: 一、学习率(Learning Rate) 重要性 :学习率是BP神经网络中最重要
    的头像 发表于 02-12 16:38 1458次阅读

    hyper-v共享,Hyper-V 共享:Hyper-V的资源共享设置

    的解决方案。今天就为大家介绍Hyper-V共享:Hyper-V的资源共享设置。    在Hyper-V虚拟化环境中,资源共享是实现高效管理和灵活部署的关键功能之一。Hyper-V提供了多种资源
    的头像 发表于 02-07 10:26 1837次阅读
    hyper-v<b class='flag-5'>共享</b>,Hyper-V <b class='flag-5'>共享</b>:Hyper-V的资源<b class='flag-5'>共享</b>设置

    LD2410B/C新手必看攻略! 测试教程、模块一文详解~

    关于LD2410B/C那些你不得不知道的事?免费申样、接线教程、参数解析、APP教程、上位机教程、常见异常情况自检等等内容,一文汇总~不管是萌新小白还是资深玩家,都可以快速入门
    的头像 发表于 02-05 18:09 2583次阅读
    LD2410B/C新手必看攻略! 测试教程、模块<b class='flag-5'>调</b><b class='flag-5'>参</b>一文详解~