0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器学习全靠调参?谷歌发布颠覆性研究

新机器视觉 来源:YXQ 2019-06-16 09:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

机器学习全靠调参?这个思路已经过时了。

谷歌大脑团队发布了一项新研究:

只靠神经网络架构搜索出的网络,不训练,不调参,就能直接执行任务。

这样的网络叫做WANN,权重不可知神经网络。

它在MNIST数字分类任务上,未经训练和权重调整,就达到了92%的准确率,和训练后的线性分类器表现相当。

除了监督学习,WANN还能胜任许多强化学习任务

团队成员之一的大佬David Ha,把成果发上了推特,已经获得了1300多赞:

那么,先来看看效果吧。

效果

谷歌大脑用WANN处理了3种强化学习任务。

(给每一组神经元,共享同一个权重。)

第一项任务,Cart-Pole Swing-Up。

这是经典的控制任务,一条滑轨,一台小车,车上一根杆子。

小车在滑轨的范围里跑,要把杆子从自然下垂的状态摇上来,保持在直立的位置不掉下来。

(这个任务比单纯的Cart-Pole要难一些:

Cart-Pole杆子的初始位置就是向上直立,不需要小车把它摇上来,只要保持就可以。)

难度体现在,没有办法用线性控制器 (Linear Controller) 来解决。每一个时间步的奖励,都是基于小车到滑轨一头的距离,以及杆子摆动的角度

WANN的最佳网络 (Champion Network) 长这样:

它在没有训练的状态下,已经表现优异:

表现最好的共享权重,给了团队十分满意的结果:只用几次摆动便达到了平衡状态。

第二项任务,Bipedal Waker-v2。

一只两足“生物”,要在随机生成的道路上往前走,越过凸起,跨过陷坑。奖励多少,就看它从出发到挂掉走了多长的路,以及电机扭矩的成本(为了鼓励高效运动) 。

每条腿的运动,都是由一个髋关节、和一个膝关节来控制的。有24个输入,会指导它的运动:包括“激光雷达”探测的前方地形数据,本体感受到的关节运动速度等等。

比起第一项任务中的低维输入,这里可能的网络连接就更多样了:

所以,需要WANN对从输入到输出的布线方式,有所选择。

这个高维任务,WANN也优质完成了。

你看,这是搜索出的最佳架构,比刚才的低维任务复杂了许多:

它在-1.5的权重下奔跑,长这样:

第三项任务,CarRacing-v0

这是一个自上而下的 (Top-Down) 、像素环境里的赛车游戏。

一辆车,由三个连续命令来控制:油门、转向、制动。目标是在规定的时间里,经过尽可能多的砖块。赛道是随机生成的。

研究人员把解释每个像素 (Pixel Interpretation) 的工作交给了一个预训练的变分自编码器 (VAE) ,它可以把像素表征压缩到16个潜在维度。

这16维就是网络输入的维度。学到的特征是用来检测WANN学习抽象关联 (Abstract Associations) 的能力,而不是编码不同输入之间显式的几何关系。

这是WANN最佳网络,在-1.4共享权重下、未经训练的赛车成果:

虽然路走得有些蜿蜒,但很少偏离跑到。

而把最佳网络微调一下,不用训练,便更加顺滑了:

总结一下,在简单程度和模块化程度上,第二、三项任务都表现得优秀,两足控制器只用了25个可能输入中的17个,忽略了许多LIDAR传感器和膝关节的速度。

WANN架构不止能在不训练单个权重的情况下完成任务,而且只用了210个网络连接(Connections) ,比当前State-of-the-Art模型用到的2804个连接,少了一个数量级。

做完强化学习,团队又瞄准了MNIST,把WANN拓展到了监督学习的分类任务上。

一个普通的网络,在参数随机初始化的情况下,MNIST上面的准确率可能只有10%左右。

而新方法搜索到的网络架构WANN,用随机权重去跑,准确率已经超过了80%

如果像刚刚提到的那样,喂给它多个权值的合集,准确率就达到了91.6%

对比一下,经过微调的权重,带来的准确率是91.9%,训练过的权重,可以带来94.2%的准确率。

再对比一下,拥有几千个权重的线性分类器:

也只是和WANN完全没训练、没微调、仅仅喂食了一些随机权重时的准确率相当。

论文里强调,MINST手写数字分类是高维分类任务。WANN表现得非常出色。

并且没有哪个权值,显得比其他值更优秀,大家表现得十分均衡:所以随机权重是可行的

不过,每个不同的权重形成的不同网络,有各自擅长分辨的数字,所以可以把一个拥有多个权值的WANN,用作一个自给自足的合集 (Self-Contained Ensemble) 。

实现原理

不训练权重参数获得极高准确度,WANN是如何做到的呢?

神经网络不仅有权重偏置这些参数,网络的拓扑结构、激活函数的选择都会影响最终结果。

谷歌大脑的研究人员在论文开头就提出质疑:神经网络的权重参数与其架构相比有多重要?在没有学习任何权重参数的情况下,神经网络架构可以在多大程度上影响给定任务的解决方案。

为此,研究人员提出了一种神经网络架构的搜索方法,无需训练权重找到执行强化学习任务的最小神经网络架构。

谷歌研究人员还把这种方法用在监督学习领域,仅使用随机权重,就能在MNIST上实现就比随机猜测高得多的准确率。

论文从架构搜索、贝叶斯神经网络、算法信息论、网络剪枝、神经科学这些理论中获得启发。

为了生成WANN,必须将权重对网络的影响最小化,用权重随机采样可以保证最终的网络是架构优化的产物,但是在高维空间进行权重随机采样的难度太大。

研究人员采取了“简单粗暴”的方法,对所有权重强制进行权重共享(weight-sharing),让权重值的数量减少到一个。这种高效的近似可以推动对更好架构的搜索。

操作步骤

解决了权重初始化的问题,接下来的问题就是如何收搜索权重不可知神经网络。它分为四个步骤:

1、创建初始的最小神经网络拓扑群。

2、通过多个rollout评估每个网络,并对每个rollout分配不同的共享权重值。

3、根据性能和复杂程度对网络进行排序。

4、根据排名最高的网络拓扑来创建新的群,通过竞争结果进行概率性的选择。

然后,算法从第2步开始重复,在连续迭代中,产生复杂度逐渐增加的权重不可知拓扑(weight agnostic topologies )。

拓扑搜索

用于搜索神经网络拓扑的操作受到神经进化算法(NEAT)的启发。在NEAT中,拓扑和权重值同时优化,研究人员忽略权重,只进行拓扑搜索操作。

上图展示了网络拓扑空间搜索的具体操作:

一开始网络上是最左侧的最小拓扑结构,仅有部分输入和输出是相连的。

然后,网络按以下三种方式进行更改:

1、插入节点:拆分现有连接插入新节点。

2、添加连接:连接两个之前未连接的节点,添加新连接。

3、更改激活函数:重新分配隐藏节点的激活函数。

图的最右侧展示了权重在[2,2]取值范围内可能的激活函数,如线性函数、阶跃函数、正弦余弦函数、ReLU等等。

权重依然重要

WANN与传统的固定拓扑网络相比,可以使用单个的随机共享权重也能获得更好的结果。

虽然WANN在多项任务中取得了最佳结果,但WANN并不完全独立于权重值,当随机分配单个权重值时,有时也会失败。

WANN通过编码输入和输出之间的关系起作用,虽然权重的大小的重要性并不高,但它们的一致性,尤其是符号的一致性才是关键。

随机共享权重的另一个好处是,调整单个参数的影响变得不重要,无需使用基于梯度的方法。

强化学习任务中的结果让作者考虑推广WANN方法的应用范围。他们又测试了WANN在图像分类基础任务MNIST上的表现,结果在权重接近0时效果不佳。

有Reddit网友质疑WANN的结果,对于随机权重接近于0的情况,该网络的性能并不好,先强化学习实验中的具体表现就是,小车会跑出限定范围。

对此,作者给出解释,在权重趋于0的情况下,网络的输出也会趋于0,所以后期的优化很难达到较好的性能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6244

    浏览量

    110244
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136227

原文标题:谷歌发布颠覆性研究:不训练不调参,AI自动构建超强网络,告别炼丹一大步

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    恭贺!同星智能TSMaster项目荣获2025全国颠覆性技术创新大赛优胜奖

    近日,同星智能凭借“软硬件解耦、快速迭代、可不断被软件定义的汽车电子基础工具链”项目,荣膺2025全国颠覆性技术创新大赛优胜奖。这是同星智能在获得金辑奖、AITX领航创新技术奖、测量与标定技术奖后
    的头像 发表于 11-07 20:05 355次阅读
    恭贺!同星智能TSMaster项目荣获2025全国<b class='flag-5'>颠覆性</b>技术创新大赛优胜奖

    安信可雷达模组如何快速配网和

    安信可配网助手app介绍 安信可配网助手app是由安信可开发的一款 可拿来对安信可模组进行配网以及对雷达模组进行的APP 。 下面将对APP搭配安信可雷达模组Rd-01、Rd-03_V2
    的头像 发表于 10-31 08:59 243次阅读
    安信可雷达模组如何快速配网和<b class='flag-5'>调</b><b class='flag-5'>参</b>?

    倾佳电子Hydrogen Rectifier制氢电源拓扑、技术演进与SiC功率模块的颠覆性作用

    倾佳电子Hydrogen Rectifier制氢电源拓扑、技术演进与SiC功率模块的颠覆性作用 倾佳电子(Changer Tech)是一家专注于功率半导体和新能源汽车连接器的分销商。主要服务于中国
    的头像 发表于 09-05 10:37 422次阅读
    倾佳电子Hydrogen Rectifier制氢电源拓扑、技术演进与SiC功率模块的<b class='flag-5'>颠覆性</b>作用

    工业设备远程监控的“颠覆性突破”:边缘计算网关让千里之外如在眼前

    工业设备远程监控的“颠覆性突破”:边缘计算网关让千里之外如在眼前 随着工业领域对智能化、数字化管理需求的不断攀升,工业设备远程监控成为提升生产效率、降低运维成本的重要手段,蓝蜂网关凭借专业技术与丰富
    的头像 发表于 08-05 15:37 476次阅读

    边缘计算如何颠覆人工智能变革

    2025年以来,DeepSeek发布的大模型热度居高不下,再次点燃了全球对人工智能的无限热情。深度学习模型以指数级速度膨胀,性能不断突破极限,成本效益也在向着更低的趋势发展,这为各行各业带来了颠覆性
    的头像 发表于 05-30 09:29 828次阅读

    谷歌发布混合量子模拟方法

    据外媒报道,谷歌发布了一种混合量子模拟方法;论文已经在Nature正式发表,谷歌混合量子模拟器的核心在于将模拟和数字技术相结合;是全新的模拟-数字方案,可在保持速度的同时增强可控制
    的头像 发表于 04-22 17:17 654次阅读

    谷歌第七代TPU Ironwood深度解读:AI推理时代的硬件革命

    、架构设计的颠覆性创新 ​ 首款推理专用TPU ​ Ironwood是谷歌TPU系列中首款完全针对AI推理优化的芯片,标志着AI硬
    的头像 发表于 04-12 11:10 2884次阅读
    <b class='flag-5'>谷歌</b>第七代TPU Ironwood深度解读:AI推理时代的硬件革命

    颠覆传统,智启未来——复合机器人导航功能开启智能协作新时代

    在智能制造、智慧物流高速发展的今天,机器人正从“单一执行者”向“全能协作专家”蜕变。而复合机器人导航功能作为这一变革的核心引擎,正以颠覆性的技术突破重新定义行业标准。它不仅解决了传统机器
    的头像 发表于 03-10 16:11 541次阅读

    BP神经网络的技巧与建议

    BP神经网络的是一个复杂且关键的过程,涉及多个超参数的优化和调整。以下是一些主要的技巧与建议: 一、学习率(Learning Rat
    的头像 发表于 02-12 16:38 1454次阅读

    LD2410B/C新手必看攻略! 测试教程、模块一文详解~

    关于LD2410B/C那些你不得不知道的事?免费申样、接线教程、参数解析、APP教程、上位机教程、常见异常情况自检等等内容,一文汇总~不管是萌新小白还是资深玩家,都可以快速入门
    的头像 发表于 02-05 18:09 2572次阅读
    LD2410B/C新手必看攻略! 测试教程、模块<b class='flag-5'>调</b><b class='flag-5'>参</b>一文详解~

    无压缩机和制冷剂!海尔智家3获颠覆性科技最高奖

    效率会骤降甚至失效。 海尔智家针对供暖领域的技术探索,迎来了颠覆性突破。近日在工信部主办的第13届中国创新创业大赛颠覆性技术创新大赛上,凭借无压缩机、无制冷剂的“极低温室效应高效大温跨热声热泵”项目,海尔智家成功
    的头像 发表于 12-24 17:32 991次阅读
    无压缩机和制冷剂!海尔智家3获<b class='flag-5'>颠覆性</b>科技最高奖

    《具身智能机器人系统》第1-6章阅读心得之具身智能机器人系统背景知识与基础模块

    Intelligence)这一概念有了深入理解。本书开篇和大部分书籍文章一样,都是立足宏观角度,先把视角引申到世界经济形势。书中阐述具身智能机器人有望成为继计算机、智能手机后的新一代颠覆性产品。2005-2010年
    发表于 12-19 22:26

    依托Chiplet&amp;高性能RDMA,奇异摩尔斩获全国颠覆性技术创新大赛(未来制造领域赛)优胜奖

        近日,第十三届中国创新创业大赛颠覆性技术创新大赛(未来制造领域赛)获奖结果出炉,奇异摩尔参赛项目【基于Chiplet+RDMA技术的下一代万卡AI集群的全栈式互联解决方案】荣获优胜奖
    的头像 发表于 12-19 09:39 1997次阅读
    依托Chiplet&amp;高性能RDMA,奇异摩尔斩获全国<b class='flag-5'>颠覆性</b>技术创新大赛(未来制造领域赛)优胜奖

    谷歌发布“深度研究”AI工具,利用Gemini模型进行网络信息检索

    据外媒最新报道,谷歌近期发布了一款名为“深度研究”的先进AI工具。这款工具借助其内部的Gemini大型语言模型,实现了对网络信息的高效检索与深度挖掘,进一步满足了用户对精准、详尽信息的需求。 据悉
    的头像 发表于 12-16 09:35 1034次阅读

    Tata Communications即将推出Kaleyra AI:颠覆性人工智能驱动客户互动

    面向未来的人工智能驱动旗舰产品组合——Kaleyra AI,旨在重新定义客户互动的全新体验。 这款颠覆性产品组合将首度推出三项独具特色的功能,突破传统通信工具的界限,开创全新互动体验。 这款产品套件旨在与各类通信渠道及实时代理界面无缝对接,借助生成式人工智能(GenAI)营造简洁流畅、个性化且极具
    的头像 发表于 12-15 09:30 766次阅读