0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Hinton的那篇Capsule论文终于揭下了神秘的面纱

深度学习自然语言处理 来源:算法与数学之美 作者:算法与数学之美 2020-11-24 09:56 次阅读

近日,Hinton的那篇Capsule论文终于揭下了神秘的面纱,也因为该篇论文,他被刊进了各大媒体的头版头条。

在论文中,Capsule被Hinton大神定义为这样一组神经元:其活动向量所表示的是特定实体类型的实例化参数

他的实验表明,鉴别式训练的多层Capsule系统,在MNIST手写数据集上表现出目前最先进的性能,并且在识别高度重叠数字的效果要远好于CNN。

该论文无疑将是今年12月初NIPS大会的重头戏。

不过,对于这篇论文的预热,Hinton大神可是早有准备。

一个月前,在多伦多接受媒体采访时,Hinton大神断然宣称要放弃反向传播,让整个人工智能从头再造。不明就里的媒体们顿时蒙圈不少。

8月份的时候,Hinton大神还用一场“卷积神经网络都有哪些问题?”的演讲来介绍他手中的Capsule研究,他认为“CNN的特征提取层与次抽样层交叉存取,将相同类型的相邻特征检测器的输出汇集到一起”是大有问题的。

当时的演讲中,Hinton大神可没少提CNN之父Yann LeCun的不同观点。毕竟,当前的CNN一味追求识别率,对于图像内容的“理解”帮助有限。

而要进一步推进人工智能,让它能像人脑一样理解图像内容、构建抽象逻辑,仅仅是认出像素的排序肯定是不够的,必须要找到方法来对其中的内容进行良好的表示……这就意味着新的方法和技术。

而当前的深度学习理论,自从Hinton大神在2007年(先以受限玻尔兹曼机进行训练、再用有监督的反向传播算法进行调优)确立起来后,除了神经网络结构上的小修小改,很多进展都集中在梯度流上。

正如知乎大V“SIY.Z”在《浅析Hinton最近提出的Capsule计划》时所举的例子。 (https://zhuanlan.zhihu.com/p/29435406)

sigmoid会饱和,造成梯度消失。于是有了ReLU。

ReLU负半轴是死区,造成梯度变0。于是有了LeakyReLU,PReLU。

强调梯度和权值分布的稳定性,由此有了ELU,以及较新的SELU。

太深了,梯度传不下去,于是有了highway。

干脆连highway的参数都不要,直接变残差,于是有了ResNet。

强行稳定参数的均值和方差,于是有了BatchNorm。

在梯度流中增加噪声,于是有了 Dropout。

RNN梯度不稳定,于是加几个通路和门控,于是有了LSTM。

LSTM简化一下,有了GRU。

GAN的JS散度有问题,会导致梯度消失或无效,于是有了WGAN。

WGAN对梯度的clip有问题,于是有了WGAN-GP。

而本质上的变革,特别是针对当前CNN所无力解决的动态视觉内容、三维视觉等难题……进行更为基础的研究,或许真有可能另辟蹊径。

这当然是苦力活,Hinton大神亲自操刀的话,成功了会毁掉自己赖以成名的反向传播算法和深度学习理论,失败了则将重蹈爱因斯坦晚年“宇宙常数”的覆辙。

所以,李飞飞对他在这里的勇气大为赞赏:

如今Capsule的论文刚刚出来,深度学习的各路大神并没有贸然对其下评论,深夜中的外媒亦尚未就此发稿,甚至就连技术圈内一向口水不断的Hacker News,今天也是静悄悄地一片。

不过,可以肯定的一点是,一个月后的NIPS大会,Capsule更进一步的效果必定会有所显现。

至于Hinton此举对于深度学习和整个人工智能界的后续影响,包括Yann LeCun在内的各路大神恐怕都不敢冒下结论,咱们还是静等时间来验证Hinton大神的苦心孤诣到底值不值得吧。

这正如Hinton大神在接受吴恩达采访时所说的:

如果你的直觉很准,那你就应该坚持,最终必能有所成就;反过来你直觉不好,那坚不坚持也就无所谓了。反正你从直觉里也找不到坚持它们的理由。

当然,营长肯定是相信Hinton大神的直觉的,更是期待人工智能能在当前的水平上更进一步。

尽管意义不同,Hinton大神此举却让营长想到了同在古稀之年的开尔文勋爵,他1900年那场关于物理学“两朵乌云”的演讲可是“预言”得贼准:

“紫外灾难”让年近不惑的普朗克为量子力学开创了先河,“以太漂移”让刚刚毕业的爱因斯坦开始思考狭义相对论,经典物理学的大厦就此崩塌。

那么,人工智能上空所飘荡的到底是一朵“乌云”呢?还是一个新的时代?让我们拭目以待。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4558

    浏览量

    98607
  • 神经元
    +关注

    关注

    1

    文章

    283

    浏览量

    18312
  • cnn
    cnn
    +关注

    关注

    3

    文章

    326

    浏览量

    21284

原文标题:70岁Hinton还在努力推翻自己积累了30年的学术成果,他让我知道了什么叫做生命力

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    揭开快充芯片的神秘面纱

    UFP芯片是一种用于USB快充技术的关键元件,它在移动设备和充电器之间进行通信和协调,以实现高效、安全、快速的充电过程。下面我们将揭开快充芯片的神秘面纱,深入探讨UFP快充芯片的工作原理和功能。
    的头像 发表于 04-15 12:51 28次阅读

    揭秘***与蚀刻机的神秘面纱

    在微电子制造领域,光刻机和蚀刻机是两种不可或缺的重要设备。它们在制造半导体芯片、集成电路等微小器件的过程中发挥着关键作用。然而,尽管它们在功能上有所相似,但在技术原理、应用场景等方面却存在着明显的区别。本文将对光刻机和蚀刻机的差异进行深入探讨。
    的头像 发表于 12-16 11:00 409次阅读
    揭秘***与蚀刻机的<b class='flag-5'>神秘</b><b class='flag-5'>面纱</b>

    AN-501推导时钟抖动引起ADC信噪比上限,为何信号没有取有效值?

    时钟抖动引起的采样噪声为: 计算SNR为: 为何这里不像《[MT-001_cn] 揭开公式(SNR = 6.02N + 1.76dB)的神秘面纱,以及为什么我们要予以关注》文章里那样,信号用
    发表于 12-01 08:30

    神秘又有趣的话题——芯片引脚顺序!

    亲爱的“芯”朋友,你们有没有发现,每颗芯片上都布满了密密麻麻的引脚,犹如一座迷宫,让人无从下手?今天,我们一起来揭开这个迷宫的神秘面纱,探索一下这个既神秘又有趣的话题——芯片引脚顺序!芯片,这个看似
    的头像 发表于 11-28 09:33 4961次阅读
    <b class='flag-5'>神秘</b>又有趣的话题——芯片引脚顺序!

    万能原型开发板|M5Capsule上线!

    你是否想过用一款小巧而强大的设备来构建物联网、嵌入式系统和传感器应用以及各种创意Idea?如果你的答案是肯定的,那么你一定会对M5Capsule感兴趣。M5CapsuleM5Capsule是一款
    的头像 发表于 09-23 08:31 351次阅读
    万能原型开发板|M5<b class='flag-5'>Capsule</b>上线!

    iPhone15最新消息:取消静音拨片和刘海屏

    iPhone15系列即将在9月13日凌晨1点亮相。备受期待的iPhone 15系列也将揭开神秘面纱
    的头像 发表于 09-12 16:21 3379次阅读
    iPhone15最新消息:取消静音拨片和刘海屏

    揭开二手半导体设备公司的“神秘面纱

    已经发展得较为成熟,在中国市场也已经发展多年。但在国内二手半导体设备更像是一个“传说”,江湖中流传着它的事迹,却鲜少人报道。本文将揭开二手半导体设备的面纱,聊聊二手半导体设备的那些事。 01、“语焉不详”的二手设备 二
    的头像 发表于 08-21 09:31 437次阅读

    AI 揭开秘鲁沙漠大型地画的神秘面纱

    研究人员借助开创性的技术更快地发现藏在秘鲁大地上的神秘、古老的土地艺术——纳斯卡地画。 日本山形大学的研究人员利用 AI 在秘鲁首都利马以南 7 小时车程的纳斯卡发现了 4 幅以前从未见过
    的头像 发表于 07-18 17:35 207次阅读

    揭开POE技术神秘面纱

    POE指的是在现有的以太网 Cat.5 布线基础架构不作任何改动的情况下,在为一些基于 IP 的终端(如 IP 电话机、无线局域网接入点 AP、网络摄像机等)传输数据信号的同时,还能为此类设备提供直流供电的技术。
    的头像 发表于 06-19 10:35 280次阅读

    常用的典型电子电路知识

    这里从工作中最常用的几种电路揭开电子电路的“神秘面纱
    发表于 06-05 16:39 2109次阅读
    常用的典型电子电路知识

    AI教父Geoffrey Hinton发出警示:超级智能很快就会到来

    十年来,人工智能领域的众多惊人突破背后都离不开深度学习,它是使得ChatGPT、AlphaGo等得以面世的基石。而Hinton作为深度学习领域众多开创性突破的研究者,他的论文总共被引超50万次,2019年,他还获得了计算机科学领域的「诺贝尔奖」——图灵奖。
    的头像 发表于 05-29 09:37 352次阅读

    “AI教父”Geoffrey Hinton:智能进化的下一个阶段

    十年来,人工智能领域的众多惊人突破背后都离不开深度学习,它是使得ChatGPT、AlphaGo等得以面世的基石。而Hinton作为深度学习领域众多开创性突破的研究者,他的论文总共被引超50万次,2019年,他还获得了计算机科学领域的“诺贝尔奖”——图灵奖。
    的头像 发表于 05-26 15:16 387次阅读

    揭开CXL的神秘面纱:概述

    CXL 是一种在主机(通常是 CPU)和设备(通常是附加了内存的加速器)之间实现高带宽、低延迟链接的技术。CXL 堆栈专为低延迟而设计,使用 PCIe 电气和附加卡的标准 PCIe 外形规格。CXL 使用灵活的处理器端口,可以自动协商到标准 PCIe 事务协议或备用 CXL 事务协议。
    的头像 发表于 05-26 10:33 3323次阅读
    揭开CXL的<b class='flag-5'>神秘</b><b class='flag-5'>面纱</b>:概述

    小编带你解开UWB定位技术的神秘面纱

      01   UWB到 底是什么 ?   超宽带无线通信技术(UWB)是一种无载波通信技术,UWB不使用载波,而是使用短的能量脉冲序列,并通过正交频分调制或直接排序将脉冲扩展到一个频率范围内。UWB的主要特点是传输速率高、空间容量大、成本低、功耗低等,必将成为解决企业、家庭、公共场所等高速因特网接入的需求与越来越拥挤的频率资源分配之间的矛盾的技术手段。   02   UWB的基本测距原理是什么?   在说明这个问题之前,我们很有必要说说UWB测距的基本原理。   TOF(Time Of Flight飞行时间测距法)主要利用信号在两个异步收发机(Transceiver)之间飞行时间来测量节点间的距离。双向飞行时间法(TW-TOF,two way-time of flight)每个模块从启动开始即会生成一条独 立的时间戳 。模块A的发射机在其时间戳上的Ta1发射请求性质的脉冲信号,模块B在Tb2时刻发射一个响应性质的信号,被模块A在自己的时间戳Ta2时刻接收。有次可以计算出脉冲信号在两个模块之间的飞行时间,从而确定飞行距离S。   距离:S=Cx[(Ta2-Ta1)-(Tb2-Tb1)](C为光速)。   但是单纯的TOF算法有一个比较严格的约束:发送设备和接收设备必须始终同步。这是一个比较棘手的问题,但是一种Double-sided Two-way Ranging的算法巧妙的避开了这个问题,它即利用了TOF测距的优良特点,同时又极大的去除了TOF的同步问题,从而为TOF的实用化扫清了道路。   上面就是Double-sided Two-way Ranging算法的实际模型和计算飞行时间的公式,可以看到它在计算飞行时间时仅仅需要分别来自上面和下面定位设备的时间信息,而不需要两部设备时间同步。   03   UWB的定位原理是什么?   定位算法中比较成熟的有:TOA(到达时间)、TDOA(到达时间差)、AOA(到达角度或称为DOA估计)定位技术和这三种技术的混合技术。   TOA通过分别测量移动终端与三个或更多基站之间信号的传播时间来定位。它采用了圆周定位,   假如己知移动终端到基站i的直线距离尺Ri, 那么由几何原理可知,移动终端的位置一定在以基站i的位置为圆心,Ri为半径 的圆周上。即若移动终端的位置(X0,Y0),基站位置为(Xi,Yi),则两者满足如下关系:   下面的图非常形象的诠释了TOA算法的原理:   然而事情都具有两面性:TOA定位对传播中产生的误差比较敏感,这些误差来自于传播中的反射、 多径传播、非视距传播和噪声等干扰,会造成各圆无法相交或相交处不是一个点而是一个区域。同时TOA定位要求移动终端和基站之间在时间上要准确同步,1ns的同步误差将会给定位带来大约0.3米的不确定性。纳秒级的同步精度在 许多通信系统中是达不到的。因此,实际中很少使用单纯的TOA定位。   正因为如此,TDOA对TOA技术加以了改进。   TDOA定位不必要进行基站和移动终端之间的同步,而只需要基站之间进行同步。因为基站的位置是固定的,基站之间进行同步与基站和移动终端之间进行同步要容易实现得多。这使得TDOA定位比TOA定位要更加容易实现,所以 TDOA定位的应用非常广泛。   它通过测量出两个不同基站与移动终端的传输时延差来进行定位。假设移动终端的位置与基站1和基站2的距离差为R21=R2-R1,则移动终端的位置必定在以两个基站为焦点,与两个焦点的距离差恒为R21的双曲线上。即若移动终端的位置为(X0,Y0),基站1位置为(X1,Y1),基站2位置为(X2,Y2),则它们满足关系:   再通过另一组移动终端与基站1基站3或基站2基站3的TDOA,可以得到 另一组双曲线,两组双曲线将最多产生两个交点,再根据先验知识(如半径范围 等)判断出移动终端的位置。   它的基本原理可以从下面的图得到良好的诠释:   AOA估计也叫DOA(Direction ofArrival)估计或者方向识别DF(DirectionFinding)。   AOA的优点是所需要的基站比较少,最少只要两个基站就可以进行定位。在LTE系统之前,由于以前的基站并没有天线阵列,而只为了进行定位而对基 站进行更换,不仅需要投入庞大的资金也会破坏原有系统的结构和工作模式,使通信系统无法正常工作,因此AOA定位并不受人重视。在LTE系统中应用了 OFDM和多天线阵技术,使得基于LTE的AOA定位成为了研究热点。AOA的缺点是当移动终端和基站的距离比较远的时候,即使有微小的定位角度的误差,都会造成比较大的定位距离的偏差。因此AOA定位多见于中、短距离的定位。   下图很好的诠释了AOA的基本原理:   混合定位技术就是混合使用上述的两种或三种定位技术,比如TOA-TDOA、 TOA-AOA、TDOA-AOA等,通过检测并提取相关的定位参数,用于定位解算。混合定位技术可以运用多种定位参数实现定位,综合不同定位技术的特点,在各 种定位技术的特性中取长补短,让最终的定位性能得到优化。   对于基于TOA-AOA的技术,又叫圆角定位,利用这种方法可以实现利用单个基站进行定位。首先利用TOA的值计算出移动终端和基站之间的距离R,那么可以确定用终端的位置在以基站为圆心,R为半径的圆周上。接着利用天线阵 列测量出的移动终端到基站的AOA,作出一条射线。则射线与圆之间的交点就是移动终端的位置。若移动终端的位置为(X0,Y0),基站位置为(X,Y)在基站测得的移动终端发出的信号的到达角度为θ,基站和移动终端的距离为R,则他们满足如下方程:   我们可以通过下图形象地体会定位过程:   对于TDOA-AOA定位,可以通过下图形象的理解其定位原理:   目前,混合定位技术是UWB定位研究领域中的新趋势,具有广大的发展前景。 原作者:大海 FindRF
    发表于 05-12 16:38

    揭开IDC机房神秘面纱-科兰

    互联网数据中心(Internet Data Center)简称IDC,就是电信部门利用已有的互联网通信线路、带宽资源,建立标准化的电信专业级机房环境,为企业、政府提供服务器托管、租用以及相关增值等方面的全方位服务。 IDC机房功能 IDC主机托管主要应用范围是网站发布、虚拟主机和电子商务等。比如网站发布,单位通过托管主机,从电信部门分配到互联网静态IP地址后,即可发布自己的www站点,将自己的产品或服务通过互联网广泛宣传;虚拟主机是单位通过托管主机,
    的头像 发表于 05-08 11:49 741次阅读