0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Hinton的那篇Capsule论文终于揭下了神秘的面纱

深度学习自然语言处理 来源:算法与数学之美 作者:算法与数学之美 2020-11-24 09:56 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,Hinton的那篇Capsule论文终于揭下了神秘的面纱,也因为该篇论文,他被刊进了各大媒体的头版头条。

在论文中,Capsule被Hinton大神定义为这样一组神经元:其活动向量所表示的是特定实体类型的实例化参数。

他的实验表明,鉴别式训练的多层Capsule系统,在MNIST手写数据集上表现出目前最先进的性能,并且在识别高度重叠数字的效果要远好于CNN。

该论文无疑将是今年12月初NIPS大会的重头戏。

不过,对于这篇论文的预热,Hinton大神可是早有准备。

一个月前,在多伦多接受媒体采访时,Hinton大神断然宣称要放弃反向传播,让整个人工智能从头再造。不明就里的媒体们顿时蒙圈不少。

8月份的时候,Hinton大神还用一场“卷积神经网络都有哪些问题?”的演讲来介绍他手中的Capsule研究,他认为“CNN的特征提取层与次抽样层交叉存取,将相同类型的相邻特征检测器的输出汇集到一起”是大有问题的。

当时的演讲中,Hinton大神可没少提CNN之父Yann LeCun的不同观点。毕竟,当前的CNN一味追求识别率,对于图像内容的“理解”帮助有限。

而要进一步推进人工智能,让它能像人脑一样理解图像内容、构建抽象逻辑,仅仅是认出像素的排序肯定是不够的,必须要找到方法来对其中的内容进行良好的表示……这就意味着新的方法和技术。

而当前的深度学习理论,自从Hinton大神在2007年(先以受限玻尔兹曼机进行训练、再用有监督的反向传播算法进行调优)确立起来后,除了神经网络结构上的小修小改,很多进展都集中在梯度流上。

正如知乎大V“SIY.Z”在《浅析Hinton最近提出的Capsule计划》时所举的例子。 (https://zhuanlan.zhihu.com/p/29435406)

sigmoid会饱和,造成梯度消失。于是有了ReLU。

ReLU负半轴是死区,造成梯度变0。于是有了LeakyReLU,PReLU。

强调梯度和权值分布的稳定性,由此有了ELU,以及较新的SELU。

太深了,梯度传不下去,于是有了highway。

干脆连highway的参数都不要,直接变残差,于是有了ResNet。

强行稳定参数的均值和方差,于是有了BatchNorm。

在梯度流中增加噪声,于是有了 Dropout。

RNN梯度不稳定,于是加几个通路和门控,于是有了LSTM。

LSTM简化一下,有了GRU。

GAN的JS散度有问题,会导致梯度消失或无效,于是有了WGAN。

WGAN对梯度的clip有问题,于是有了WGAN-GP。

而本质上的变革,特别是针对当前CNN所无力解决的动态视觉内容、三维视觉等难题……进行更为基础的研究,或许真有可能另辟蹊径。

这当然是苦力活,Hinton大神亲自操刀的话,成功了会毁掉自己赖以成名的反向传播算法和深度学习理论,失败了则将重蹈爱因斯坦晚年“宇宙常数”的覆辙。

所以,李飞飞对他在这里的勇气大为赞赏:

如今Capsule的论文刚刚出来,深度学习的各路大神并没有贸然对其下评论,深夜中的外媒亦尚未就此发稿,甚至就连技术圈内一向口水不断的Hacker News,今天也是静悄悄地一片。

不过,可以肯定的一点是,一个月后的NIPS大会,Capsule更进一步的效果必定会有所显现。

至于Hinton此举对于深度学习和整个人工智能界的后续影响,包括Yann LeCun在内的各路大神恐怕都不敢冒下结论,咱们还是静等时间来验证Hinton大神的苦心孤诣到底值不值得吧。

这正如Hinton大神在接受吴恩达采访时所说的:

如果你的直觉很准,那你就应该坚持,最终必能有所成就;反过来你直觉不好,那坚不坚持也就无所谓了。反正你从直觉里也找不到坚持它们的理由。

当然,营长肯定是相信Hinton大神的直觉的,更是期待人工智能能在当前的水平上更进一步。

尽管意义不同,Hinton大神此举却让营长想到了同在古稀之年的开尔文勋爵,他1900年那场关于物理学“两朵乌云”的演讲可是“预言”得贼准:

“紫外灾难”让年近不惑的普朗克为量子力学开创了先河,“以太漂移”让刚刚毕业的爱因斯坦开始思考狭义相对论,经典物理学的大厦就此崩塌。

那么,人工智能上空所飘荡的到底是一朵“乌云”呢?还是一个新的时代?让我们拭目以待。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4847

    浏览量

    108391
  • 神经元
    +关注

    关注

    1

    文章

    369

    浏览量

    19220
  • cnn
    cnn
    +关注

    关注

    3

    文章

    356

    浏览量

    23595

原文标题:70岁Hinton还在努力推翻自己积累了30年的学术成果,他让我知道了什么叫做生命力

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    红外热像仪是什么?它跟红外热成像有什么关系?

    实现这一功能的设备就是红外热像仪。今天,就让我们揭开红外热像仪的神秘面纱,探索它如何成为我们透视温度的“火眼金睛”。
    的头像 发表于 04-13 14:41 279次阅读
    红外热像仪是什么?它跟红外热成像有什么关系?

    【「Altium Designer 25 电路设计精进实践」阅读体验】+读后感

    心心念的书籍今天终于收到了 节前最后一天 拿到后就立马快速的浏览了一下 从目录上来讲,作者分的还是很详细的,如果使用过AD软件的,第一章、第二章应该不会陌生,相当于为我们揭开了AD软件的神秘面纱
    发表于 02-14 11:38

    小鹏汽车与北京大学研究论文成功入选AAAI 2026

    近日,AAAI 2026公布了论文录用结果,该会议是人工智能领域的国际顶级会议之一。据悉,AAAI 2026共收到23,680份论文投稿,其中4,167篇论文被录用,录用率仅为17.6%。
    的头像 发表于 01-04 11:22 867次阅读
    小鹏汽车与北京大学研究<b class='flag-5'>论文</b>成功入选AAAI 2026

    AI教父Hinton对话云天励飞陈宁

    在大模型步入深水区的当下,AI 的下一个临界点究竟在哪里?在 2025 GIS 全球创新峰会现场,深度学习奠基人、“AI 教父” Geoffrey Hinton 与云天励飞董事长兼 CEO 陈宁
    的头像 发表于 12-03 14:04 909次阅读

    Nullmax端到端轨迹规划论文入选AAAI 2026

    11月8日,全球人工智能顶会 AAAI 2026 公布论文录用结果,Nullmax 研发团队的端到端轨迹规划论文成功入选。该论文创新提出一种由粗到精的轨迹预测框架——DiffRefiner,能够实现更为灵活、精准的轨迹预测。
    的头像 发表于 11-12 10:53 1190次阅读

    红外热成像:让看不见的温度“现形”

    在广袤的世界里,温度是一个无形却又无处不在的要素。我们凭借触觉能大致感知物体冷热,可一旦涉及复杂场景、微小温度差异或是无法直接触摸的物体,温度就变得神秘莫测。红外热成像技术的诞生,宛如一道划破黑暗的光,为我们揭开了温度的神秘面纱
    的头像 发表于 10-09 10:31 758次阅读
    红外热成像:让看不见的温度“现形”

    电源里的“特种部队”:揭秘115V/400Hz高频电力的神秘面纱与应用领域

    ”,虽然小众,却肩负着至关重要的使命。今天,就让我们一起揭开它的神秘面纱。一、为什么是400Hz?高频电力的优势何在?与常见的50/6
    的头像 发表于 08-29 10:48 1339次阅读
    电源里的“特种部队”:揭秘115V/400Hz高频电力的<b class='flag-5'>神秘</b><b class='flag-5'>面纱</b>与应用领域

    光模块拉环颜色背后的神秘意义,你知道多少?

    在数据中心的复杂网络世界里,光模块扮演着至关重要的角色,它负责实现电信号与光信号之间的高效转换,确保数据在光纤网络中稳定、高速地传输。而光模块上小小的拉环颜色,看似不起眼,却隐藏着诸多关键信息,下面跟着小易,一起揭开其神秘面纱
    的头像 发表于 08-05 16:22 1517次阅读
    光模块拉环颜色背后的<b class='flag-5'>神秘</b>意义,你知道多少?

    融大视觉:投影融合处理器的应用场景

    如今,投影融合处理器已经渗透到我们生活的方方面面,在众多场景中发挥着至关重要的作用。接下来,就为大家揭开它在不同领域应用的神秘面纱
    的头像 发表于 07-29 18:20 623次阅读

    格灵深瞳六篇论文入选ICCV 2025

    近日,国际顶级会议ICCV 2025(计算机视觉国际大会)公布论文录用结果,格灵深瞳团队共有6篇论文入选。
    的头像 发表于 07-07 18:23 1812次阅读

    理想汽车八篇论文入选ICCV 2025

    近日,ICCV 2025(国际计算机视觉大会)公布论文录用结果,理想汽车共有8篇论文入选,其中5篇来自自动驾驶团队,3篇来自基座模型团队。ICCV作为计算机视觉领域的顶级学术会议,每两年举办一次
    的头像 发表于 07-03 13:58 1380次阅读

    FPGA的基础概念和应用场景

    看似神秘的技术名词,究竟是什么?又为何能在电子领域掀起一场又一场变革?让我们一同揭开 FPGA 的神秘面纱
    的头像 发表于 06-30 16:13 4898次阅读
    FPGA的基础概念和应用场景

    突破!华为先进封装技术揭开神秘面纱

    在半导体行业,芯片制造工艺的发展逐渐逼近物理极限,摩尔定律的推进愈发艰难。在此背景下,先进封装技术成为提升芯片性能、实现系统集成的关键路径,成为全球科技企业角逐的新战场。近期,华为的先进封装技术突破引发行业高度关注,为其在芯片领域的持续创新注入强大动力。 堆叠封装,创新架构 华为公布的 “一种芯片堆叠封装及终端设备” 专利显示,其芯片堆叠封装技术通过将多个芯片或芯粒(Chiplet)以堆叠方式成在同一封装体内,实
    的头像 发表于 06-19 11:28 2170次阅读

    浮思特 | 揭开(IGBT)的神秘面纱,结构原理与应用解析

    在(绝缘栅双极型晶体管)IGBT出来之前,最受欢迎和常用的功率电子开关器件是双极结晶体管(BJT)和场效应晶体管(MOSFET)。然而,这两种组件在高电流应用中都有一些限制。因此,我们转向了另一种受欢迎的功率电子开关器件,称为IGBT。TRINNOIGBT你可以将IGBT看作BJT和MOSFET的结合体,这些组件具有BJT的输入特性和MOSFET的输出特性。
    的头像 发表于 06-17 10:10 3844次阅读
    浮思特 | 揭开(IGBT)的<b class='flag-5'>神秘</b><b class='flag-5'>面纱</b>,结构原理与应用解析

    基于STM32蓝牙控制小车系统设计(硬件+源代码+论文)下载

    基于STM32蓝牙控制小车系统设计(硬件+源代码+论文)推荐下载!
    发表于 05-29 21:45