0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

深度解读对残差网络动机的理解

电子工程师 来源:Fenrier Lab 作者:Fenrier Lab 2021-04-27 15:37 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

神经网络以其强大的非线性表达能力而获得人们的青睐,但是将网络层数加深的过程中却遇到了很多困难,随着批量正则化,ReLU 系列激活函数等手段的引入,在多层反向传播过程中产生的梯度消失和梯度爆炸问题也得到了很大程度的解决。然而即便如此,随着网络层数的增加导致的拟合能力退化现象依然存在,如下图所示

100067238-136747-1.png

可以看到,训练误差和测试误差都随网络层数的增加而增加,可以排除过拟合造成的预测性能退化。所以这里存在一个逻辑上讲不通的问题,通常来说,我们认为神经网络可以学习出任意形状的函数,具体到这个问题上来,假如浅层网络可以获得一个不错的效果,那么理论上深层网络增加的额外层只需要学会恒等映射,即可获得与浅层网络相同的预测精度

100067238-136748-2.png

但实际情况根本不是这么回事儿,那么问题出在哪儿了呢?我们一厢情愿的认为中间层能够学会恒等映射,但事与愿违,这一假设不成立,也就是说,具有很强的非线性拟合能力的传统神经元结构却连最简单的恒等映射都模拟不了,抓住这一要点后,新的优化方向便映入眼帘了,既然这种交叉连接的神经元无法实现恒等映射,那么再增加一路恒等映射的连接不就行了

100067238-136749-3.png

这样一来,假如两层之间的恒等映射是最优解,就像之前提到的那种情况,那么只需要权重层,即图中的 weight layer,学会把所有的权重都设为 0 就行了,而这种学习任务是很简单的。

所以可以总结道,resnet 的提出是因为发现了普通的神经网络连接方式无法实现有效的恒等映射,于是额外增加了一路恒等连接层来辅助学习。体现在最终效果上就是说普通神经网络的连接方式更容易学习到残差,所以这种方式就被称为残差学习。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4827

    浏览量

    106792
  • 函数
    +关注

    关注

    3

    文章

    4406

    浏览量

    66831
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    如何在机器视觉中部署深度学习神经网络

    图 1:基于深度学习的目标检测可定位已训练的目标类别,并通过矩形框(边界框)对其进行标识。 在讨论人工智能(AI)或深度学习时,经常会出现“神经网络”、“黑箱”、“标注”等术语。这些概念对非专业
    的头像 发表于 09-10 17:38 679次阅读
    如何在机器视觉中部署<b class='flag-5'>深度</b>学习神经<b class='flag-5'>网络</b>

    基于瑞芯微RK3576的resnet50训练部署教程

    堆叠得到的,但当网络堆叠到一定深度时,就会出现退化问题。网络的特点是容易优化,并且能够通过增加相当的
    的头像 发表于 09-10 11:19 1113次阅读
    基于瑞芯微RK3576的resnet50训练部署教程

    TFT液晶显示屏为什么会显示影、如何解决

    TFT液晶屏(Thin-Film Transistor Liquid Crystal Display)显示影(也称为图像残留)是一个涉及物理和电子原理的现象。 一、为什么工业TFT液晶屏会出现
    发表于 09-08 09:04

    AI SoC #BK7258 AI能力和技术参数深度解读

    BK7258芯片AI能力深度解读 BK7258是博通集成推出的一款高集成度Wi-Fi 6+蓝牙5.4低功耗音视频SoC芯片,其AI能力通过硬件加速、算法优化及生态整合实现,覆盖边缘计算、端云协同两大
    的头像 发表于 06-20 09:44 5397次阅读
    AI SoC #BK7258 AI能力和技术参数<b class='flag-5'>深度</b><b class='flag-5'>解读</b>

    直播 | GB/T 45086与ISO11451标准深度解读研讨会笔记请查收!

    6月12日,《德思特GB/T 45086与ISO11451标准深度解读》线上研讨会圆满结束。感谢大家的观看与支持!在直播间收到一些观众的技术问题,我们汇总了热点问题并请讲师详细解答,在此整理分享给大家,请查收!
    的头像 发表于 06-18 11:06 825次阅读
    直播 | GB/T 45086与ISO11451标准<b class='flag-5'>深度</b><b class='flag-5'>解读</b>研讨会笔记请查收!

    轮式移动机器人电机驱动系统的研究与开发

    【摘 要】以嵌入式运动控制体系为基础,以移动机器人为研究对象,结合三轮结构轮式移动机器人,对二轮速驱动转向自主移动机器人运动学和动力学空间模型进行了分析和计算,研究和设计了自主移
    发表于 06-11 14:30

    革命性神经形态微控制器 ​**Pulsar**​ 的深度技术解读

    以下是对荷兰公司Innatera推出的革命性神经形态微控制器 ​ Pulsar ​ 的深度技术解读,结合其架构设计、性能突破、应用场景及产业意义进行综合分析: 一、核心技术原理:神经形态架构的突破
    的头像 发表于 06-07 13:06 1325次阅读
    革命性神经形态微控制器 ​**Pulsar**​ 的<b class='flag-5'>深度</b>技术<b class='flag-5'>解读</b>

    瑞萨365 深度解读

    技术架构、核心功能、行业影响及未来展望四个维度进行深度解读: 一、技术架构:融合硬件与设计软件的跨领域协作平台 瑞萨365基于Altium 365云平台构建,整合了瑞萨的半导体产品组合与Altium的设计工具链,形成从芯片选型到系统部署的全流程数字环境。其核心架构围绕 五
    的头像 发表于 06-06 09:58 1811次阅读
    瑞萨365 <b class='flag-5'>深度</b><b class='flag-5'>解读</b>

    ARM Mali GPU 深度解读

    ARM Mali GPU 深度解读 ARM Mali 是 Arm 公司面向移动设备、嵌入式系统和基础设施市场设计的图形处理器(GPU)IP 核,凭借其异构计算架构、能效优化和生态协同,成为全球移动
    的头像 发表于 05-29 10:12 2983次阅读

    Arm 公司面向 PC 市场的 ​Arm Niva​ 深度解读

    面向 PC 市场的 ​ Arm Niva ​ 深度解读 ​ Arm Niva ​ 是 Arm 公司为 PC 市场推出的核心计算平台,属于其“平台优先”战略的关键布局。作为 ​ Arm 计算
    的头像 发表于 05-29 09:56 1303次阅读

    英伟达Cosmos-Reason1 模型深度解读

    。以下从技术架构、训练策略、核心能力及行业影响四方面展开深度解读: Cosmos-Reason 1:从物理 AI 常识到具体决策 物理 AI 系统需要感知、理解和执行物理世界中的复杂作。在本文中,我们提出了 Cosmos-Rea
    的头像 发表于 03-29 23:29 2613次阅读

    DLP3010显示影是什么原因导致的?怎么解决?

    我们自己做的dlpc3478+dlpa3000的板,可以正常投影,但是现在出现了一个情况,就是internal patterns模式下,关闭投图,光机仍有影现象,请问这是什么原因? 图一为正常投射,图二为关闭投射后的
    发表于 02-26 06:29

    深度解读 30KPA64A 单向 TVS:64V 击穿机制与高效防护策略

    深度解读 30KPA64A 单向 TVS:64V 击穿机制与高效防护策略
    的头像 发表于 02-24 13:52 606次阅读
    <b class='flag-5'>深度</b><b class='flag-5'>解读</b> 30KPA64A 单向 TVS:64V 击穿机制与高效防护策略

    BP神经网络深度学习的关系

    BP神经网络深度学习之间存在着密切的关系,以下是对它们之间关系的介绍: 一、BP神经网络的基本概念 BP神经网络,即反向传播神经网络(Ba
    的头像 发表于 02-12 15:15 1339次阅读

    请问DAC5682z内部FIFO深度为多少,8SAMPLE具体怎么理解

    你好,请问DAC5682z内部FIFO深度为多少,8SAMPLE具体怎么理解。 另外,DAC5682zEVM是否可以直接通过TI的ADC-HSMC板卡与ALTERA的FPGA开发相连(FPGA板HSMC接口与电压都匹配条件下)。 谢谢
    发表于 01-03 07:27