0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ResNet原始结果无法复现?大神何恺明受到了质疑

DPVg_AI_era 来源:lp 2019-04-19 11:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

ResNet原始结果无法复现?大神何恺明的经典之作受到了网友质疑,不过何恺明本人现身解答之后,让真理越辩越明。

大神何恺明受到了质疑。

今天,Reddit上一位用户对何恺明的ResNet提出质疑,他认为:

何恺明2015年的原始残差网络的结果没有被复现,甚至何恺明本人也没有。

网友称,他没有发现任何一篇论文复现了原始ResNet网络的结果,或与原始残差网络论文的结果进行比较,并且所有的论文报告的数字都比原始论文的更差。

论文中报告的top1错误率的结果如下:

ResNet-50 @ 20.74

resnet - 101 @ 19.87

resnet - 152 @ 19.38

何恺明等人在2015年提出ResNet之后,ResNet很快成为计算机视觉最流行的架构之一,这篇论文已经被引用了超过20000次。

不过,网友称,DenseNet(https://arxiv.org/abs/1608.06993,3000+引用)和WideResNets(https://arxiv.org/abs/1605.07146,~1000引用)都没有使用这个结果。甚至在何恺明最近的一篇论文中,也没有使用这个结果。

按理说,何恺明这篇论文应该是这个领域被引用最多的论文之一,原始ResNet的结果真的没有被复现出来吗?在继续讨论之前,让我们先来回顾一下ResNet的思想,以及它之所以强大的原因。

重新审视ResNet:计算机视觉最流行的架构之一

2015年,ResNet大大吸引了人们的眼球。实际上,早在ILSVRC2012分类竞赛中,AlexNet取得胜利,深度残差网络(deepResidualNetwork)就成为过去几年中计算机视觉和深度学习领域最具突破性的工作。ResNet使得训练深达数百甚至数千层的网络成为可能,而且性能仍然优异。

由于其表征能力强,ResNet在图像分类任务之外的许多计算机视觉应用上也取得了巨大的性能提升,例如对象检测和人脸识别。

自2015年以来,许多研究对ResNet架构进行了调整和改进。其中最著名的一些ResNet变体包括:

何恺明等人提出的ResNeXt

康奈尔大学、清华大学和Facebook联合提出的DenseNet

谷歌MobileNet

孙剑团队ShuffleNet

颜水成团队的双通道网络DPN

最近南开大学、牛津大学等提出的 Res2Net

……

那么ResNet 的核心思想是什么呢?

根据泛逼近定理(universalapproximationtheorem),如果给定足够的容量,一个单层的前馈网络就足以表示任何函数。但是,这个层可能是非常大的,而且网络容易过拟合数据。因此,研究界有一个共同的趋势,就是网络架构需要更深。

从AlexNet的提出以来,state-of-theart的CNN架构都是越来越深。虽然AlexNet只有5层卷积层,但后来的VGG网络和GoogLeNet分别有19层和22层。

但是,如果只是简单地将层堆叠在一起,增加网络的深度并不会起太大作用。这是由于难搞的梯度消失(vanishinggradient)问题,深层的网络很难训练。因为梯度反向传播到前一层,重复相乘可能使梯度无穷小。结果就是,随着网络的层数更深,其性能趋于饱和,甚至开始迅速下降。

网络深度增加导致性能下降

在ResNet之前,已经出现好几种处理梯度消失问题的方法,例如,2015年C.Szegedy等人提出的GoogLeNet在中间层增加一个辅助损失(auxiliaryloss)作为额外的监督,但遗憾的是,没有一个方法能够真正解决这个问题。

ResNet的核心思想是引入一个“恒等捷径连接”(identityshortcutconnection),直接跳过一层或多层,如下图所示:

一个残差块

何恺明等人于2015年发表的论文《用于图像识别的深度残差学习》(DeepResidualLearningforImageRecognition)中,认为堆叠的层不应该降低网络的性能,因为我们可以简单地在当前网络上堆叠identity映射(层不处理任何事情),并且所得到的架构性能不变。这表明,较深的模型所产生的训练误差不应比较浅的模型的误差更高。作者假设让堆叠的层拟合一个残差映射(residualmapping)要比让它们直接拟合所需的底层映射更容易。上面的残差块(residualblock)显然仍让它做到这点。

ResNet 的架构

那么这次质疑“不能复现”的结果是什么呢?讨论点集中在原始论文中的表3和表4:

表3:ImageNet验证集上10-crop测试的错误率

表4:ImageNet验证集上sigle-model的错误率结果

由于其结果优异,ResNet迅速成为各种计算机视觉任务最流行的架构之一。

新智元昨天发表的文章《对 ResNet 本质的一些思考》,对ResNet做了较深入的探讨。作者表示:

不得不赞叹KaimingHe的天才,ResNet这东西,描述起来固然简单,但是对它的理解每深一层,就会愈发发现它的精妙及优雅,从数学上解释起来非常简洁,非常令人信服,而且直切传统痛点。

ResNet本质上就干了一件事:降低数据中信息的冗余度。

具体说来,就是对非冗余信息采用了线性激活(通过skipconnection获得无冗余的identity部分),然后对冗余信息采用了非线性激活(通过ReLU对identity之外的其余部分进行信息提取/过滤,提取出的有用信息即是残差)。

其中,提取 identity 这一步,就是 ResNet 思想的核心。

何恺明回应ResNet结果不能复现

再回到文章开头的讨论:原始ResNet的结果真的无法复现吗?

针对网友的质疑,不少人在帖子下回复,可以总结为两个方面:

ImageNet有多种测试策略,后来的论文在复现ImageNet时采用的是当时流行的策略,而非ResNet原始论文的策略;

后来的论文在训练时采用了一些与原始论文不同的优化技巧,使得结果甚至比原始ResNet 论文的结果更好

何恺明本人也第一时间作出回复:

ImageNet上有几种测试策略:(i)single-scale,single-crop测试;(ii)single-scale,multi-crop或fully-convolutional测试;(iii)multi-scale,multi-crop或fully-convolutional测试;(iv)多个模型集成。

在这些设置下,这篇论文的ResNet-50模型的top-1错误率为:(i)24.7%(1-crop,如我的GitHubrepo所展示),(ii)22.85%(10-crop,论文中的表3),(iii)20.74%(full-conv,multi-scale,论文中的Table4)。论文中使用的(ii)和(iii)的描述见第3.4节。

当时是2015年,(ii)和(iii)是最流行的评估设置。策略(ii)是AlexNet的默认值(10-crop),(ii)和(iii)是OverFeat、VGG和GoogleNet中常用的设置。Single-crop测试在当时并不常用。

2015/2016年后,Single-crop测试开始流行。这在一定程度上是因为社区已经变成一个对网络精度的差异很感兴趣的环境(因此single-crop足以提供这些差异)。

ResNet是近年来被复现得最多的架构之一。在我的GitHubrepo中发布的ResNet-50模型是第一次训练的ResNet-50,尽管如此,它仍然十分强大,并且在今天的许多计算机视觉任务中仍然是预训练的骨干。我认为,ResNet的可复现性经受住了时间的考验。

Reddit用户ajmooch指出:

你忘记了测试时数据增强(test-timeaugmentation,TTA)。表4中的数字来自于不同scales的multi-crop的平均预测(以计算时间为代价优化精度),而其他论文中的数字是single-crop的。

表3列出了10-crop测试的数据。表4的数字更好,所以它肯定不是singlecrop的数字。我的猜测是n-crop,可能还包括其他增强,比如翻转图像。

这个帖子读起来有点像指责,我不喜欢。ResNet因为在ImageNet测试集上表现出色而著名,而ImageNet测试集隐藏在服务器上,他们没有办法在那里处理这些数字。ResNet是我能想到的被复现最多的架构之一。它显然是合理的。在开始批评别人之前,我们应该先了解我们在批评什么。

谷歌大脑工程师hardmaru也回复道:

在何恺明加入FAIR之前,FAIRTorch-7团队独立复现了ResNet:https://github.com/facebook/fb.resnet.torch

经过训练的ResNet18、34、50、101、152和200模型,可供下载。我们包括了使用自定义数据集,对图像进行分类并获得模型的top5预测,以及使用预训练的模型提取图像特征的说明。

他们的结果如下表:

经过训练的模型比原始ResNet模型获得了更好的错误率。

但是,考虑到:

这个实现与ResNet论文在以下几个方面有所不同:

规模扩大(Scaleaugmentation):我们使用了GooLeNet中的的规模和长宽比,而不是ResNet论文中的scaleaugmentation。我们发现这样的验证错误更好。

颜色增强(Coloraugmentation):除了在ResNet论文中使用的AlexNet风格的颜色增强外,我们还使用了AndrewHoward提出的的亮度失真(photometricdistortions)。

权重衰减(Weightdecay):我们将权重衰减应用于所有权重和偏差,而不仅仅是卷积层的权重。

Stridedconvolution:当使用瓶颈架构时,我们在3x3卷积中使用stride2,而不是在第一个1x1卷积。

何恺明的GitHub有Caffe模型训练的原始版本和更新版本的resnet,而且报告的也不同:

(https://github.com/KaimingHe/deep-residual-networks/blob/master/README.md)

也许他的GitHub报告中的方法与论文不一致,但为了可重复性而不使用相同的方法也有点奇怪。

也许arxiv或repo应该使用一致的数字进行更新,或者更好的是,使用多次独立运行的平均值。

但是随着SOTA的改进和该领域的发展,其他人花费资源来产生旧的结果的动机就更少了。人们宁愿使用他们的资源来复现当前的SOTA或尝试其他新想法。

许多人引用它是因为它的概念本身,而不是为了报告排行榜分数。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 梯度
    +关注

    关注

    0

    文章

    30

    浏览量

    10549
  • 计算机视觉
    +关注

    关注

    9

    文章

    1714

    浏览量

    47450
  • resnet
    +关注

    关注

    0

    文章

    14

    浏览量

    3375

原文标题:经典ResNet结果不能复现?何恺明回应:它经受住了时间的考验

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    果无线充电线圈拆解

    果无线充电技术通过精密结构与磁场实现高效能量传输,结合散热系统优化充电体验。
    的头像 发表于 11-27 08:24 281次阅读
    苹<b class='flag-5'>果无</b>线充电线圈拆解

    什么是太阳光谱?如何在实验室复现太阳光?

    太阳是地球最主要的能量来源,理解太阳光的本质特性,尤其是其光谱分布,对于太阳能技术、材料研究、环境科学等众多领域至关重要。而太阳光模拟器,作为在实验室内精准复现太阳光的关键设备,使试验研究能够不受
    的头像 发表于 11-03 18:04 473次阅读
    什么是太阳光谱?如何在实验室<b class='flag-5'>复现</b>太阳光?

    果无线充电器原理剖析

    果无线充电器通过电磁感应和磁共振技术实现高效能量传输,兼顾安全与便捷。
    的头像 发表于 10-31 08:18 178次阅读
    苹<b class='flag-5'>果无</b>线充电器原理剖析

    f103c8t6使用adc采样时程序无法正常工作怎么解决?

    /details/129649963 但是我复现以后,出现的问题是有一个startup 的警告,另外就是下载到单片机运行时无法正常进行。 不同的点是教程使用的板子和我的不同 这是报错内容 这是运行以后串口终端的显示内容
    发表于 10-13 07:25

    基于瑞芯微RK3576的resnet50训练部署教程

    Resnet50简介ResNet50网络是2015年由微软实验室的提出,获得ILSVRC2015图像分类竞赛第一名。在
    的头像 发表于 09-10 11:19 1113次阅读
    基于瑞芯微RK3576的<b class='flag-5'>resnet</b>50训练部署教程

    果无线充电器的原理是什么

    果无线充电技术基于电磁感应原理,通过高频逆变和精密线圈设计,实现高效、稳定的能量传输,融合创新与工程优化。
    的头像 发表于 08-12 08:36 1493次阅读
    苹<b class='flag-5'>果无</b>线充电器的原理是什么

    CYW43907如果将SECURE_BIT设置为 1,设备上的USB和HSIC接口是否被禁用?

    SECURE_BIT 设置为 1,设备上的 USB 和 HSIC 接口是否被禁用,或者文档是否不正确? 如果它是准确的,这种行为是否会在特定的硅片修订版中发生? 我们如何确定哪些修订受到了影响?
    发表于 07-09 07:19

    是德N5173B信号发生器在EMC测试中的干扰信号精准复现技巧

    具备宽频段覆盖、高精度调制和灵活的信号生成能力,成为EMC实验室中复现干扰信号的重要工具。掌握其使用技巧,可有效提升测试的精准性和效率。   二、干扰信号精准复现的关键要素 在EMC测试中,精准复现干扰信号需考虑以下要素: 1.
    的头像 发表于 06-03 16:09 587次阅读
    是德N5173B信号发生器在EMC测试中的干扰信号精准<b class='flag-5'>复现</b>技巧

    基于RV1126开发板的resnet50训练部署教程

    本教程基于图像分类算法ResNet50的训练和部署到EASY-EAI-Nano(RV1126)进行说明
    的头像 发表于 04-18 15:07 919次阅读
    基于RV1126开发板的<b class='flag-5'>resnet</b>50训练部署教程

    IGBT模块的反向恢复现

    IGBT模块的反向恢复现象是指在IGBT关断时,其内部集成的续流二极管(FWD)从正向导通状态转变为反向截止状态过程中出现的一些特定物理现象和电气特性变化。
    的头像 发表于 03-13 14:39 3427次阅读
    IGBT模块的反向恢<b class='flag-5'>复现</b>象

    德赛电池荣膺仲高新区三项荣誉

    近日,仲高新区举行高质量发展大会暨优秀企业授牌活动,旨在表彰2024年度为仲高新区经济发展作出杰出贡献的优秀企业,激励更多企业创新发展,共同推动区域经济的繁荣与进步。区领导、园区、镇(街道)领导、区直相关部门领导以及各企业代表齐聚一堂,共同见证这一荣耀时刻。
    的头像 发表于 02-12 09:27 715次阅读

    振弦式应变计的安装对测量结果影响?如何避免安装误差?

    结果具有决定性影响。应变计应安装在能够准确反映被测结构应变情况的关键部位。如果安装位置选择不当,例如未处于应力集中区或未与被测结构物轴线重合,将导致测量数据无法
    的头像 发表于 02-07 15:16 736次阅读
    振弦式应变计的安装对测量<b class='flag-5'>结果</b>有<b class='flag-5'>何</b>影响?如何避免安装误差?

    惠州隆利荣获2024年仲高新区优秀企业经济突出贡献奖

    近日,在仲高新区高质量发展大会暨优秀企业授牌活动中,公司全资子公司惠州市隆利科技发展有限公司,荣获2024年仲高新区优秀企业经济突出贡献奖。
    的头像 发表于 02-07 11:30 942次阅读

    调试ADS1256,到了读转换结果的时候结果总是为0,为什么?

    最近一直在调试ADS1256,目前读写寄存器没有问题,但是到了读转换结果的时候 结果总是为0,我做的是单端测量,AINp选的通道3,AINn选的是AINCOM 但总是读不出结果来,哪
    发表于 01-09 08:12

    光伏行业协会质疑央企项目低价中标

    近日,中国光伏行业协会就国家能源集团下属企业一光伏组件项目的招投标结果发出严厉质疑。协会连发“四连问”,对项目招投标的合规性、合理性及实际执行情况提出了深刻关切。 据协会指出,尽管协会已连续两个月
    的头像 发表于 12-20 10:29 740次阅读