0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

CNN根本无需理解图像全局结构,一样也能SOTA?

OpenCV学堂 来源:量子位 作者:量子位 2022-06-09 10:51 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

不给全图,只投喂CNN一些看上去毫无信息量的图像碎片,就能让模型学会图像分类。

更重要的是,性能完全不差,甚至还能反超用完整图像训练的模型。

796d0e56-e739-11ec-ba43-dac502259ad0.png

这么一项来自加州大学圣塔芭芭拉分校的新研究,这两天引发不少讨论。

咋地,这就是说,CNN根本无需理解图像全局结构,一样也能SOTA?

79a3bafa-e739-11ec-ba43-dac502259ad0.png

具体是怎么一回事,咱们还是直接上论文。

实验证据

研究人员设计了这样一个实验:

他们在CIFAR-10、CIFAR-100、STL-10、Tiny-ImageNet-200以及Imagenet-1K等数据集上训练ResNet。

特别的是,用于训练的图像是通过随机裁剪得到的。

这个“随机裁剪”,可不是往常我们会在数据增强方法中见到的那一种,而是完全不做任何填充。

举个例子,就是对图片做PyTorch的RandomCrop变换时,padding的参数填0。

得到的训练图像就是下面这个样式的。即使你是阅图无数的老司机,恐怕也分辨不出到底是个啥玩意儿。

79d0c3ce-e739-11ec-ba43-dac502259ad0.png

训练图像如此碎片化,模型的识图能力又能达到几成?

来看实验结果:

79edc60e-e739-11ec-ba43-dac502259ad0.png

好家伙,在CIFAR-10上,用16×16的图像碎片训练出来的模型,测试准确率能达到91%,而用完整的32×32尺寸图像训练出来的模型,测试准确率也不过90%。

这一波,“残缺版”CNN竟然完全不落下风,甚至还反超了“完整版”CNN。

要知道,被喂了碎片的CNN模型,看到的图像甚至可能跟标签显示的物体毫无关系,只是原图中背景的部分……

在STL-10、Tiny-Imagenet-200等数据集上,研究人员也得到了类似的结果。

不过,在CIFAR-100上,还是完整图像训练出来的模型略胜一筹。16×16图像碎片训练出的模型测试准确率为61%,而32×32完整图像训练出的模型准确率为68%。

所以,CNN为何会有如此表现?莫非它本来就是个“近视眼”?

研究人员推测,CNN能有如此优秀的泛化表现,是因为在这个实验中,维度诅咒的影响被削弱了。

所谓维度诅咒(curse of dimensionality),是指当维数提高时,空间体积提高太快,导致可用数据变得稀疏。

而在这项研究中,由于CNN学习到的不是整个图像的标签,而是图像碎片的标签,这就在两个方面降低了维度诅咒的影响:

图像碎片的像素比完整图像小得多,这减少了输入维度

训练期间可用的样本数量增加了

生成热图

基于以上实验观察结果,研究人员还提出以热图的形式,来理解CNN的预测行为,由此进一步对模型的错误做出“诊断”。

就像这样:

7a1871ce-e739-11ec-ba43-dac502259ad0.png

这些图像来自于STL-10数据集。热图显示,对于CNN而言,飞机图像中最能“刺激”到模型的,不是飞机本身,而是天空。

同样,在汽车图像中,车轮才是CNN用来识别图像的主要属性。

论文地址: https://arxiv.org/abs/2205.10760

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像分类
    +关注

    关注

    0

    文章

    97

    浏览量

    12529
  • 数据集
    +关注

    关注

    4

    文章

    1240

    浏览量

    26261
  • cnn
    cnn
    +关注

    关注

    3

    文章

    356

    浏览量

    23533

原文标题:不看全图看局部,CNN性能竟然更强了

文章出处:【微信号:CVSCHOOL,微信公众号:OpenCV学堂】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    FPGA实现CNN卷积层的高效窗口生成模块设计与验证

    卷积神经网络(CNN)可以分为卷积层、池化层、激活层、全链接层结构,本篇要实现的,就是CNN的卷积层中的window窗。
    的头像 发表于 04-15 10:35 144次阅读
    FPGA实现<b class='flag-5'>CNN</b>卷积层的高效窗口生成模块设计与验证

    PCB板上你是普通油墨,我是低损耗油墨,一样吗?

    这个困扰,所以和相关的油墨厂商做些合作和沟通,看油墨能不能像PCB板材一样,研发出不同损耗级别的油墨出来。你们还别说,还真有,这不
    发表于 01-23 11:40

    工业、消费及机器视觉: 贸泽开售 ams OSRAM Mira050 NIR增强全局快门图像传感器

    ) 增强全局快门图像传感器。Mira050是款紧凑型0.5MP图像传感器,专为2D和3D消费类及工业机器视觉应用而设计。 ams OSRAM Mira050 NIR增强
    的头像 发表于 01-20 15:12 845次阅读
    赋<b class='flag-5'>能</b>工业、消费及机器视觉: 贸泽开售 ams OSRAM Mira050 NIR增强<b class='flag-5'>全局</b>快门<b class='flag-5'>图像</b>传感器

    PCB板双面布局的DDR表底走线居然不一样

    的想法,所以前面的些走线长度和阻抗的优化调整意见给到他们的时候,他们能够接受,并且表示赞同。当我们提出最后项优化方案后,他们就表示出了深深的不太理解了。 这
    发表于 12-11 10:43

    结构体声明与定义

    一样,去声明我们的结构体操作,但是C语言中规定,声明结构体变量的时候,struct关键字是不可少的。 struct 结构体类型名 结构
    发表于 12-11 07:52

    求助,关于全局中断使的问题求解

    各位朋友大家好,我最近在使用蜂鸟的板子进行开发时,遇到了这样的问题:我的程序每次运行到使全局中断的时候,就像进入了死循环一样,出不去了,如上图,首先先打印“GI_EN begin!”这里是可以
    发表于 11-07 06:37

    一样的展会,不一样的精彩 2025湾芯展圆满收官

    10月17日,2025湾区半导体产业生态博览会(2025湾芯展)在深圳会展中心(福田)圆满收官。全球600多家展商、超30场论坛,在6万平方米的展区内,打造场“不一样的展会”,呈现出“不一样的精彩
    的头像 发表于 10-29 16:56 1495次阅读
    不<b class='flag-5'>一样</b>的展会,不<b class='flag-5'>一样</b>的精彩 2025湾芯展圆满收官

    构建CNN网络模型并优化的般化建议

    通过实践,本文总结了构建CNN网络模型并优化的般化建议,这些建议将会在构建高准确率轻量级CNN神经网络模型方面提供帮助。 1)避免单层神经网络:我们清楚神经网络本身是需要不断抽象出更高级别的纹理
    发表于 10-28 08:02

    一样的展会,不一样的精彩:2025湾芯展顺利收官

    内,打造场"不一样的展会",呈现出"不一样的精彩"。本届展会人气火爆,展期三天累计接待总量达到11.23万人次。参展企业集中发布年度新品数约2500件,新品发布与商业合作收获颇丰。   不
    的头像 发表于 10-19 20:27 897次阅读
    不<b class='flag-5'>一样</b>的展会,不<b class='flag-5'>一样</b>的精彩:2025湾芯展顺利收官

    现场解决EMC电磁辐射干扰:“望闻问切”,像中医一样

    南柯电子|现场解决EMC电磁辐射干扰:“望闻问切”,像中医一样
    的头像 发表于 09-04 09:47 1036次阅读

    AURIX tc367通过 MCU SOTA 更新逻辑 IC 闪存是否可行?

    你好专家:我的用例是 MCU 通过 SPI 连接到逻辑 IC,逻辑 IC 连接到 8MB 闪存,但 MCU PFLASH 大小为 2MB,通过 MCU SOTA 更新逻辑 IC 闪存是否可行?
    发表于 08-11 06:36

    求助,关于TC387使能以及配置SOTA些问题求解

    你好, 之前我拿到贵司给个demo,里面有些使能以及配置SWAP的代码, 这里有些疑问 问题1. 判断SOTA功能是否生效,demo中使用的是 SCU_STMEM1中的bit位, 代码如下
    发表于 08-08 07:31

    【高云GW5AT-LV60 开发套件试用体验】基于开发板进行深度学习实践,并尽量实现皮肤病理图片的识别,第三阶段

    可以试试: 在哪个阶段介入CNN更好地实现图像处理? 这是个非常关键的架构决策问题。根据处理任务的不同,
    发表于 07-06 15:18

    图像采集卡和显卡是一样的吗?从核心差异、工作原理与应用全解析

    不少朋友在做系统集成或设备选型时,经常会问个看似简单但又容易混淆的问题:图像采集卡和显卡一样吗?个是“采图”的,个是“显图”的,听起来
    的头像 发表于 05-14 09:52 1772次阅读
    <b class='flag-5'>图像</b>采集卡和显卡是<b class='flag-5'>一样</b>的吗?从核心差异、工作原理与应用全解析

    贴片电容和瓷片电容一样吗?

    贴片电容和瓷片电容并不完全一样,它们在结构、材料、特点和应用等方面存在些差异。以下是对这两种电容器的详细比较: 结构差异 贴片电容:
    的头像 发表于 04-30 15:05 1052次阅读
    贴片电容和瓷片电容<b class='flag-5'>一样</b>吗?