AI把狗认成猫只因它在捕捉人类看不到的特征-电子发烧友网

近日，一个来自麻省理工学院（MIT）的团队公开了他们的研究成果。该文章指出，对抗样本(Adversarial Sample)导致图像识别（Image Classification）失效的现象，或许只是人类的一种“自以为是”。识别模型捕捉的，其实是那些不能被人眼察觉的“非稳健特征”（Non-robust Feature）。如果只是基于这些像素层面的特征，模型对对抗样本的识别就不能被认为是失败的。

几乎所有图像识别算法都存在一个弱点——对抗样本问题。对抗样本是指在一张自然图片中，对少部分像素点的数值进行修改,即使修改不足以被人眼察觉，但识别算法却做出完全错误的判断，比如把小狗识别成鸵鸟。这可能成为致命的安全漏洞，比如让自动驾驶的汽车偏离车道，或者让监控探头无法发现罪犯的身影。《给 T 恤印上一个图案，就能在监控下实现“隐身”？》

图|左为自然图片，识别为“小狗”。右为刻意修改后的对抗样本，识别为“鸵鸟”。（来源：Christian Szegedy/Google Inc.）

目前许多研究机构（如谷歌公司、麻省理工学院和腾讯科恩实验室）都在尝试解决对抗样本问题。其中主要的难题存在于三个方面，首先是视觉世界的复杂性，比如一张图片中通常存在上百万个像素点。其次，我们并没有彻底地理解卷积神经网络模型（CNN）实现图像识别的机制。此外，科学家不知道识别模型失效的原因是训练方式的问题还是训练数据量不够大？

麻省理工学院的科研团队发现，目前常用的识别模型其实是通过关注图片中，人眼无法察觉的细节来实现图像识别。就如同人类会对比耳朵的不同，而将狗和猫的照片区分出来一样。但是AI模型却是在像素的层面进行区分。

论文的第一作者，麻省理工学院在读博士生 Andrew Ilyas 说道：“对于那些像素层面的特征，它们最大的特点就是不会被人眼察觉。”

想要弄明白 AI 到底是依据什么特征来识别图像并不容易。Andrew Ilyas等人首先定义了一整套理论框架。他们把图片中的特征分成两类：“稳健特征”(Robust Features)，指即使做了像素层面的修改也不会影响识别结果的特征（如耳朵、胡须），和 “非稳健特征”(Non-robust Features)，即会被像素修改而影响的特征（通常无法被人类识别）。

其次，他们又定义了两种训练模型的方法，“标准训练”（Standard Training）和“稳健训练”（Robust Training）。稳健训练的损失方程额外考虑了对抗样本的存在，使得模型在训练中可以强化对稳健特征识别。

AI把狗认成猫只因它在捕捉人类看不到的特征

图|标准训练和稳健训练的损失方程。稳健训练中划线的部分表示修改原始数据，使之成为对抗样本。（来源：Andrew Ilyas/MIT）

他们假设稳健特征和非稳健特征同时存在。并且使用和生成对抗网络（GAN）相似的方法，将原始的训练数据集（D）中的图片进行重新加工，生成了两个新的数据集：将非稳健特征洗刷掉、只含稳健特征的 D_R，和在人类看来错误标注、但非稳健特征符合其标注的 D_NR。

AI把狗认成猫只因它在捕捉人类看不到的特征

图|左：原始训练数据 D，只含稳健特征的 D_R，和失去特征一致性的 D_NR。右：三种数据集在不同训练方式下的准确率。（来源：Andrew Ilyas/MIT）

研究人员指出，由于只有稳健特征，D_R 所含的信息量少于原始数据 D。实验发现，再以 D_R 为基础，以标准训练的方法得到的识别模型，同样可以抵御对抗样本。以此证明像素层面的修改（人眼无法分辨），并不影响图片中的稳健特征。

另一方面，研究人员对训练数据（D）进行像素层面的修改，并且不断优化，让标准模型尽可能地把图片识别成另一个类型。比如，稳健特征（人眼观察）是“狗”，而非稳健特征和标注（模型认为）则是“猫”。

研究人员将经过修改的图片集计作 D_NR，并找来一张训练数据之外的自然中“猫”图片进行测试。识别器成功把这张外来的图片也识别成了“猫”。说明这张自然的“猫”，和 D_NR 中的“猫”具有可以被模型识别的相同属性，而这个属性就是我们看不到的“非稳健特征”。

图|图中右侧“狗”的图像，和下方“猫”的图像，都被识别成了“猫”，他们有相同的非稳健特征。（来源：Andrew Ilyas/MIT）

通过实验，Andrew Ilyas 和他的团队确定：稳健特征和非稳健特征都存在于图片之中，并且一般的识别模型只会通过非稳健特征进行图像识别，而非稳健特征不能被人眼察觉。所以，对抗样本本身并不是图像识别的漏洞，只是另外一种无法被我们看到的特征而已。

“这并不是模型本身有什么问题，只是那些真正决定识别结果的东西并不能被看到。”该论文第二作者、麻省理工学院在读博士生 Shibane Santurkar 补充道：“如果我们只知道算法的决策取决于一些我们看不见的东西，那我们又怎么能理所当然地以为它做的决定就是正确的？”如果一个人需要在法庭上证明监控视频中的人不是自己就会非常麻烦，因为我们不知道监控识别的错误结果是怎么得来的。

科学家始终需要面对一个抉择，模型究竟是应该做出“准确”的决定，还是应该做出“人类”的决定？如果模型只是识别稳健特征，它或许就不会那么准确。然而如果决策机制偏向不能被看到的非稳健特征，那么对抗样本就会成为潜在的漏洞。如今，图像识别技术已广泛应用在日常生活中，我们需要在这两个选择之间找到某种平衡。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

图像识别

图像识别

+关注

关注
8

文章
446

浏览量
37905
AI

AI

+关注

关注
87

文章
26403

浏览量
264006

原文标题：AI把“狗”认成“猫”，只因它在捕捉人类看不到的特征

文章出处：【微信号：deeptechchina，微信公众号：deeptechchina】欢迎添加关注！文章转载请注明出处。

STM32H743的SD作为U盘读取，电脑一直检测不到设备是为什么？

stm32h743，usb otg id端口悬空，如何配置才能作为从设备让电脑用type-c识别，是将GUSBCFG的FDMOD置为1么，仿真的时候怎么观察不到这个寄存器的变化，程序明明置为1了，寄存器数据没有变化（用了另一块阿波罗的板子，可以检测到设备，但是仿真同样看不到

发表于 04-07 08:48

XMC440 platform2go在环回模式下进行SPI通信，在CRO中看不到任何时钟和芯片选择信号的原因？

arduino COOLDIM_PRG_BOARD上存在的 SPI 引脚。我只选择了直接模式的 SPI_MASTER，并使用 SPI_MASTER_TRANSMIT 函数检查时钟是否正在产生。问题是我在 CRO 中看不到任何时钟和芯片选择信号。请告诉我需要遵循哪些步骤，或者我遗漏了什么。

发表于 03-05 07:11

为什么在PSoc3 Creator上看不到topDesign.cydwr页面选项卡？

为什么我在 PSoc3 Creator 上看不到 topDesign.cydwr 页面选项卡？

发表于 01-25 07:51

TC387 rdc（解析器）代码不起作用的原因？

我正在解码解析器信号，我正在使用为 TC38x 电机控制软件下载的 edsadc 和 rdc 库。当我馈送解析器信号时，我看不到任何转换结果，因为它在 1 到 65536 值之间滑动。正如你在

发表于 01-22 06:17

奥特曼称相信AI无法替代人类

奥特曼称相信AI无法替代人类 AI对于人类的威胁一直有很多讨论，各有不同观点，很多人对于科幻电影中的场景AI机器人伤害

发表于 01-19 11:43 •642次阅读

用ad8015输出时接示波器，50欧下看不到波形是为什么？

请问adi的工程师，我用ad8015这颗芯片输出时接示波器，50欧下看不到波形，1m可以看到，但是他数据手册上不是输出阻抗是50欧吗，我的电路接法也是按照参考电路接法来的，求解？？？？

发表于 11-22 07:38

MDK5提示找不到支持的芯片怎么解决？

使用MDK5.26版本。已经安装了STM32F103的package包。打开一个MDK4的工程，提示不支持MDK4什么之类的，这个不重要。打开工程设置，看不到支持芯片列表。这如何解决。

发表于 10-23 08:21

SMD电阻上看不到丝印？在这里！

Q A 问： SMD 电阻无丝印制程你是否注意到，有些厂商已不再在其贴装电阻上印丝印了？这是为什么呢？答案很简单，他们在制程中采取了一个步骤，不仅节约了印丝印的时间，还降低了丝网印刷的成本，而且不会对物料性能产生任何影响。小型表面贴装电阻通常也不带丝印，因为面积太小无法打印。他们的料盘上会标有所需的信息。越来越多的厂商纷纷效仿这一操作，也使之成为了一种趋势。此外，如果你购买的是单个物料或物料已安装在电路板上，

发表于 10-19 09:20 •355次阅读

用Freertos在串口中断中释放信号量，线程捕捉不到是为什么？

用Freertos在串口中断中释放信号量，线程捕捉不到

发表于 10-15 10:40

RTT的消息队列例程中看不到线程1是为什么？

　　请问RTT的消息队列例程中看不到线程1（接收消息）是什么原因？

发表于 08-04 16:14

AI如何对抗Dota人类游戏高手

AI如何对抗Dota人类游戏高手？OpenAI这样回答

发表于 08-01 15:01 •370次阅读

详解halcon函数的封装方法

指Halcon中最基础、最底层的函数（即你看不到它的代码实现），一个算子只有一句话，例如threshold算子。

发表于 07-10 10:49 •637次阅读

AI 人工智能的未来在哪？

人工智能、AI智能大模型已经孵化；繁衍过程将突飞猛进，ChatGPT已经上线。世界首富马斯克认为AI对人类是一种威胁；谷歌前CEO施密特认为AI和机器学习对

发表于 06-27 10:48

将CH_PD引脚连接到Arduino Uno 的 3.3v引脚时，在Arduino IDE中看不到端口选项是为什么？

到 Arduino Uno 的 3.3v 引脚时。ESP-01 指示灯熄灭，Arduino 与我的电脑断开连接。我在 Arduino IDE 中也看不到端口选项。我的研究到现在：我到处搜索这个问题，但没有

发表于 06-07 06:29

【鲁班猫创意氛围赛】基于鲁班猫0W的极点云智能公网LORA网关与AI_SSD模型物体归类重力双轴云台

本帖最后由 donatello1996 于 2023-5-16 17:00 编辑野火出品，必属精品，火哥在去年年底推出、今年开始正式售卖的鲁班猫0/0W系列，是入门瑞芯微RK356X系列

发表于 05-16 01:49

搜索历史

AI把狗认成猫只因它在捕捉人类看不到的特征

评论

STM32H743的SD作为U盘读取，电脑一直检测不到设备是为什么？

XMC440 platform2go在环回模式下进行SPI通信，在CRO中看不到任何时钟和芯片选择信号的原因？

为什么在PSoc3 Creator上看不到topDesign.cydwr页面选项卡？

TC387 rdc（解析器）代码不起作用的原因？

奥特曼称相信AI无法替代人类

用ad8015输出时接示波器，50欧下看不到波形是为什么？

MDK5提示找不到支持的芯片怎么解决？

SMD电阻上看不到丝印？在这里！

用Freertos在串口中断中释放信号量，线程捕捉不到是为什么？

RTT的消息队列例程中看不到线程1是为什么？

AI如何对抗Dota人类游戏高手

详解halcon函数的封装方法

AI 人工智能的未来在哪？

将CH_PD引脚连接到Arduino Uno 的 3.3v引脚时，在Arduino IDE中看不到端口选项是为什么？

【鲁班猫创意氛围赛】基于鲁班猫0W的极点云智能公网LORA网关与AI_SSD模型物体归类重力双轴云台

搜索历史

AI把狗认成猫 只因它在捕捉人类看不到的特征

评论

AI把狗认成猫只因它在捕捉人类看不到的特征