0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI把狗认成猫 只因它在捕捉人类看不到的特征

电子工程师 来源:fqj 2019-05-16 17:06 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,一个来自麻省理工学院(MIT)的团队公开了他们的研究成果。该文章指出,对抗样本(Adversarial Sample)导致图像识别(Image Classification)失效的现象,或许只是人类的一种“自以为是”。识别模型捕捉的,其实是那些不能被人眼察觉的“非稳健特征”(Non-robust Feature)。如果只是基于这些像素层面的特征,模型对对抗样本的识别就不能被认为是失败的。

几乎所有图像识别算法都存在一个弱点——对抗样本问题。对抗样本是指在一张自然图片中,对少部分像素点的数值进行修改,即使修改不足以被人眼察觉,但识别算法却做出完全错误的判断,比如把小狗识别成鸵鸟。这可能成为致命的安全漏洞,比如让自动驾驶的汽车偏离车道,或者让监控探头无法发现罪犯的身影。《给 T 恤印上一个图案,就能在监控下实现“隐身”?》

图|左为自然图片,识别为“小狗”。右为刻意修改后的对抗样本,识别为“鸵鸟”。(来源:Christian Szegedy/Google Inc.)

目前许多研究机构(如谷歌公司、麻省理工学院和腾讯科恩实验室)都在尝试解决对抗样本问题。其中主要的难题存在于三个方面,首先是视觉世界的复杂性,比如一张图片中通常存在上百万个像素点。其次,我们并没有彻底地理解卷积神经网络模型(CNN)实现图像识别的机制。此外,科学家不知道识别模型失效的原因是训练方式的问题还是训练数据量不够大?

麻省理工学院的科研团队发现,目前常用的识别模型其实是通过关注图片中,人眼无法察觉的细节来实现图像识别。就如同人类会对比耳朵的不同,而将狗和猫的照片区分出来一样。但是AI模型却是在像素的层面进行区分。

论文的第一作者,麻省理工学院在读博士生 Andrew Ilyas 说道:“对于那些像素层面的特征,它们最大的特点就是不会被人眼察觉。”

想要弄明白 AI 到底是依据什么特征来识别图像并不容易。Andrew Ilyas等人首先定义了一整套理论框架。他们把图片中的特征分成两类:“稳健特征”(Robust Features),指即使做了像素层面的修改也不会影响识别结果的特征(如耳朵、胡须),和 “非稳健特征”(Non-robust Features),即会被像素修改而影响的特征(通常无法被人类识别)。

其次,他们又定义了两种训练模型的方法,“标准训练”(Standard Training)和“稳健训练”(Robust Training)。稳健训练的损失方程额外考虑了对抗样本的存在,使得模型在训练中可以强化对稳健特征识别。

AI把狗认成猫 只因它在捕捉人类看不到的特征

图|标准训练和稳健训练的损失方程。稳健训练中划线的部分表示修改原始数据,使之成为对抗样本。(来源:Andrew Ilyas/MIT)

他们假设稳健特征和非稳健特征同时存在。并且使用和生成对抗网络(GAN)相似的方法,将原始的训练数据集(D)中的图片进行重新加工,生成了两个新的数据集:将非稳健特征洗刷掉、只含稳健特征的 D_R,和在人类看来错误标注、但非稳健特征符合其标注的 D_NR。

AI把狗认成猫 只因它在捕捉人类看不到的特征

图|左:原始训练数据 D,只含稳健特征的 D_R,和失去特征一致性的 D_NR。右:三种数据集在不同训练方式下的准确率。(来源:Andrew Ilyas/MIT)

研究人员指出,由于只有稳健特征,D_R 所含的信息量少于原始数据 D。实验发现,再以 D_R 为基础,以标准训练的方法得到的识别模型,同样可以抵御对抗样本。以此证明像素层面的修改(人眼无法分辨),并不影响图片中的稳健特征。

另一方面,研究人员对训练数据(D)进行像素层面的修改,并且不断优化,让标准模型尽可能地把图片识别成另一个类型。比如,稳健特征(人眼观察)是“狗”,而非稳健特征和标注(模型认为)则是“猫”。

研究人员将经过修改的图片集计作 D_NR,并找来一张训练数据之外的自然中“猫”图片进行测试。识别器成功把这张外来的图片也识别成了“猫”。说明这张自然的“猫”,和 D_NR 中的“猫”具有可以被模型识别的相同属性,而这个属性就是我们看不到的“非稳健特征”。

图|图中右侧“狗”的图像,和下方“猫”的图像,都被识别成了“猫”,他们有相同的非稳健特征。(来源:Andrew Ilyas/MIT)

通过实验,Andrew Ilyas 和他的团队确定:稳健特征和非稳健特征都存在于图片之中,并且一般的识别模型只会通过非稳健特征进行图像识别,而非稳健特征不能被人眼察觉。所以,对抗样本本身并不是图像识别的漏洞,只是另外一种无法被我们看到的特征而已。

“这并不是模型本身有什么问题,只是那些真正决定识别结果的东西并不能被看到。”该论文第二作者、麻省理工学院在读博士生 Shibane Santurkar 补充道:“如果我们只知道算法的决策取决于一些我们看不见的东西,那我们又怎么能理所当然地以为它做的决定就是正确的?”如果一个人需要在法庭上证明监控视频中的人不是自己就会非常麻烦,因为我们不知道监控识别的错误结果是怎么得来的 。

科学家始终需要面对一个抉择,模型究竟是应该做出“准确”的决定,还是应该做出“人类”的决定?如果模型只是识别稳健特征,它或许就不会那么准确。然而如果决策机制偏向不能被看到的非稳健特征,那么对抗样本就会成为潜在的漏洞。如今,图像识别技术已广泛应用在日常生活中,我们需要在这两个选择之间找到某种平衡。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像识别
    +关注

    关注

    9

    文章

    529

    浏览量

    39840
  • AI
    AI
    +关注

    关注

    89

    文章

    38106

    浏览量

    296642

原文标题:AI把“狗”认成“猫”,只因它在捕捉人类看不到的特征

文章出处:【微信号:deeptechchina,微信公众号:deeptechchina】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    影像仪AI自动寻边技术精准捕捉边界测量,检测效率翻倍!

    【智能制造测量】影像测量仪的AI自动寻边技术是通过深度学习模型,实现对工件特征的自主识别与边缘精准提取。能解决质检环节中多重边界提偏、刀纹干扰、对比度低等测量痛点。
    发表于 11-18 10:16

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    AI大家都很了解了吧;AGI是什么呢? AGI:通用人工智能,可以再各个应用领域都具备AI的处理能力。 AGI可以组成能够24小时连续工作的优秀员工队伍,他们拥有比人类更强的能力和领导力,能够
    发表于 09-18 15:31

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    载体,关键是能在能量载体的特征长度范围内操纵传输特性。 AI发挥的作用越来越大了,会有替代人类的一天吗?
    发表于 09-17 11:45

    使用CCU4产生3个PWM信号,在引脚 P0.8 上看不到任何 PWM 输出,为什么?

    P0.8 上看不到任何 PWM 输出。 我还尝试使用 P0.8 作为XMC_GPIO_MODE_OUTPUT_PUSH_PULL 的数字输出,但这也不起作用。 使用 P0.8 作为数字输出有什么限制吗?这和RTC_XTAL1有关系吗? 聚苯乙烯我不使用 RTC,也不在我的代码中执行任何 RTC 配置。
    发表于 07-14 07:01

    监控系统正常链接网络,但是看不到画面了,怎么解决?

    监控系统正常链接网络 但是看不到画面了 怎么办
    发表于 07-10 06:51

    任正非说 AI已经确定是第四次工业革命 那么如何从容地加入进来呢?

    。 尝试图像识别或个人语音助手等项目。利用现有的AI框架,如使用TensorFlow来构建一个简单的图像分类器,对等少数几种类别的图像进行分类。或者利用讯飞等平台的语音识别API,结合自己的编程
    发表于 07-08 17:44

    商汤科技与编程达成战略合作

    近日,商汤科技与青少年AI编程教育头部品牌编程正式达成战略合作。
    的头像 发表于 04-30 18:13 1508次阅读

    艾为产品赋能汤姆AI童伴机器人

    AI浪潮的掀起带动了一场关于童年陪伴的智能进化。AI童伴——会说话的汤姆,正引领着童年陪伴的全新变革。汤姆能够与孩子进行自然流畅的智能对话,对各类语音指令迅速做出精准反应。得益于
    的头像 发表于 04-24 13:40 673次阅读
    艾为产品赋能汤姆<b class='flag-5'>猫</b><b class='flag-5'>AI</b>童伴机器人

    《DNESP32S3使用指南-IDF版_V1.6》第六十章 脸检测实验

    第六十章 脸检测实验 脸检测与人脸检测一样,也是基于数字图像中查找和识别脸。本章,我们使用乐鑫AI库来实现脸检测功能。本章分为如下几
    发表于 04-01 09:28

    使用ADS1198-FE下载了软件按照说明进行了调试,出现了两个问题求解决

    使用ADS1198-FE,下载了软件按照说明进行了调试,但出现了两个问题: 1、工频干扰特别大,淹没了有用信号。后来我直接将通道2与信号发生器相接看波形,依旧有非常大的干扰,几乎看不到波形。 2
    发表于 02-07 08:24

    ADS1278EVM想进行数模转换,但是给通道一送入正弦波完全看不到转换结果,为什么?

    刚买的ADS1278EVM想进行数模转换,但是给通道一送入正弦波(峰峰值为0.2V--1.2V)完全看不到转换结果,就看到母板上8位数码管在闪,谢谢您能为我解答 ,搞了好几天了也没进展!
    发表于 01-15 08:23

    ADS7883无论如何都找不到输出,怎么回事?

    最近测试了ADS7883,无论如何都找不到输出,时序图拿示波器捕捉了,和芯片资料上是一致的,就是看不到输出。 怀疑是芯片买到假的了,有没有简单的方法判断下这颗芯片是好是坏啊?比如接电源后测试某些
    发表于 01-14 08:36

    使用AFE4300测量人体阻抗,用示波器看不到RDY的8us的触发信号,为什么?

    你好,我在使用AFE4300测量人体阻抗,打算使用FullWave方式,采用Continuous模式,但是用示波器看不到RDY的8us的触发信号, 下面是我的初始化步骤,麻烦你们看看是否正确
    发表于 01-13 08:11

    ADS129xECG-FE直接测人体信号时,看不到心电信号,为什么?

    ADS129xECG-FE 直接测人体信号时,看不到心电信号 接心电模拟仪信号很好。
    发表于 01-07 07:12

    请问AFE4900EVM看不到ECG波形怎么办?

    我在官网上购买了AFE4900EVM并下载了相关软件,现在测试spo2波形可以看到,但ECG波形怎么设置都看不到,仿真器和人体测试都试了。请问要怎样才能看到ECG 波形。
    发表于 12-11 06:11