0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一张用打印机简单打印出来的涂鸦贴画贴在路牌上就可以让AI自动驾驶系统完全误分类

DPVg_AI_era 来源:lq 2019-05-07 09:08 次阅读

自动驾驶的安全性是非常值得关注的。而最近由北京航空航天大学、悉尼大学和剑桥大学的一项新研究表明,一张纸便可以“迷惑”AI自动驾驶系统。

一张简单的涂鸦贴画就能让AI自动驾驶系统产生致命错误乃至车毁人亡!

来自北京航空航天大学(Beihang University)、悉尼大学(University of Sydney)和剑桥大学(University of Cambridge)的一项最新研究成果显示,将一张用打印机简单打印出来的涂鸦贴画贴在路牌上就可以让AI自动驾驶系统完全误分类

图1 利用对抗补丁在真实世界中攻击自动驾驶系统

如上图所示,将生成的涂鸦贴画贴在北航校园中标为“限速20km/h”的真实路牌上后,AI自动驾驶系统完全被误分类,将其识别为“No Entry”(禁行)。该涂鸦贴画在论文中被称为 “对抗补丁”(adversarial patch),正是这块补丁 “欺骗” 了 AI 自动驾驶系统,让系统将该路牌误分类,在top-5分类中都没有正确标签“限速20km/h”。

该团队发表了题为Perceptual-Sensitive GAN for Generating Adversarial Patches的论文。该论文使用对抗生成网络(GAN)来生成视觉保真度较好且与场景语义相关度较高的对抗补丁(如:路牌和贴画,路牌和涂鸦等),可以在数字世界(digital-world)和物理世界(physical-world)完成深度学习模型的攻击,目前该论文已在全球人工智能顶级会议AAAI-2019上发表。

论文地址:

https://www.aaai.org/Papers/AAAI/2019/AAAI-LiuA.723.pdf

经实验证实,用该方法生成的对抗补丁 (adversarial patch)具有稳定的攻击效果,将其贴在路牌上后,不会影响人类对于路牌语义信息的认知,且由于场景语义相关性人类也不会感觉到“违和”;但是,该对抗补丁对于AI自动驾驶系统则是毁灭性的。例如,这种攻击可能被恶意地用来攻击自动驾驶系统,入侵者只要将一小片贴画贴在路牌上,当自动驾驶汽车驶过时就可能会造成系统的致命错误,导致车祸产生。

使用对抗生成网络(GAN)生成对抗补丁

该论文提出了一种使用对抗生成网络来生成视觉保真度较好且与场景语义相关度较高的对抗补丁的方法(PS-GAN),并且结合系统分类器注意力信息使得补丁的攻击具备稳定性。算法模型提出了一种Patch-to-patch translation的过程,将输入的普通涂鸦图片转换生成为具有攻击性的涂鸦图片。算法的整体架构如下:

图 2 算法PSGAN架构图

为了达成效果,PSGAN的优化目标包含以下几个部分:

提升视觉保真度和感知相关性

为了提升生成的对抗补丁的视觉保真度,他们引入了GAN损失函数:

同时,为了保持感知相关性并控制扰动在合适的范围内,他们引入了patch损失函数:

对抗补丁的攻击性

为了使产生的对抗补丁具有攻击性,我们引入了attack损失函数的损失函数:

该损失函数的目标是让生成的对抗补丁贴在图片上后,深度学习模型分类器对于该图片的正确类别的预测降低。

整体的优化函数

将整个优化过程转化为对抗生成的极大极小优化过程:

模型的注意力敏感度

为了进一步提升对抗补丁的攻击效果和稳定性,该论文选择让对抗补丁放置在深度学习模型分类敏感的位置。最直观的思路是利用注意力机制(attention & saliency),选择图片中对于模型分类最敏感最重要的区域去放置对抗补丁实施攻击。

实验结果:自动驾驶真的安全吗?

通过实验结果评估 生成的对抗补丁的有效性。主要针对GTSRB和ImageNet数据集进行测试。

视觉效果

图 3 不同算法生成的对抗补丁的视觉效果

通过上图展示可以看出,作者提出的算法(第三行PSGAN)与其他对比算法相比,生成的对抗补丁具有非常好的视觉效果和语义相关性。对比算法生成对抗补丁一般都是比较杂乱的噪音,放置在图片中显得非常突兀;PSGAN生成的对抗补丁视觉效果较好,而且具备较高的语义相关性(如:猩猩与苹果,路牌与涂鸦贴画等)。

攻击效果

为了验证模型生成的对抗补丁的攻击性,论文分别从白盒攻击(white-box)和黑盒攻击(black-box)的角度进行了测试。

在黑盒攻击场景下,算法通过在一种模型上生成对抗补丁并迁移攻击其它模型,可以从下表中看到,由PSGAN产生的对抗补丁具有很好的迁移攻击性。这说明,入侵者可以不用了解目标AI自动驾驶系统所使用的算法模型,只需要使用该算法生成对抗补丁,就可以利用其迁移性实施攻击。

图 4 GTSRB数据集下模型在对抗补丁黑盒攻击场景下的分类准确率

在白盒攻击场景下,算法基于给定的模型生成对抗样本并对该模型实施攻击。生成的对抗补丁在保持较高语义相关性的同时,仍能具备较强的攻击性。

与此同时,研究团队为了验证生成对抗补丁的攻击性不是由于遮盖了目标的关键信息,还使用了普通的 patch 进行了实验。比如他们会使用普通的涂鸦贴画贴在同样的位置,通过结果看到,深度学习模型的分类准确率基本上没有明显的变化,这更证明了生成的对抗补丁的攻击性。

图 5 模型在对抗补丁白盒攻击场景下的分类准确率(ImageNet只选择了部分类别)

最后,为了验证算法生成的对抗补丁的攻击稳定性,论文还对算法训练不同周期时生成的对抗补丁的攻击性的效果进行了测试。如图所示,可以看到PSGAN的攻击性较为稳定,攻击能力持续上升并最终保持稳定;而对比算法产生的对抗补丁的攻击性则不稳定,训练了几百个epoch之后仍会产生较大的波动。

图 6 算法攻击稳定性

真实世界(physical-world)中的攻击性

图 7 真实世界中的攻击

为了验证算法生成的对抗补丁再真实世界中也具有攻击性,论文选择在北京航空航天大学校园中的真实路牌上(限速20km/h)进行验证。作者使用普通的打印机将生成的对抗补丁打印出来,并贴在路牌的合适位置,选择不同距离(1米,3米,5米)和角度(0°,15°,30°,-15°,-30°)拍照并测试深度学习模型的分类结果,其平均分类准确率从86.7%降低至17.2%。人类对于路牌语义信息没有任何误解,也不会对于贴画感到“违和”,但是深度学习模型则产生了致命分类错误。

未来展望

虽然人工智能技术在各个领域都取得了巨大的成功过,但是人工智能安全问题仍不容忽视。近日,清华大学的朱军教授所带领的团队提出了一种基于决策的黑盒攻击方法——演化攻击(Evolutionary Attack)来攻击人脸识别系统[可加链接];比利时鲁汶大学 (KU Leuven) 几位研究人员最近的研究发现,借助一张简单打印出来的对抗补丁,就可以大大降低监控系统对人类的识别率,可以将人隐藏起来。

与此同时,即使AI自动驾驶已经取得了成功并在现实世界中应用,但由北京航空航天大学(Beihang University)、悉尼大学(University of Sydney)和剑桥大学(University of Cambridge)的研究人员提出的算法PSGAN仍可以在黑盒场景下对其系统进行攻击。可以说,这个方法将真实世界自动驾驶存在的安全漏洞极大地暴露了出来。

当然,对抗攻击技术的进步也将催生更多对于模型鲁棒性、稳定性和安全性的研究和发展。未来,如何打造安全、可靠的人工智能系统则显得至关重要。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26410

    浏览量

    264016
  • 自动驾驶
    +关注

    关注

    773

    文章

    13022

    浏览量

    163187
  • 深度学习
    +关注

    关注

    73

    文章

    5235

    浏览量

    119893

原文标题:危险!一张贴画就能迷惑AI,对抗补丁或让自动驾驶车毁人亡

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    中国传动网:能打印房子的3D打印机堪比篮球场

    方便面式外表纹理的房子,并非由工人一砖一瓦砌出来,而是由台3D打印机,在24小时内打印出来的。更令人惊叹的是,这些房子“建成”总共只花费了
    发表于 04-22 16:14

    我是做设计电子仪器的,什么样的3D打印机

    我是做设计电子仪器的,什么样的3D打印机?平时设计仪器产品给客户看,因为设计出来产品后要马上给客户看,所以想给3D打印机直接把设计
    发表于 05-07 14:25

    Allegro怎样打印出来的焊盘空心

    请问下,Allegro怎样打印出来的焊盘空心就像AD里面的把焊盘孔给打印出来那样,便于人工钻孔。
    发表于 08-05 21:07

    激光打印机如何加碳粉

    ,是激光打印机所使用的介质,碳粉是打印机在强大的磁场下转移到打印纸张,从而形成我们需要打印的图片,通俗点说
    发表于 11-29 15:02

    关于Labview调用斑马打印机打印标签

    `类似于打印这种标签的,需要Labview调用斑马打印机打印出来,我之前打印机是调用Ac
    发表于 09-12 11:45

    想自己DIY打印机,但不知道怎么实现电脑与打印机的数据传输?

    我想自己DIY打印机,但不知道怎么实现电脑与打印机的数据传输(就是不知道怎么才能实现将电脑的文件通过打印机
    发表于 03-17 14:15

    单片机控制松下打印机KX_P1131+遇到“积”“数”这两个字不能打印出来

    本人遇到个问题,打印的时候基本的汉字都没有问题,但是遇到“积”“数”这两个字的时候,发现51单片机控制打印机没有打印出来,空白的。同时在
    发表于 10-09 09:11

    CAD制图软件中绘制的彩色图纸打印出来后变成灰色了怎么办?

    的出现就可以了。以上就是浩辰CAD制图软件中绘制的彩色图纸打印出来后变成灰色的原因以及解决办法,有需要的小伙伴可以参考本篇CAD教程来解决哦~
    发表于 10-26 17:14

    CAD制图软件中绘制的彩色图纸打印出来后变成灰色的原因以及解决办法

    得到清晰的出图效果。例如默认的monochrome.ctb是黑白打印样式,如下图所示:   CAD打印出现图纸部分显示为灰色的时候,不用着急,这是因为没有设置单色打印所以打印机
    发表于 12-02 14:07

    华为首款鸿蒙系统打印机打印颠覆传统打印体验

    的首款鸿蒙打印机,华为PixLab X1激光多功能打印机的连接方式与其他的智能家居产品简单,只给手机下载安装智慧生活App后,根据界面的提示就可
    发表于 11-01 18:39

    3D打印机:哥打印的不是成品,是模型!

    很多人对3D打印机打印出来的东西会有很大的疑问,即:打印出来的是能用的成品吗?有人认为打印出来的汽车能开...打印出来的苹果能吃...其实,
    发表于 01-28 09:08 5754次阅读

    3d打印机结构_3d打印机分类

    3D打印机简称(3DP)是一位名为恩里科·迪尼的发明家设计的一种神奇的打印机,不仅可以打印”一幢完整的建筑,甚至可以在航天飞船中给宇航员
    的头像 发表于 04-28 14:19 2w次阅读

    使用光驱制作简单的3D打印机

    3D打印机(3DPrinters)简称(3DP)是一位名为恩里科·迪尼(EnricoDini)的发明家设计的一种神奇的打印机,不仅可以打印”一幢完整的建筑,甚至
    的头像 发表于 05-05 17:10 7070次阅读

    如何利用3D打印机打印出PCB电路板

    中国在这方面已经有了先进的技术,北京梦之墨便是其中的代表。梦之墨是一种液态金属墨水,墨水可以导电,置入3D打印机中,便可精确地把PCB打印出来。此项技术打破了电子制造技术的瓶颈和壁垒,使打印机
    发表于 10-04 16:56 1.3w次阅读

    热敏电阻在打印机中的作用

    打印机在工作时产生热量,可以摸到打印机的机身很热,而且打印出来的纸张也是热的,这是为什么呢?
    的头像 发表于 04-12 10:02 1627次阅读