0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于对图像识别的深度学习算法的逐点剖析

姚小熊27 来源:互联网 作者:互联网 2020-09-29 09:47 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

如今,深度学习已经贯穿于我们的生活,无论是汽车自动驾驶、AI 医学诊断,还是面部、声音识别技术,无一没有 AI 的参与。然而,尽管人们早已明了深度学习的输入和输出,却对其具体的学习过程一无所知。

近日,针对这一问题,奥本大学(Auburn university)计算机科学和软件工程副教授 Anh Nguyen 对图像识别的深度学习算法进行了逐点剖析;无独有偶,加州大学欧文分校(UC Irine) 计算机科学副教授 Sameer Singh 正在制作归因图(attribution maps),以帮助理解为何自然语言算法懂得与你交谈,并说出一些涉及种族主义的话。

机器学习(machine learning)是人工智能的一种形式,它使用大量的数据来训练自己对某些问题形成算法。例如,向机器提供成千上万张标有“猫”的照片,它就能学会识别“猫”这一生物。

Nguyen 说,机器学习的想法可以追溯到 20 世纪 50 年代,但直到最近,计算机才能够有效地处理大量数据,并得出精确结果。到 20 世纪 90 年代,机器学习算法仅使用简单的概念,但很明显,现实生活中存在各种复杂的问题,从而需要更复杂的算法,这就是深度学习的意义所在。

与机器学习不同,深度学习(deep learning)不需要结构化数据作为基础,利用人工神经网络(artificial neural net),即多个神经元一起工作,通过这些“神经元”来考虑数据并对数据进行分类。

神经网络非常擅长图像识别,当向它们提供足够的数据后,他们可以挑出人眼看不见的图案或差异。利用这一点,深度学习可以实现自动驾驶汽车的行人侦查或肿瘤筛查。

但是, 当出现超出其参数范围的输入时,神经网络也会崩溃。在特定的,狭窄定义的任务中,深度学习通常优于人类,但是一旦神经网络失效时,往往会导致严重的后果。如果错误识别的图像发生在肿瘤患者身上或自动驾驶车上时,后果可能是致命的。

但问题是这些系统是如此的密集和复杂,人类无法理解它们,对人类来说,深度学习如同一个科技黑箱。除了令人不安之外,我们无法理解的计算机程序还可以做出一些不可预测的事情,并且当它们出错时,很难对其进行反向工程或纠正。

正如 Nguyen 所说, “归根结底,我们要搞清楚为什么神经网络的行为是这样,而不是相反。”

揭示神经网络的想法

能彻底搞乱人工智能的数据被称为“对抗性数据”,它会导致一个通常可靠的神经网络犯下奇怪的错误。静态的、波浪状的人字纹,以及五颜六色的条纹,可能被 AI 自信地识别为“蜈蚣”或“熊猫”。

不仅如此,一些常见的图像也会让深度学习人工智能崩溃。把消防车图片倒过来,AI 就会看到一个大雪橇;放大一辆公共汽车的窗户,它在 AI 眼中就变成了一个出气筒。

“令人震惊的是,我们发现这些网络会在某种程度上被这些奇怪的图案所愚弄,这是我们从未想象过的。”Nguyen 表示。

为了找出原因,Nguyen 创建了一个叫做 DeepVis 的工具来分析神经网络算法。该工具能够将深入学习 AI 的完整程序分离开来,并显示出单个神经元正在识别的内容。从这里开始,Nguyen 能够打破深入学习AI的连续工作进程,从而理解它是如何一步步达到最终检测结果的。

将识别对象简单的随机旋转几次,就足以将 AI 的分类精度从 77.5% 降到3%

由于神经网络这种复杂性,对其所做的“解剖”对于人工智能开发人员最有用,提供的大量细节可以帮助科学家们更深入地理解破解黑箱所需的神经网络训练,就好比医生对于肿瘤的研究一样。

但是,即使使用 DeepVis,黑箱的秘密可能也不会完全打开。神经元群的绝对复杂性可能让人类难以理解,毕竟它是一个黑箱。

2016 年,来自波士顿大学和微软研究院的研究人员为一种算法提供了 300 多万英文单词的数据集,数据从谷歌新闻文章中提龋研究人员重点关注那些最常用的英文单词,然后让算法做完形填空。

“男人(Man)之于程序员(computer programmer),那么女人(woman)之于什么”,机器通过算法“思考”后,得出答案:“家庭主妇(homemaker)”。

很明显, AI也会发出类似于人类社会的性别歧视和种族主义言论。为了找出其中的原因,专注于破解自然语言处理(NLP)算法黑箱并提出深度学习思维(deep learning thinking)这一概念的 Sameer Singh,使用了一种叫做归因图(attribution map)的工具:将语言插入到文本生成 NLP 算法中,归因图将突出显示某些部分,展示什么在神经网络内部“发光”也许是一个特定的字母组合。

Singh 的团队首先使用某些单词,开发出特殊的触发器,然后,他们按照归因图所说的算法最“感兴趣”的模板来修改这些单词,最终的结果是一连串的文字和半拼写错误,从而引发了某些看起来像“种族主义”的言论。

“突出显示的内容对模型的预测或输出有很大的影响,”Singh 说,利用这些信息,可以使用故意的对抗触发器来尝试发现问题,并理解深度学习算法中的联系。这足以让人们了解人工智能的想法。

虽然归因图也有缺点,不同的地图生成器可能彼此不一致,但是大概的理解可能是我们所能获得的最好的理解。

AI 黑箱 VS 人类黑箱

事实上,随着算法变得更加复杂、更加强大和不透明化,围绕黑箱的问题也进一步深入到哲学上:当我们人类自己的神经网络仍然神秘时,要求 AI 神经网络完全透明是公平的吗?

不得不承认,人类本身的神经网络也是一个黑箱。我们虽然知道一些物理结构,知道它们是如何工作,但对“思想”和“意识”的确切含义仍不清楚。

接下来我们是否应该思考,机器模仿人脑并继承其精确、灵活等优点的同时,是否也继承了人性中的偏见?

当然,随着未来科学家们在深度学习领域中不断取得的突破,由人类创造的 AI 黑箱终将变成“灰色”。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像识别
    +关注

    关注

    9

    文章

    529

    浏览量

    39834
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136216
  • 深度学习
    +关注

    关注

    73

    文章

    5590

    浏览量

    123890
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    电压放大器在全导波场图像目标识别的损伤检测实验的应用

    图像目标识别的智能损伤检测方法,通过结合超声导波检测技术与深度学习算法,系统探究了损伤引起的波场畸变特性及其
    的头像 发表于 12-02 11:37 57次阅读
    电压放大器在全导波场<b class='flag-5'>图像</b>目标<b class='flag-5'>识别的</b>损伤检测实验的应用

    基于米尔MYC-YM90X安路飞龙DR1开发板仪表图像识别系统开发

    资源,具备强大计算能力与灵活定制特性,为构建高性能仪表图像识别系统带来新机遇。通过合理利用其异构架构,可实现图像识别算法的高效执行,提升系统实时性与准确性。 二、安路飞龙 FPSOC 架构分析
    发表于 08-17 21:29

    国家级认证!拓维海云天“中文手写体作文图像识别评分生成算法”通过国家网信办备案

    近日,国家互联网信息办公室发布第十二批深度合成服务算法备案公告,拓维海云天自主研发的核心技术成果——“中文手写体作文图像识别评分生成算法”成功通过备案(备案编号:250011号)。这是
    的头像 发表于 08-15 16:42 1143次阅读
    国家级认证!拓维海云天“中文手写体作文<b class='flag-5'>图像识别</b>评分生成<b class='flag-5'>算法</b>”通过国家网信办备案

    华怡丰推出ISC-B/C系列图像识别传感器

    在工业自动化领域,精准、高效的视觉检测是提升生产效率的关键。华怡丰全新推出的ISC-B/C系列图像识别传感器集高精度定位、测量算法与先进图像处理技术于一体,为各类工业场景提供稳定、可靠的解决方案!
    的头像 发表于 08-15 11:36 1445次阅读
    华怡丰推出ISC-B/C系列<b class='flag-5'>图像识别</b>传感器

    火车车号图像识别系统如何应对不同光照条件下的识别问题?

    在铁路运输管理中,准确识别火车车号是实现自动化车辆管理的关键环节。然而,实际应用场景中复杂多变的光照条件给车号识别带来了巨大挑战。现代火车车号图像识别系统通过多项技术创新,有效解决了这一难题。 多
    的头像 发表于 07-15 11:37 528次阅读
    火车车号<b class='flag-5'>图像识别</b>系统如何应对不同光照条件下的<b class='flag-5'>识别</b>问题?

    深度学习遇上嵌入式资源困境,特征空间如何破局?

    近年来,随着人工智能(AI)技术的迅猛发展,深度学习(Deep Learning)成为最热门的研究领域之一。在语音识别图像识别、自然语言处理等领域,
    发表于 07-14 14:50 1114次阅读
    当<b class='flag-5'>深度</b><b class='flag-5'>学习</b>遇上嵌入式资源困境,特征空间如何破局?

    【高云GW5AT-LV60 开发套件试用体验】基于开发板进行深度学习实践,并尽量实现皮肤病理图片的识别

    收到开发板已经有一段时间了,最初申请的时候写的是希望能够实现基于fpga的图像识别相关的项目,最初对这个还是有些模糊的,不过这几天折腾下来,似乎有点思路了,但是毕竟基础还是有点薄弱,所以废话不多
    发表于 06-11 22:35

    手持终端集装箱识别系统的图像识别技术

    行业提供了更灵活、精准的管理工具。 一、技术核心:OCR+AI深度融合 现代手持终端系统采用多模态图像识别技术,结合深度学习算法,可快速捕捉
    的头像 发表于 04-03 10:49 542次阅读

    岸桥箱号识别系统如何工作?揭秘AI图像识别技术!

    在港口自动化升级的浪潮中,AI岸桥识别系统凭借前沿的图像识别技术,成为提升码头作业效率的“智慧之眼”。那么,这套系统如何实现集装箱信息的精准捕捉?又是如何通过AI技术替代传统人工理货?让我们一探
    的头像 发表于 04-02 09:45 531次阅读

    【幸狐Omni3576边缘计算套件试用体验】RKNN 推理测试与图像识别

    【幸狐 Omni3576 边缘计算套件测评】RKNN 推理测试与图像识别 本文介绍了幸狐 Omni3576 边缘计算套件实现 RKNN 推理和图像物体识别的测试流程,包括 RKNN 介绍、环境搭建
    发表于 03-20 16:14

    SLAMTEC Aurora:把深度学习“卷”进机器人日常

    在人工智能和机器人技术飞速发展的今天,深度学习与SLAM(同步定位与地图构建)技术的结合,正引领着智能机器人行业迈向新的高度。最近科技圈顶流DeepSeek简直杀疯了!靠着逆天的深度学习
    的头像 发表于 02-19 15:49 721次阅读

    BP神经网络在图像识别中的应用

    BP神经网络在图像识别中发挥着重要作用,其多层结构使得网络能够学习到复杂的特征表达,适用于处理非线性问题。以下是对BP神经网络在图像识别中应用的分析: 一、BP神经网络基本原理 BP神经网络,即反向
    的头像 发表于 02-12 15:12 1182次阅读

    AI模型部署边缘设备的奇妙之旅:目标检测模型

    1简介人工智能图像识别是人工智能领域的一个重要分支,它涉及计算机视觉、深度学习、机器学习等多个领域的知识和技术。图像识别主要是处理具有一定复
    的头像 发表于 12-19 14:12 1728次阅读
    AI模型部署边缘设备的奇妙之旅:目标检测模型

    如何提升人脸门禁一体机的识别准确率?

    准确率,可以从以下几个方面进行改进。一、优化算法与模型人脸识别的核心在于算法的优化和模型的调整,目前深度学习技术在
    的头像 发表于 12-10 15:05 1450次阅读
    如何提升人脸门禁一体机的<b class='flag-5'>识别</b>准确率?