0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于对图像识别的深度学习算法的逐点剖析

姚小熊27 来源:互联网 作者:互联网 2020-09-29 09:47 次阅读

如今,深度学习已经贯穿于我们的生活,无论是汽车自动驾驶、AI 医学诊断,还是面部、声音识别技术,无一没有 AI 的参与。然而,尽管人们早已明了深度学习的输入和输出,却对其具体的学习过程一无所知。

近日,针对这一问题,奥本大学(Auburn university)计算机科学和软件工程副教授 Anh Nguyen 对图像识别的深度学习算法进行了逐点剖析;无独有偶,加州大学欧文分校(UC Irine) 计算机科学副教授 Sameer Singh 正在制作归因图(attribution maps),以帮助理解为何自然语言算法懂得与你交谈,并说出一些涉及种族主义的话。

机器学习(machine learning)是人工智能的一种形式,它使用大量的数据来训练自己对某些问题形成算法。例如,向机器提供成千上万张标有“猫”的照片,它就能学会识别“猫”这一生物。

Nguyen 说,机器学习的想法可以追溯到 20 世纪 50 年代,但直到最近,计算机才能够有效地处理大量数据,并得出精确结果。到 20 世纪 90 年代,机器学习算法仅使用简单的概念,但很明显,现实生活中存在各种复杂的问题,从而需要更复杂的算法,这就是深度学习的意义所在。

与机器学习不同,深度学习(deep learning)不需要结构化数据作为基础,利用人工神经网络(artificial neural net),即多个神经元一起工作,通过这些“神经元”来考虑数据并对数据进行分类。

神经网络非常擅长图像识别,当向它们提供足够的数据后,他们可以挑出人眼看不见的图案或差异。利用这一点,深度学习可以实现自动驾驶汽车的行人侦查或肿瘤筛查。

但是, 当出现超出其参数范围的输入时,神经网络也会崩溃。在特定的,狭窄定义的任务中,深度学习通常优于人类,但是一旦神经网络失效时,往往会导致严重的后果。如果错误识别的图像发生在肿瘤患者身上或自动驾驶车上时,后果可能是致命的。

但问题是这些系统是如此的密集和复杂,人类无法理解它们,对人类来说,深度学习如同一个科技黑箱。除了令人不安之外,我们无法理解的计算机程序还可以做出一些不可预测的事情,并且当它们出错时,很难对其进行反向工程或纠正。

正如 Nguyen 所说, “归根结底,我们要搞清楚为什么神经网络的行为是这样,而不是相反。”

揭示神经网络的想法

能彻底搞乱人工智能的数据被称为“对抗性数据”,它会导致一个通常可靠的神经网络犯下奇怪的错误。静态的、波浪状的人字纹,以及五颜六色的条纹,可能被 AI 自信地识别为“蜈蚣”或“熊猫”。

不仅如此,一些常见的图像也会让深度学习人工智能崩溃。把消防车图片倒过来,AI 就会看到一个大雪橇;放大一辆公共汽车的窗户,它在 AI 眼中就变成了一个出气筒。

“令人震惊的是,我们发现这些网络会在某种程度上被这些奇怪的图案所愚弄,这是我们从未想象过的。”Nguyen 表示。

为了找出原因,Nguyen 创建了一个叫做 DeepVis 的工具来分析神经网络算法。该工具能够将深入学习 AI 的完整程序分离开来,并显示出单个神经元正在识别的内容。从这里开始,Nguyen 能够打破深入学习AI的连续工作进程,从而理解它是如何一步步达到最终检测结果的。

将识别对象简单的随机旋转几次,就足以将 AI 的分类精度从 77.5% 降到3%

由于神经网络这种复杂性,对其所做的“解剖”对于人工智能开发人员最有用,提供的大量细节可以帮助科学家们更深入地理解破解黑箱所需的神经网络训练,就好比医生对于肿瘤的研究一样。

但是,即使使用 DeepVis,黑箱的秘密可能也不会完全打开。神经元群的绝对复杂性可能让人类难以理解,毕竟它是一个黑箱。

2016 年,来自波士顿大学和微软研究院的研究人员为一种算法提供了 300 多万英文单词的数据集,数据从谷歌新闻文章中提龋研究人员重点关注那些最常用的英文单词,然后让算法做完形填空。

“男人(Man)之于程序员(computer programmer),那么女人(woman)之于什么”,机器通过算法“思考”后,得出答案:“家庭主妇(homemaker)”。

很明显, AI也会发出类似于人类社会的性别歧视和种族主义言论。为了找出其中的原因,专注于破解自然语言处理(NLP)算法黑箱并提出深度学习思维(deep learning thinking)这一概念的 Sameer Singh,使用了一种叫做归因图(attribution map)的工具:将语言插入到文本生成 NLP 算法中,归因图将突出显示某些部分,展示什么在神经网络内部“发光”也许是一个特定的字母组合。

Singh 的团队首先使用某些单词,开发出特殊的触发器,然后,他们按照归因图所说的算法最“感兴趣”的模板来修改这些单词,最终的结果是一连串的文字和半拼写错误,从而引发了某些看起来像“种族主义”的言论。

“突出显示的内容对模型的预测或输出有很大的影响,”Singh 说,利用这些信息,可以使用故意的对抗触发器来尝试发现问题,并理解深度学习算法中的联系。这足以让人们了解人工智能的想法。

虽然归因图也有缺点,不同的地图生成器可能彼此不一致,但是大概的理解可能是我们所能获得的最好的理解。

AI 黑箱 VS 人类黑箱

事实上,随着算法变得更加复杂、更加强大和不透明化,围绕黑箱的问题也进一步深入到哲学上:当我们人类自己的神经网络仍然神秘时,要求 AI 神经网络完全透明是公平的吗?

不得不承认,人类本身的神经网络也是一个黑箱。我们虽然知道一些物理结构,知道它们是如何工作,但对“思想”和“意识”的确切含义仍不清楚。

接下来我们是否应该思考,机器模仿人脑并继承其精确、灵活等优点的同时,是否也继承了人性中的偏见?

当然,随着未来科学家们在深度学习领域中不断取得的突破,由人类创造的 AI 黑箱终将变成“灰色”。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像识别
    +关注

    关注

    8

    文章

    446

    浏览量

    37905
  • 机器学习
    +关注

    关注

    66

    文章

    8112

    浏览量

    130545
  • 深度学习
    +关注

    关注

    73

    文章

    5235

    浏览量

    119893
收藏 人收藏

    评论

    相关推荐

    图像识别技术原理 图像识别技术的应用领域

    图像识别技术是一种通过计算机对图像进行分析和理解的技术。它借助计算机视觉、模式识别、人工智能等相关技术,通过对图像进行特征提取和匹配,找出图像
    的头像 发表于 02-02 11:01 639次阅读

    基于TensorFlow和Keras的图像识别

    TensorFlow和Keras最常见的用途之一是图像识别/分类。通过本文,您将了解如何使用Keras达到这一目的。定义如果您不了解图像识别的基本概念,将很难完全理解本文的内容。因此在正文开始之前
    的头像 发表于 01-13 08:27 373次阅读
    基于TensorFlow和Keras的<b class='flag-5'>图像识别</b>

    如何使用Python进行图像识别的自动学习自动训练?

    如何使用Python进行图像识别的自动学习自动训练? 使用Python进行图像识别的自动学习和自动训练需要掌握一些重要的概念和技术。在本文中,我们将介绍如何使用Python中的一些常用
    的头像 发表于 01-12 16:06 211次阅读

    使用Python卷积神经网络(CNN)进行图像识别的基本步骤

    Python 卷积神经网络(CNN)在图像识别领域具有广泛的应用。通过使用卷积神经网络,我们可以让计算机从图像学习特征,从而实现对图像的分类、识别
    的头像 发表于 11-20 11:20 1776次阅读

    一种基于图像识别的第五版人民币成色检测方法

    电子发烧友网站提供《一种基于图像识别的第五版人民币成色检测方法.pdf》资料免费下载
    发表于 10-13 11:19 0次下载
    一种基于<b class='flag-5'>图像识别的</b>第五版人民币成色检测方法

    模拟矩阵在图像识别中的应用

    讯维模拟矩阵在图像识别中的应用主要是通过构建一个包含多种图像数据的模拟矩阵,来训练和测试深度学习模型,从而提高图像识别的准确性和效率。 在
    的头像 发表于 09-04 14:17 321次阅读
    模拟矩阵在<b class='flag-5'>图像识别</b>中的应用

    卷积神经网络用于图像识别的原理

    在机器视觉领域,图像识别是指软件识别人物、场景、物体、动作和图像写入的能力。为了实现图像识别,计算机可以结合人工智能软件和摄像机使用机器视觉技术。
    发表于 08-20 09:56 893次阅读
    卷积神经网络用于<b class='flag-5'>图像识别的</b>原理

    深度学习算法的选择建议

    深度学习算法的选择建议 随着深度学习技术的普及,越来越多的开发者将它应用于各种领域,包括图像识别
    的头像 发表于 08-17 16:11 380次阅读

    什么是深度学习算法深度学习算法的应用

    。 在深度学习中,使用了一些快速的算法,比如卷积神经网络以及深度神经网络,这些算法在大量数据处理和图像识
    的头像 发表于 08-17 16:03 1466次阅读

    深度学习算法简介 深度学习算法是什么 深度学习算法有哪些

    深度学习算法作为其中的重要组成部分,不仅可以为诸如人工智能、图像识别以及自然语言处理等领域提供支持,同时也受到了越来越多的关注和研究。在本文中,我们将着重介绍
    的头像 发表于 08-17 16:02 6787次阅读

    深度学习视角下的猫狗图像识别实现

    来源: 易百纳技术社区, 作者: 稗子酿的酒 人工智能技术在图像识别领域取得了显著进展,其中基于深度学习图像分类方法在猫狗图像识别中表现出
    的头像 发表于 08-15 10:38 1898次阅读
    <b class='flag-5'>深度</b><b class='flag-5'>学习</b>视角下的猫狗<b class='flag-5'>图像识别</b>实现

    图像识别技术原理 深度学习图像识别应用研究

      图像识别是人工智能领域的一个重要方向。经过多年的研究,图像识别技术取得了一定的研究进展。图像识别主要包含特征提取和分类识别,而其中的特征 提取是
    发表于 07-19 10:27 2次下载

    基于cnn车牌识别算法案例 深度学习图像识别研究

    图像识别是人工智能领域的一个重要方向。经过多年的研究,图像识别技术取得了一定的研究进展。图像识别主要包含特征提取和分类识别,而其中的特征提取是图像识
    发表于 07-18 11:23 3次下载

    关于图像识别的三大要点

    图像识别识别图像或视频中的目标或特征的过程。这项技术已应用于多个领域,如缺陷检测、医学成像和安全监控。
    的头像 发表于 07-13 10:00 1129次阅读
    关于<b class='flag-5'>图像识别的</b>三大要点

    [9.3.1]--9.3.1图像识别学习视频

    图像处理图像识别
    jf_75936199
    发布于 :2023年04月28日 02:30:01