0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为什么要打开神经网络“黑匣子”?

人工智能与大数据技术 来源:AI新媒体量子位 作者:AI新媒体量子位 2020-10-23 10:33 次阅读

本文经AI新媒体量子位(ID:QbitAI)授权转载,转载请联系出处

萧箫 发自 凹非寺

神经网络就像“炼丹炉”一样,投喂大量数据,或许能获得神奇的效果。

“炼丹”成功后,神经网络也能对没见过的数据进行预测了~

然而,这种情况下,神经网络其实成了“黑匣子”——具有一定的功能,但看不见是怎么起作用的。

如果只做简单的图像分类,其实还好;但如果用在医学方向,对疾病进行预测,那么神经网络下的“判断”就不可轻信。

如果能了解它是怎么工作的,就更好了。

出于这种考虑,来自牛津大学的博士生Oana-Maria Camburu撰写了毕业论文《解释神经网络(Explaining Deep Neural Networks)》。

在这篇论文中,她将这些“黑匣子”一个个打开,对神经网络原理进行了详细的解释。

为什么要打开神经网络“黑匣子”?

事实上,神经网络之所以起作用,最直观的原因就是,它由大量非线性函数组成。

这些非线性函数,使得网络可以学习原始数据中各种抽象级特征。

然而,也正是因为神经网络中的这些非线性函数,使得人类往往难以理解,它们是如何起作用的。

这就导致神经网络在疾病预测、信用额度、刑法等方向上“不太受欢迎”。

医生和法律相关的研究者往往更乐意采用可解释模型,例如线性回归、决策树,因为神经网络在疾病预测中的确出过问题:

人们利用神经网络预测肺炎患者的病情发展,其中一项患者特征为是否有哮喘病史。

神经网络经过训练后预测,有哮喘病史的患者死于肺炎的可能性较低。

但其实结果恰好相反,哮喘本身会给肺炎带来雪上加霜的效果。

之所以数据表明哮喘患者较少死于肺炎,往往是因为哮喘能被及早发现,所以患者得肺炎后能被及早治疗。

如果这种神经网络被应用于实践中,将会带来非常危险的结果。

此外,即使是神经网络,也会对男女性别产生刻板印象、产生种族偏见。

例如,调查表明,有些语料库和模型,在预测再犯时,会更“偏爱”男性。

除了错误的预测和种族、性别歧视以外,神经网络还很脆弱。

无论是对图像进行小改动欺骗分类算法、还是用语音识别瞒过NLP模型,神经网络被“爆雷”的情况也不少。

为了让神经网络应用于更多的方向,也为了让我们更好地学习它的原理,作者从两个方向对神经网络进行了解释。

2种方法解释神经网络

“事后再解释”

第一种方法,称之为基于特征的解释方法,又叫“事后再解释”——因为这种方法,是在神经网络训练好后,才对其输入特征进行解释的。

这种方法针对文本的词(token)、或是针对图像的超像素(super pixels),进行“事后”解释。

目前这种方法应用较为普遍,不容易出现解释偏见,但需要验证解释方法的真实性。

这里的根本原理,是研究外部解释方法给出的解释、与模型本身生成的自然语言解释之间,是否存在相关性,而相关性具体又是什么。

在论文中,作者引入了一种新的验证方法,来判断解释方法的真实性。

让神经网络自己解释

那么,如果能让神经网络一边训练、一边“解释自己”呢?

这是论文提到的第二种方法,即在模型中植入一个生成预测解释的模块,对预测的结果进行解释。

至于神经网络对自己的解释是否正确,还需要人为进行判断。

在这里面,作者同样引入了一种判断方法,对模型自己生成的解释进行判断,从而得出神经网络解释的结果。

对神经网络详细结构、具体解释方法感兴趣的小伙伴,可以戳下方论文地址查看~

作者介绍

Oana-Maria Camburu,来自罗马尼亚,目前是牛津大学的博士生,主修机器学习、人工智能等方向。

高中时期,Oana-Maria Camburu曾获IMO(国际奥数竞赛)银牌。她曾经在马普所、谷歌实习,读博期间,论文被ACL、EMNLP、IJCNLP等顶会收录。

原文标题:神经网络“炼丹炉”内部构造长啥样?牛津大学博士小姐姐用论文解读

文章出处:【微信公众号:人工智能与大数据技术】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4575

    浏览量

    98790
  • 数据
    +关注

    关注

    8

    文章

    6514

    浏览量

    87610

原文标题:神经网络“炼丹炉”内部构造长啥样?牛津大学博士小姐姐用论文解读

文章出处:【微信号:TheBigData1024,微信公众号:人工智能与大数据技术】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    梯云物联:什么是电梯黑匣子?具有哪些功能特点?

    电梯黑匣子,正式名称为电梯运行数据记录器,是一种利用当今最先进的物联网技术建设的系统,用于电梯系统中的数据记录。它通过安装物联网实时监测设备,可以实时采集电梯运行的各类参数,对电梯进行全天候的数据监控,并对数据进行长时间的存储。这些参数包括但不限于电梯的速度、位置、开关门状态、载重量等。
    的头像 发表于 04-14 17:53 251次阅读
    梯云物联:什么是电梯<b class='flag-5'>黑匣子</b>?具有哪些功能特点?

    深入剖析飞机黑匣子内部PCB与芯片的秘密

    上为FDR,下为CVR Flight Data Recorder(FDR),中文一般叫飞行数据记录器,主要是记录飞机飞行过程中各项指标参数数据的设备。一般说黑匣子大部分都是指的FDR,是空难调查中最重要的直接证据。
    发表于 02-28 14:55 158次阅读
    深入剖析飞机<b class='flag-5'>黑匣子</b>内部PCB与芯片的秘密

    基于ARM的汽车黑匣子电路设计

    电子发烧友网站提供《基于ARM的汽车黑匣子电路设计.pdf》资料免费下载
    发表于 10-11 15:02 0次下载
    基于ARM的汽车<b class='flag-5'>黑匣子</b>电路设计

    《 AI加速器架构设计与实现》+第一章卷积神经网络观后感

    《 AI加速器架构设计与实现》+第一章卷积神经网络观感    在本书的引言中也提到“一图胜千言”,读完第一章节后,对其进行了一些归纳(如图1),第一章对常见的神经网络结构进行了介绍,举例了一些结构
    发表于 09-11 20:34

    人工神经网络和bp神经网络的区别

    人工神经网络和bp神经网络的区别  人工神经网络(Artificial Neural Network, ANN)是一种模仿人脑神经元网络结构和功能的计算模型,也被称为
    的头像 发表于 08-22 16:45 3450次阅读

    卷积神经网络和深度神经网络的优缺点 卷积神经网络和深度神经网络的区别

    深度神经网络是一种基于神经网络的机器学习算法,其主要特点是由多层神经元构成,可以根据数据自动调整神经元之间的权重,从而实现对大规模数据进行预测和分类。卷积
    发表于 08-21 17:07 2351次阅读

    卷积神经网络的介绍 什么是卷积神经网络算法

    卷积神经网络的介绍 什么是卷积神经网络算法 卷积神经网络涉及的关键技术 卷积神经网络(Convolutional Neural Network,CNN)是一种用于图像分类、物体识别、语
    的头像 发表于 08-21 16:49 1436次阅读

    卷积神经网络的基本原理 卷积神经网络发展 卷积神经网络三大特点

    卷积神经网络的基本原理 卷积神经网络发展历程 卷积神经网络三大特点  卷积神经网络的基本原理 卷积神经网络(Convolutional Ne
    的头像 发表于 08-21 16:49 1454次阅读

    卷积神经网络的应用 卷积神经网络通常用来处理什么

    卷积神经网络的应用 卷积神经网络通常用来处理什么 卷积神经网络(Convolutional Neural Network,简称CNN)是一种在神经网络领域内广泛应用的
    的头像 发表于 08-21 16:41 4023次阅读

    卷积神经网络原理:卷积神经网络模型和卷积神经网络算法

    卷积神经网络原理:卷积神经网络模型和卷积神经网络算法 卷积神经网络(Convolutional Neural Network,CNN)是一种基于深度学习的人工
    的头像 发表于 08-17 16:30 929次阅读

    什么是神经网络?为什么说神经网络很重要?神经网络如何工作?

    神经网络是一个具有相连节点层的计算模型,其分层结构与大脑中的神经元网络结构相似。神经网络可通过数据进行学习,因此,可训练其识别模式、对数据分类和预测未来事件。
    的头像 发表于 07-26 18:28 2000次阅读
    什么是<b class='flag-5'>神经网络</b>?为什么说<b class='flag-5'>神经网络</b>很重要?<b class='flag-5'>神经网络</b>如何工作?

    将“黑匣子”故障记录器添加到“大(或小)箱”系统中

    在飞机以外的电子设备中添加数据记录功能(黑匣子)可以证明非常有价值。黑匣子功能在电子设备中被称为“复杂系统管理器”,可在网络、工业控制、医疗和通信设备中提供故障记录。故障记录的主要好处非常简单:更快、更明确的故障分析。本文介绍如
    的头像 发表于 06-25 11:41 400次阅读
    将“<b class='flag-5'>黑匣子</b>”故障记录器添加到“大(或小)箱”系统中

    热重分析仪:解析材料质量的神秘黑匣子

    热重分析仪是一种重要的分析仪器,用于测量材料在特定温度范围内的质量变化。本文将详细介绍热重分析仪的工作原理、技术特点、应用领域以及未来发展趋势,带您深入了解这个神秘的“黑匣子”。一、热重分析仪
    的头像 发表于 06-20 17:08 378次阅读
    热重分析仪:解析材料质量的神秘<b class='flag-5'>黑匣子</b>

    三个最流行神经网络

    在本文中,我们将了解深度神经网络的基础知识和三个最流行神经网络:多层神经网络(MLP),卷积神经网络(CNN)和递归神经网络(RNN)。
    发表于 05-15 14:19 1179次阅读
    三个最流行<b class='flag-5'>神经网络</b>

    数字控制器IC使用黑匣子工具和在线诊断功能最大限度地减少现场回访

    电源公司可以通过使用黑匣子来借用飞机工业的概念,该黑匣子监控操作并存储该数据以供故障审查。这一概念将有助于对现场退货进行故障分析,这对公司及其客户来说可能是昂贵的时间和金钱,并且诊断和报告全面故障
    的头像 发表于 05-01 14:28 482次阅读
    数字控制器IC使用<b class='flag-5'>黑匣子</b>工具和在线诊断功能最大限度地减少现场回访