0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

深度学习全新打开方式Google Brain提出概念激活向量新方法

Hf1h_BigDataDig 来源:YXQ 2019-07-31 14:11 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

可解释性仍然是现代深度学习应用的最大挑战之一。计算模型和深度学习研究的最新进展使我们能够创建极度复杂的模型,包括数千隐藏层和数千万神经元。效果惊人的前沿深度神经网络模型构建相对简单,但了解这些模型如何创造和使用知识仍然是一个挑战。

最近,Google Brain团队的研究人员发表了一篇论文,提出了一种名为概念激活向量(Concept Activation Vectors, CAV)的新方法,它为深度学习模型的可解释性提供了一个新的视角。

可解释性 vs 准确性

要理解CAV技术,需要了解深度学习模型中可解释性难题的本质。在当今一代深度学习技术中,模型的准确性与可解释性之间存在着永恒的矛盾。可解释性-准确性矛盾存在于完成复杂知识任务的能力和理解这些任务是如何完成能力之间。知识与控制,绩效表现与可核查性,效率与简便性...任意一项抉择其实都是准确性和可解释性之间的权衡。

你是关心获得最佳结果,还是关心结果是如何产生的?这是数据科学家在每个深度学习场景中都需要回答的问题。许多深度学习技术本质上非常复杂,尽管它们在许多场景中都很准确,解释起来却非常困难。如果我们在一个准确性-可解释性图表中绘制一些最著名的深度学习模型,我们将得到以下结果:

深度学习模型中的可解释性不是一个单一的概念。我们可以从多个层次理解它:

要得到上图每层定义的可解释性,需要几个基本的构建模块。在最近的一篇论文中,谷歌的研究人员概述了他们看来的一些可解释性的基本构建模块。

Google总结了如下几项可解释性原则:

- 了解隐藏层的作用:深层学习模型中的大部分知识都是在隐藏层中形成的。在宏观层面理解不同隐藏层的功能对于解释深度学习模型至关重要。

- 了解节点的激活方式:可解释性的关键不在于理解网络中各个神经元的功能,而在于理解同一空间位置被一起激发的互连神经元群。通过互连神经元群对神经网络进行分割能让我们从一个更简单的抽象层面来理解其功能。

-理解概念的形成过程:理解深度神经网络如何形成组成最终输出的单个概念,这是可解释性的另一个关键构建模块。

这些原则是Google新CAV技术背后的理论基础。

概念激活向量

遵循前文讨论的想法,通常所认为的可解释性就是通过深度学习模型的输入特征来描述其预测。逻辑回归分类器就是一个典型的例子,其系数权重通常被解释为每个特征的重要性。然而,大多数深度学习模型对诸如像素值之类的特征进行操作,这些特征与人类容易理解的高级概念并不对应。此外,模型的内部值(例如,神经元激活)也很晦涩难懂。虽然诸如显著图之类的技术可以有效测量特定像素区域的重要性,但是它们无法与更高层级的概念相关联。

CAV背后的核心思想是衡量一个概念在模型输出中的相关性。概念的CAV就是一组该概念的实例在不同方向的值(例如,激活)构成的向量。在论文中,Google研究团队概述了一种名为Testing with CAV(TCAV)的线性可解释方法,该方法使用偏导数来量化预测CAV表示的潜在高级概念的敏感度。他们构想TCAV定义有四个目标:

- 易懂:使用者几乎不需要机器学习专业知识。

- 个性化:适应任何概念(例如,性别),并且不限于训练中涉及的概念。

- 插入即用:无需重新训练或修改机器学习模型即可运作。

- 全局量化:可以使用单一定量测度来解释所有类或所有实例,而非仅仅解释单个数据输入。

为实现上述目标,TCAV方法分为三个基本步骤:

1)为模型定义相关概念。

2)理解预测对这些概念的敏感度。

3)推断每个概念对每个模型预测类的相对重要性的全局定量解释。

TCAV方法的第一步是定义相关的概念(CAV)。为实现此目的,TCAV选择一组代表该概念的实例或寻找标记为该概念的独立数据集。我们可以通过训练线性分类器区分概念实例产生的激活和各层中的实例来学习CAV。

第二步是生成一个TCAV分数,用于量化预测对特定概念的敏感度。TCAV使用了用于衡量ML预测值在某一概念方向、在激活层对输入敏感度的偏导数。

最后一步尝试评估学到的CAV的全局相关性,避免依赖不相关的CAV。毕竟TCAV技术的一个缺陷就是可能学到无意义的CAV,因为使用随机选择的一组图像仍然能得到CAV,在这种随机概念上的测试不太可能有意义。为了应对这一难题,TCAV引入了统计显著性检验,该检验以随机的训练次数(通常为500次)评估CAV。其基本思想是,有意义的概念应该在多次训练中得到一致的TCAV分数。

TCAV的运作

团队进行了多次实验来评估TCAV相比于其他可解释性方法的效率。在一项最引人注目的测试中,团队使用了一个显著图,尝试预测出租车这一概念与标题或图像的相关性。显著图的输出如下所示:

使用这些图像作为测试数据集,Google Brain团队在Amazon Mechanical Turk上邀请50人进行了实验。每个实验人员执行一系列共六个针对单个模型的随机顺序任务(3类对象 x 2种显著图)。

在每项任务中,实验人员首先会看到四幅图片和相应的显著性蒙版。然后,他们要评估图像对模型的重要程度(10分制),标题对模型的重要程度(10分制),以及他们对答案的自信程度(5分制)。实验人员总共评定了60个不同的图像(120个不同的显著图)。

实验的基本事实是图像概念比标题概念更相关。然而,看显著图时,人们认为标题概念更重要(0%噪声的模型),或者辨别不出差异(具有100%噪声的模型)。相比之下,TCAV结果正确地表明图像概念更重要。

TCAV是这几年最具创新性的神经网络解释方法之一。初始的代码可以在GitHub上看到。许多主流深度学习框架可能会在不久的将来采用这些想法。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6259

    浏览量

    111979
  • 深度学习
    +关注

    关注

    73

    文章

    5608

    浏览量

    124634

原文标题:谷歌大脑发布概念激活向量,了解神经网络的思维方式

文章出处:【微信号:BigDataDigest,微信公众号:大数据文摘】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    首选项的读写

    一、导入 直接拖入DevEco Studio中(提前解压好)(第一种打开方式) 在DevEco Studio打开代码包(第二种打开方式) 第一次打开代码包时会有提示,选择第一个就行
    发表于 03-03 19:37

    keil5使用中文路径安装.pack后缀报错的解决办法

    安装完成 此时首先需要在keil5文件安装路径上改正文件名 此时再次安装.pack后缀文件时可能会发现两个问题:一个是默认打开方式改变了: 解决办法是在keil5安装路径下找到
    发表于 01-22 06:50

    keil (MDK)的IDE支持包*.pack文件如何打开

    :...Keil_v5UV4PackUnzip.exe。 再次右键*.pack文件,在属性中更改打开方式,选择刚才找到的PackUnzip.exe程序即可。
    发表于 01-20 08:24

    用于窄带匹配高速射频ADC的全新方法

    本期,为大家带来的是《用于窄带匹配高速射频 ADC 的全新方法》,介绍了一种用于窄带匹配高速射频 ADC 的全新方法,以解决高中间频率系统中 ADC 前端窄带匹配的设计难题,可在 ADC 额定带宽内应用,能提升 ADC 性能、减少模拟停机时间。
    的头像 发表于 01-04 15:56 7601次阅读
    用于窄带匹配高速射频ADC的<b class='flag-5'>全新方法</b>

    从系统视角选时钟:一张“应用分层地图”讲清 TCXO / OCXO / SAW 的正确打开方式

    ,强调相位噪声、抖动、老化与 Holdover 的关键性,并提出“从天线到主时钟”的预算联动方法,适用于 GNSS 授时、卫星通信、电信同步及相干系统的架构规划与器件
    的头像 发表于 12-08 15:03 4832次阅读
    从系统视角选时钟:一张“应用分层地图”讲清 TCXO / OCXO / SAW 的正确<b class='flag-5'>打开方式</b>

    奥松电子荣获2025年中国创新方法大赛全国总决赛二等奖

    2025年11月18日-21日,2025年中国创新方法大赛总决赛在山东省泰安市成功举办。国内MEMS智能传感器与半导体关键零部件领域的国家级专精特新“小巨人”企业——广州奥松电子股份有限公司,凭借
    的头像 发表于 12-05 15:17 715次阅读

    海康威视荣获2025年中国创新方法大赛总决赛金奖

    近日,2025年中国创新方法大赛圆满落幕。海康威视凭借《工业听诊师——超长距离皮带运输机托辊声纹监测系统》项目脱颖而出,斩获全国总决赛唯一金奖。
    的头像 发表于 12-04 10:55 601次阅读

    奥松半导体荣获2025中国创新方法大赛重庆赛区二等奖

    近日,2025年中国创新方法大赛(重庆赛区)暨第八届重庆市创新方法大赛圆满落幕。本届大赛以“培育创新人才,服务产业发展”为主题,旨在激发企业创新活力,推动科技创新与产业创新深度融合。大赛由重庆市科协
    的头像 发表于 11-19 11:34 981次阅读
    奥松半导体荣获2025中国创<b class='flag-5'>新方法</b>大赛重庆赛区二等奖

    激活函数ReLU的理解与总结

    CNN模型诞生于1989年,发明人LeCun。1998年,LeCun提出LeNet,并成功应用于美国手写数字识别。这是一种自下向上的一种学习方式,使用的是Tanh激活函数。 设计能够
    发表于 10-31 06:16

    【「AI芯片:科技探索与AGI愿景」阅读体验】+第二章 实现深度学习AI芯片的创新方法与架构

    、Transformer 模型的后继者 二、用创新方法实现深度学习AI芯片 1、基于开源RISC-V的AI加速器 RISC-V是一种开源、模块化的指令集架构(ISA)。优势如下: ①模块化特性②标准接口③开源
    发表于 09-12 17:30

    【「AI芯片:科技探索与AGI愿景」阅读体验】+内容总览

    ,其中第一章是概论,主要介绍大模型浪潮下AI芯片的需求与挑战。第二章和第三章分别介绍实现深度学习AI芯片的创新方法和架构。以及一些新型的算法和思路。第四章是全面介绍半导体芯产业的前沿技术,包括新型晶体管
    发表于 09-05 15:10

    芯片制造中高精度膜厚测量与校准:基于红外干涉技术的新方法

    、环境光干扰及薄膜倾斜等因素限制,测量精度难以满足高精度工业需求。为此,本研究提出一种融合红外干涉与激光校准的薄膜厚度测量新方法,旨在突破传统技术瓶颈,实现更精准、
    的头像 发表于 07-21 18:17 3153次阅读
    芯片制造中高精度膜厚测量与校准:基于红外干涉技术的<b class='flag-5'>新方法</b>

    无刷直流电机反电势过零检测新方法

    的危险。同时,根据控制信号占空比切换低速区与高速区反电势采样方式,能有效改善在低速区时反电势过零检测效果。实验结果表明,提出的反电势过零检测新方法能保证电机工作于更宽的转速范围内。 纯分享帖,点击下方
    发表于 06-26 13:50

    岳信仪器告诉你榨汁机气密性检测仪的正确打开方式

    在榨汁机生产过程中,气密性是一项关键指标。而榨汁机气密性检测仪则是确保产品气密性达标的重要工具。那么,该如何正确使用它呢?下面就为大家详细介绍榨汁机气密性检测仪的正确打开方式。(1)检测前的准备工作
    的头像 发表于 05-29 15:52 606次阅读
    岳信仪器告诉你榨汁机气密性检测仪的正确<b class='flag-5'>打开方式</b>

    选型不迷茫!PCB分板机主轴的正确打开方式

    在电子制造领域,PCB(印刷电路板)分板机是实现高效、精准切割的关键设备。作为分板机的"心脏",主轴系统的性能直接影响加工效率、切割精度及设备寿命。德国Sycotec,作为高速电主轴的老品牌企业,凭借其百年技术积淀与持续创新,已成为全球高端分板机主轴的首选品牌。多年来持续生产研发出多款高速、高精度、高效的PCB分板机主轴,一起了解看看。Sycotec用于PC
    的头像 发表于 05-12 13:31 801次阅读
    选型不迷茫!PCB分板机主轴的正确<b class='flag-5'>打开方式</b>