使用LIME解释CNN-电子发烧友网

作者：Mehul Gupta

来源：DeepHub IMBA

我们已经介绍过很多解析机器学习模型的方法，例如如pdp、LIME和SHAP，但是这些方法都是用在表格数据的，他们能不能用在神经网络模型呢？今天我们来LIME解释CNN。

图像与表格数据集有很大不同(显然)。如果你还记得，在之前我们讨论过的任何解释方法中，我们都是根据特征重要性，度量或可视化来解释模型的。比如特征“A”在预测中比特征“B”有更大的影响力。但在图像中没有任何可以命名的特定特征，那么怎么进行解释呢?

一般情况下我们都是用突出显示图像中模型预测的重要区域的方法观察可解释性，这就要求了解如何调整LIME方法来合并图像，我们先简单了解一下LIME是怎么工作的。

LIME在处理表格数据时为训练数据集生成摘要统计：

使用汇总统计生成一个新的人造数据集

从原始数据集中随机提取样本

根据与随机样本的接近程度为生成人造数据集中的样本分配权重

用这些加权样本训练一个白盒模型

解释白盒模型

就图像而言，上述方法的主要障碍是如何生成随机样本，因为在这种情况下汇总统计将没有任何用处。

如何生成人造数据集?最简单的方法是，从数据集中提取一个随机样本，随机打开(1)和关闭(0)一些像素来生成新的数据集但是通常在图像中，出现的对象(如狗vs猫的分类中的:狗&猫)导致模型的预测会跨越多个像素，而不是一个像素。所以即使你关掉一两个像素，它们看起来仍然和我们选择样本非常相似。所以这里需要做的是设置一个相邻像素池的ON和OFF，这样才能保证创造的人工数据集的随机性。所以将图像分割成多个称为超像素的片段，然后打开和关闭这些超像素来生成随机样本。让我们使用LIME进行二进制分类来解释CNN的代码。例如我们有以下的两类数据。类别0: 带有任意大小的白色矩形的随机图像类别1:随机生成的图像（没有白色矩形）

然后创建一个简单的CNN模型

LIME示例

%matplotlib inline
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from keras.layers import Input, Dense, Embedding, Flatten
from keras.layers import SpatialDropout1D
from keras.layers.convolutional import Conv2D, MaxPooling2D
from keras.models import Sequential
from randimage import get_random_image, show_array
import random
import pandas as pd
import numpy as np
import lime
from lime import lime_image
from skimage.segmentation import mark_boundaries

#preparing above dataset artificially
training_dataset = []
training_label = []
for x in range(200):

img_size = (64,64)
img = get_random_image(img_size)

a,b = random.randrange(0,img_size[0]/2),random.randrange(0,img_size[0]/2)
c,d = random.randrange(img_size[0]/2,img_size[0]),random.randrange(img_size[0]/2,img_size[0])

value = random.sample([True,False],1)[0]
if value==False:
img[a:c,b:d,0] = 100
img[a:c,b:d,1] = 100
img[a:c,b:d,2] = 100

training_dataset.append(img)
training_label.append(value)

#training baseline CNN model
training_label = [1-x for x in training_label]
X_train, X_val, Y_train, Y_val = train_test_split(np.array(training_dataset).reshape(-1,64,64,3),np.array(training_label).reshape(-1,1), test_size=0.1, random_state=42)

epochs = 10
batch_size = 32
model = Sequential()
model.add(Conv2D(32, kernel_size=3, padding='same', activation='relu'))
model.add(MaxPooling2D(pool_size=2))
model.add(Flatten())
# Output layer
model.add(Dense(32,activation='relu'))
model.add(Dense(1, activation='sigmoid'))
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
model.fit(X_train, Y_train, validation_data=(X_val, Y_val), epochs=epochs, batch_size=batch_size, verbose=1)

让我们引入LIME

x=10
explainer = lime_image.LimeImageExplainer(random_state=42)
explanation = explainer.explain_instance(
X_val[x],
model.predict,top_labels=2)
)

image, mask = explanation.get_image_and_mask(0, positives_only=True,
hide_rest=True)

上面的代码片段需要一些解释我们初始化了LimeImageExplainer对象，该对象使用explain_instance解释特定示例的输出。这里我们从验证集中选取了第10个样本，Get_image_and_mask()返回模型与原始图像一起预测的高亮区域。让我们看看一些样本，它们实际上是1(随机图像)，但检测到为0(带白框的随机图像)可以看到下图有黄色的突出显示区域，这张图片的标签为1，但被标记为0，这是因为高亮显示的区域看起来像一个矩形，因此让模型感到困惑，也就是说模型错吧黄色标记的部分当成了我们需要判断的白色矩形遮蔽。再看看上面两个图，与前面的例子类似，模型也预测了class=0。通过黄色区域可以判断，某种形状可能被模型曲解为白色方框了。

这样我们就可以理解模型导致错误分类的实际问题是什么，这就是为什么可解释和可解释的人工智能如此重要。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

机器学习

机器学习

+关注

关注
66

文章
8122

浏览量
130557
cnn

cnn

+关注

关注
3

文章
327

浏览量
21298

基于CNN-LSTM网络的电力负荷预测

为了及时掌握电力负荷的变动信息，就需要对电力负荷进行准确预测。鉴于此，探究出一种CNN和LSTM的组合模型来预测一日到一周的电力短期负荷波动情况。CNN模型负责从输入信息中提取特征，LSTM模型利用

发表于 11-09 14:13 •1470次阅读

基于<b class='flag-5'>CNN</b>-LSTM网络的电力负荷预测

什么是卷积神经网络？如何MATLAB实现CNN？

卷积神经网络（CNN 或 ConvNet）是一种直接从数据中学习的深度学习网络架构。 CNN 特别适合在图像中寻找模式以识别对象、类和类别。它们也能很好地对音频、时间序列和信号数据进行分类。

发表于 10-12 12:41 •593次阅读

什么是卷积神经网络？如何MATLAB实现<b class='flag-5'>CNN</b>？

卷积神经网络(CNN)的工作原理神经网络的训练过程

前文《卷积神经网络简介：什么是机器学习？》中，我们比较了在微控制器中运行经典线性规划程序与运行CNN的区别，并展示了CNN的优势。我们还探讨了CIFAR网络，该网络可以对图像中的猫、房子或自行车等对象进行分类，还可以执行简单的语音识别。本文重点

发表于 09-05 10:19 •933次阅读

卷积神经网络(<b class='flag-5'>CNN</b>)的工作原理神经网络的训练过程

cnn卷积神经网络简介 cnn卷积神经网络代码

cnn卷积神经网络简介 cnn卷积神经网络代码卷积神经网络（Convolutional Neural Network，简称CNN）是目前深度学习领域中应用广泛的一种神经网络模型。CNN

发表于 08-21 17:16 •2027次阅读

cnn卷积神经网络matlab代码

cnn卷积神经网络matlab代码卷积神经网络（Convolutional Neural Network, CNN）是深度学习中一种常用的神经网络结构，它是通过卷积层、池化层和全连接层等组合而成

发表于 08-21 17:15 •866次阅读

cnn卷积神经网络算法 cnn卷积神经网络模型

cnn卷积神经网络算法 cnn卷积神经网络模型卷积神经网络(CNN)是一种特殊的神经网络，具有很强的图像识别和数据分类能力。它通过学习权重和过滤器，自动提取图像和其他类型数据的特征。在过去的几年

发表于 08-21 17:15 •1174次阅读

cnn卷积神经网络原理 cnn卷积神经网络的特点是什么

cnn卷积神经网络原理 cnn卷积神经网络的特点是什么卷积神经网络（Convolutional Neural Network，CNN）是一种特殊的神经网络结构，主要应用于图像处理和计算机视觉领域

发表于 08-21 17:15 •1144次阅读

卷积神经网络概述卷积神经网络的特点 cnn卷积神经网络的优点

卷积神经网络概述卷积神经网络的特点 cnn卷积神经网络的优点卷积神经网络（Convolutional neural network，CNN）是一种基于深度学习技术的神经网络，由于其出色的性能

发表于 08-21 16:41 •1935次阅读

python卷积神经网络cnn的训练算法

python卷积神经网络cnn的训练算法卷积神经网络（Convolutional Neural Network，CNN）一直是深度学习领域重要的应用之一，被广泛应用于图像、视频、语音等领域

发表于 08-21 16:41 •1014次阅读

一文详解CNN

1 CNN简介 CNN即卷积神经网络(Convolutional Neural Networks)，是一类包含卷积计算的神经网络，是深度学习（deep learning）的代表算法之一，在图像识别

发表于 08-18 06:56

CNN到底是怎么回事？

它用TensorFlow.js加载了一个10层的预训练模型，相当于在你的浏览器上跑一个CNN模型，只需要打开电脑，就能了解CNN究竟是怎么回事。

发表于 06-28 14:47 •3349次阅读

基于FPGA的深度学习CNN加速器设计方案

因为CNN的特有计算模式，通用处理器对于CNN实现效率并不高，不能满足性能要求。因此，近来已经提出了基于FPGA，GPU甚至ASIC设计的各种加速器来提高CNN设计的性能。

发表于 06-14 16:03 •1613次阅读

PyTorch教程-14.8。基于区域的 CNN (R-CNN)

14.8。基于区域的 CNN (R-CNN)¶ Colab [火炬]在 Colab 中打开笔记本 Colab [mxnet] Open the notebook in Colab

发表于 06-05 15:44 •384次阅读

PyTorch教程14.8之基于区域的CNN(R-CNN)

电子发烧友网站提供《PyTorch教程14.8之基于区域的CNN(R-CNN).pdf》资料免费下载

发表于 06-05 11:09 •0次下载

如何采用带专用CNN加速器的AI微控制器实现CNN的硬件转换

本文重点解释如何使用硬件转换卷积神经网络(CNN)，并特别介绍使用带CNN硬件加速器的人工智能(AI)微控制器在物联网(IoT)边缘实现人工智能应用所带来的好处。 AI应用通常需要消耗大量能源，并以

发表于 05-16 01:05 •511次阅读

搜索历史

使用LIME解释CNN

评论

基于CNN-LSTM网络的电力负荷预测

什么是卷积神经网络？如何MATLAB实现CNN？

卷积神经网络(CNN)的工作原理神经网络的训练过程

cnn卷积神经网络简介 cnn卷积神经网络代码

cnn卷积神经网络matlab代码

cnn卷积神经网络算法 cnn卷积神经网络模型

cnn卷积神经网络原理 cnn卷积神经网络的特点是什么

卷积神经网络概述卷积神经网络的特点 cnn卷积神经网络的优点

python卷积神经网络cnn的训练算法

一文详解CNN

CNN到底是怎么回事？

基于FPGA的深度学习CNN加速器设计方案

PyTorch教程-14.8。基于区域的 CNN (R-CNN)

PyTorch教程14.8之基于区域的CNN(R-CNN)

如何采用带专用CNN加速器的AI微控制器实现CNN的硬件转换