0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于机器学习模型的六大可解释性技术

C29F_xilinx_inc 来源:赛灵思 作者:赛灵思 2022-02-26 17:20 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

本文介绍目前常见的几种可以提高机器学习模型的可解释性的技术。

模型可解释性汇总

简介

目前很多机器学习模型可以做出非常好的预测,但是它们并不能很好地解释他们是如何进行预测的,很多数据科学家都很难知晓为什么该算法会得到这样的预测结果。这是非常致命的,因为如果我们无法知道某个算法是如何进行预测,那么我们将很难将其迁移到其它的问题中,很难进行算法的debug。

本文介绍目前常见的几种可以提高机器学习模型的可解释性的技术,包括它们的相对优点和缺点。我们将其分为下面几种:

1. Partial Dependence Plot (PDP);

2. Individual Conditional Expectation (ICE)

3. Permuted Feature Importance

4. Global Surrogate

5. Local Surrogate (LIME)

6. Shapley Value (SHAP)

六大可解释性技术

01、Partial Dependence Plot (PDP)

PDP是十几年之前发明的,它可以显示一个或两个特征对机器学习模型的预测结果的边际效应。它可以帮助研究人员确定当大量特征调整时,模型预测会发生什么样的变化。

关于机器学习模型的六大可解释性技术

上面图中X轴表示特图片的值y轴表示预测值。阴影区域中的实线显示了平均预测如何随图片值的变化而变化。PDP能很直观地显示平均边际效应,因此可能会隐藏异质效应。

例如,一个特征可能与一半数据的预测正相关,与另一半数据负相关。那么PDP图将只是一条水平线。

02、Individual Conditional Expectation (ICE)

ICE和PDP非常相似,但和PDP不同之处在于,PDP绘制的是平均情况,但是ICE会显示每个实例的情况。ICE可以帮助我们解释一个特定的特征改变时,模型的预测会怎么变化。

关于机器学习模型的六大可解释性技术

如上图所示,与PDP不同,ICE曲线可以揭示异质关系。但其最大的问题在于:它不能像PDP那样容易看到平均效果,所以可以考虑将二者结合起来一起使用。

03、Permuted Feature Importance

Permuted Feature Importance的特征重要性是通过特征值打乱后模型预测误差的变化得到的。换句话说,Permuted Feature Importance有助于定义模型中的特征对最终预测做出贡献的大小。

关于机器学习模型的六大可解释性技术

如上图所示,特征f2在特征的最上面,对模型的误差影响是最大的,f1在shuffle之后对模型却几乎没什么影响,生息的特征则对于模型是负面的贡献。

04、Global Surrogate

Global Surrogate方法采用不同的方法。它通过训练一个可解释的模型来近似黑盒模型的预测。

首先,我们使用经过训练的黑盒模型对数据集进行预测;

然后我们在该数据集和预测上训练可解释的模型。

训练好的可解释模型可以近似原始模型,我们需要做的就是解释该模型。

注:代理模型可以是任何可解释的模型:线性模型、决策树、人类定义的规则等。

关于机器学习模型的六大可解释性技术

使用可解释的模型来近似黑盒模型会引入额外的误差,但额外的误差可以通过R平方来衡量。

由于代理模型仅根据黑盒模型的预测而不是真实结果进行训练,因此全局代理模型只能解释黑盒模型,而不能解释数据。

05、Local Surrogate (LIME)

LIME(Local Interpretable Model-agnostic Explanations)和global surrogate是不同的,因为它不尝试解释整个模型。相反,它训练可解释的模型来近似单个预测。LIME试图了解当我们扰乱数据样本时预测是如何变化的。

关于机器学习模型的六大可解释性技术

上面左边的图像被分成可解释的部分。然后,LIME 通过“关闭”一些可解释的组件(在这种情况下,使它们变灰)来生成扰动实例的数据集。对于每个扰动实例,可以使用经过训练的模型来获取图像中存在树蛙的概率,然后在该数据集上学习局部加权线性模型。最后,使用具有最高正向权重的成分来作为解释。

06、Shapley Value (SHAP)

Shapley Value的概念来自博弈论。我们可以通过假设实例的每个特征值是游戏中的“玩家”来解释预测。每个玩家的贡献是通过在其余玩家的所有子集中添加和删除玩家来衡量的。一名球员的Shapley Value是其所有贡献的加权总和。Shapley 值是可加的,局部准确的。如果将所有特征的Shapley值加起来,再加上基值,即预测平均值,您将得到准确的预测值。这是许多其他方法所没有的功能。

关于机器学习模型的六大可解释性技术

该图显示了每个特征的Shapley值,表示将模型结果从基础值推到最终预测的贡献。红色表示正面贡献,蓝色表示负面贡献。

小结

机器学习模型的可解释性是机器学习中一个非常活跃而且重要的研究领域。本文中我们介绍了6种常用的用于理解机器学习模型的算法。大家可以依据自己的实践场景进行使用。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4805

    浏览量

    98544
  • 模型
    +关注

    关注

    1

    文章

    3818

    浏览量

    52266
  • 机器学习
    +关注

    关注

    67

    文章

    8564

    浏览量

    137221
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    高精度控压与多维表征:STEP-SM/SMT系列固态电池模具技术详解及六大应用方案

    模具系列 。该系列凭借科学的结构设计与精密的材质选择,为固态电解质及全固态电池的研究提供标准化硬件支持。 一、 六大针对应用方案:覆盖全研发链路 结合不同的压力监控需求与操作频次,本系列模具提供以下
    发表于 04-17 17:32

    汇川技术MD880系列变频器通过六大国际主流船级社权威认证

    4月9日,汇川MD880系列变频器一次通过CCS、BV、ABS、DNV、RS、LR六大国际主流船级社权威认证,全面满足全球海事领域严苛的安全、环境、电磁兼容、振动冲击及防腐等标准要求。这标志着汇川
    的头像 发表于 04-13 10:43 388次阅读

    强化学习会让自动驾驶模型学习更快吗?

    [首发于智驾最前沿微信公众号]在谈及自动驾驶大模型训练时,有的技术方案会采用模仿学习,而有些会采用强化学习。同样作为大模型的训练方式,强化
    的头像 发表于 01-31 09:34 831次阅读
    强化<b class='flag-5'>学习</b>会让自动驾驶<b class='flag-5'>模型</b><b class='flag-5'>学习</b>更快吗?

    谷歌正式发布Gemma Scope 2模型

    Scope 工具包推动了可解释性科学的发展,该工具旨在帮助研究人员理解我们轻量级开放模型系列 Gemma 2 的内部运作机制。
    的头像 发表于 01-24 14:01 733次阅读

    步进伺服电机的六大问题处理技巧

    步进伺服电机作为工业自动化领域的关键部件,其稳定性和精度直接影响设备性能。然而在实际应用中,电机可能因参数配置、机械负载或环境因素出现异常。本文将针对六大典型问题提供系统解决方案,结合工程实践
    的头像 发表于 10-30 07:41 1101次阅读

    脉冲神经元模型的硬件实现

    息电位 vrest。 LIF神经元模型在生物可解释性上低于其他模型,只体现了神经元计算的关键特性,并不能够解释真实神经元的脉冲是如何生成,也不包括丰富的神经元行为特性。但由于其简单的操
    发表于 10-24 08:27

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    配备科学发现仍需人类的直觉和灵感 ④正价可解释性和透明 ⑤解决伦理和道德问题、AI芯片用于“AI科学家”系统 AI芯片的作用:七、用量子启发AI技术发现新型超材料的案例 超材料特点
    发表于 09-17 11:45

    端到端发展趋势下,云算力如何赋能智能驾驶技术跃迁?

    学习网络中,让系统直接从传感器数据生成车辆控制指令。这种方法在提升系统响应速度、优化复杂场景表现以及减少模块间误差积累方面展现出显著优势,但同时,为了满足足够庞大的智能驾驶辅助需求,端到端模型也面临数据量、算力需求、可解释性和安
    的头像 发表于 09-08 09:16 1161次阅读
    端到端发展趋势下,云算力如何赋能智能驾驶<b class='flag-5'>技术</b>跃迁?

    超小型Neuton机器学习模型, 在任何系统级芯片(SoC)上解锁边缘人工智能应用.

    Neuton 是一家边缘AI 公司,致力于让机器 学习模型更易于使用。它创建的模型比竞争对手的框架小10 倍,速度也快10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文
    发表于 07-31 11:38

    通过NVIDIA Cosmos模型增强机器人学习

    通用机器人的时代已经到来,这得益于机械电子技术机器人 AI 基础模型的进步。但目前机器技术
    的头像 发表于 07-14 11:49 1269次阅读
    通过NVIDIA Cosmos<b class='flag-5'>模型</b>增强<b class='flag-5'>机器人学习</b>

    模型在半导体行业的应用可行分析

    的应用,比如使用机器学习分析数据,提升良率。 这一些大模型是否真的有帮助 能够在解决工程师的知识断层问题 本人纯小白,不知道如何涉足这方面 应该问什么大模型比较好,或者是看什么视频能够
    发表于 06-24 15:10

    中国科学院西安光机所在计算成像可解释性深度学习重建方法取得进展

    图1 MDFP-Net网络结构 近日,中国科学院西安光机所空间光学技术研究室在计算成像可解释性深度学习重建方法研究取得创新进展。相关研究成果发表于计算机视觉与图形学领域国际著名期刊
    的头像 发表于 06-09 09:27 818次阅读
    中国科学院西安光机所在计算成像<b class='flag-5'>可解释性</b>深度<b class='flag-5'>学习</b>重建方法取得进展

    云知声四篇论文入选自然语言处理顶会ACL 2025

    结果正式公布。云知声在此次国际学术盛会中表现卓越,共有4篇论文被接收,其中包括2篇主会论文(Main Paper)和2篇Findings。入选的4篇论文聚焦大语言模型知识溯源、图文音多模态大模型、大语言模型
    的头像 发表于 05-26 14:15 1456次阅读
    云知声四篇论文入选自然语言处理顶会ACL 2025

    Gartner发布云技术发展的六大趋势

    Gartner发布未来四年云技术发展的六大趋势,包括对云技术不满、人工智能/机器学习(AI/ML)、多云和跨云、可持续
    的头像 发表于 05-19 11:40 1149次阅读
    Gartner发布云<b class='flag-5'>技术</b>发展的<b class='flag-5'>六大</b>趋势

    大象机器人携手进迭时空推出 RISC-V 全栈开源轴机械臂产品

    大象机器人成立于2016年,专注协作机器人研发与应用,产品线涵盖轻量级协作机器人、人形机器人、仿生机器人等多种形态。拳头产品myCobot系
    发表于 04-25 17:59