0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

让机器学习模型不再是”黑盒子“

DPVg_AI_era 来源:lp 2019-03-12 09:31 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

提高机器学习模型的可解释性和透明度,将有助于模型的除错、引导未来的数据收集方向、为特征构建和人类决策提供真正可靠的信息,最终在人与模型之间建立信任。

过去几年来,人工智能研究人员在图像识别、自然语言理解和棋类等领域取得了重大突破。但由于缺乏对复杂机器学习模型的真正理解,导致模型在传播时出现了偏见,这种偏见在零售、面部识别和语言理解等领域的应用中出现了多次。

说到底,机器学习模型大多数时候仍然是“黑盒子”,很多时候可以拿来用,但具体原理并不十分清楚,即缺乏足够的“可解释性”。

什么是模型的”可解释性“?不同人群定义不一样

所谓模型的可解释性,是指人类能够在何种程度上一致地估计、理解并遵循模型的预测,以及在模型出错时,在何种程度上能够成功检测到。

可解释性对不同的人群有着不同的含义:

对于数据科学家来说,意味着更好地理解模型,掌握模型性能好坏情况以及原因。这些信息有助于数据科学家构建性能更强大的模型。

对于业务利益相关者而言,模型具备可解释性有助于深入了解为什么人工智能系统做出特定决定以确保公平性,维护用户和品牌。

对于用户来说,这意味着要理解模型做出决策的原因,并在模型出错时允许进行有意义的挑战。

对于专家或监管机构来说,它意味着审核AI系统并遵循决策流程,尤其是在系统出现问题时。

微软的团队数据科学流程(TDSP),其中一个重要环节就是对模型的理解

机器学习模型的可解释性可以展示模型正在学习什么内容,而洞悉模型的内部,要比大多数人预想的更加有用。

在过去的10年里,我采访了许多数据科学家,其中模型可解释性技术是我最喜欢的主题,在这一问题上,甚至可以将最优秀的数据科学家与普通科学家区分开来。

有些人认为机器学习模型是黑盒子,可以做出预测,但却无法理解。但最好的数据科学家知道如何从任何模型中提取出关于真实世界的见解。对于任何给定的模型,优秀的数据科学家可以轻松回答类似下面的问题:

模型认为哪些特征最重要?

对于来自模型的任何预测来说,数据的每个特征会对预测结果产生哪些影响?

不同特征之间的哪些相互作用对模型的预测结果影响最大?

回答这些问题比许多人意识到的更为广泛。无论你是从Kaggle学习技术还是从统计学习元素这样的综合资源中学习,这些技术都将彻底改变构建,验证和部署机器学习模型的方式。

提高模型可解释性有什么用?

关于模型的可解释性技术,以下是五个最重要的应用方式:

调试

为模型特征构建提供信息

指导未来的数据收集方向

为人类决策提供建议

在人与模型间建立信任

调试

世界上存在很多可靠性不高,杂乱无章、数量众多的数据。在编写预处理代码时,这些数据可能会成为潜在的错误源头,增加目标泄漏的可能性,在实际数据科学项目中的某些时候出现错误可以说是一种常态,而不是例外。

由于错误出现的频率和潜在的灾难性后果,除错是数据科学中最有价值的技能之一。了解模型发现的模式将帮助你确定,模型对现实世界的理解与你自己的观点出现了不一致,而这通常是查找错误的第一步。

为模型的特征构建提供信息

特征构建通常是提高模型精度的最有效的方法。这个过程通常涉及使用原始数据或先前创建的特征的转换重复创建新特征。

有时你可以只凭借关于底层主题的直觉来完成这个过程。但是,当模型有100个原始特征或缺乏有关您正在处理的主题的背景知识时,就需要更多指引了。这时候,如果模型仍是黑盒子,不可解释的,完成这一过程可能会非常困难,甚至是不可能的。

未来,随着越来越多的数据集的原始特征数量达到成百上千的级别,这种方式无疑会变得越来越重要。

指导未来的数据收集方向

对于从网上下载的数据集,你并没有控制能力。但是,许多利用数据科学的企业和组织都有机会扩展其收集的数据类型。收集新类型的数据可能成本高昂,又不方便,因此只有在知道某类数据值得收集,他们才会去这样做。

如果模型是可解释的,就可以很好地理解当前特征的价值,进而更有可能推断出哪些新型数据是最有用的,从而指导未来数据的收集方向。

为人类决策提供建议

有些决策行为是由模型自动完成的。比如,当你访问亚马逊的网站时,你所看到的网页内容并不是由真人匆忙决定的。不过,确实许多重要的决定都是由人做出的。对于这些决策,观点洞察可能比预测结果更有价值。

在人与模型间建立信任

在没有验证一些基本事实的情况下,许多人认为他们无法信任模型来进行重要决策。考虑到数据出现错误的几率,这是一个明智的预防措施。

在实际应用中,如果模型显示的结果符合他们对问题的一般见解,将有助于在人与模型间建立一种信任,即使对数据科学知之甚少的人而言也是如此。

不过,在Adrian Weller的一篇有趣的论文中,提出AI透明度应该是实现目标的手段,而不是目标本身。Weller认为,更高的模型透明度可能产生对所有人不利的结果,并可能使AI被恶意者滥用。

毫无疑问,AI系统必须足够安全,并且能够防范对抗性攻击,这样,讨论模型的可解释性和透明度才是有积极意义的。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1813

    文章

    49757

    浏览量

    261678
  • 模型
    +关注

    关注

    1

    文章

    3649

    浏览量

    51719
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136236

原文标题:告别AI模型黑盒子:可解释性将是数据科学的下一个“超能力”

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    低成本AI边缘计算盒子DIY:基于迅为RK3568和开源模型,轻松玩转智能识别

    低成本AI边缘计算盒子DIY:基于迅为RK3568和开源模型,轻松玩转智能识别
    的头像 发表于 11-12 13:42 1314次阅读
    低成本AI边缘计算<b class='flag-5'>盒子</b>DIY:基于迅为RK3568和开源<b class='flag-5'>模型</b>,轻松玩转智能识别

    一文了解ai计算盒子(边缘计算盒子)是到底是什么产品?

    和生产的各个场景。很多人对这款设备感到陌生,今天就带大家全面解锁ai边缘计算盒子的核心奥秘。ai边缘计算盒子是高度集成计算机视觉、深度学习网络等高精度AI算法的智能
    的头像 发表于 11-10 14:48 297次阅读
    一文了解ai计算<b class='flag-5'>盒子</b>(边缘计算<b class='flag-5'>盒子</b>)是到底是什么产品?

    产品案例 | 遛“狗”新方式,盒子来帮忙

    当一只机器狗被一个巴掌大的小盒子操控,躲避障碍、跟随指令完成转身、停止等动作时,围观人群纷纷发出惊叹:“这么小的盒子,居然能‘溜’机器狗?”。这个“小
    的头像 发表于 09-08 12:13 3959次阅读
    产品案例 | 遛“狗”新方式,<b class='flag-5'>盒子</b>来帮忙

    嵌入式 STM32 零基础入门:「降维打击式学习法」适配零基础,高效进阶全栈工程师

    黑盒子”,芯片内部的工作原理,看不见,摸不着,全靠死记硬背,抽象难理解!其次,嵌入式知识体系庞杂,只懂软件或只懂硬件,缺乏全流程系统认知,知识碎片化!理论学一堆
    的头像 发表于 08-25 15:24 535次阅读
    嵌入式 STM32 零基础入门:「降维打击式<b class='flag-5'>学习</b>法」适配零基础,高效进阶全栈工程师

    HCAI玩具盒子产品介绍

    HCAI玩具盒子提供PCBA服务、云端中台服务、大模型部署对接服务、定制化模型微调以及免费的3D外壳设计服务。
    发表于 08-15 14:17 1次下载

    通过启发式参数提取校准半导体光放大器的 TLM 模型

    可用于不同的 SOAs,从而对黑盒子器件进行更精确的数值预测。 I. 引言 近年来,网络带宽需求的指数级增
    的头像 发表于 08-05 14:24 396次阅读
    通过启发式参数提取校准半导体光放大器的 TLM <b class='flag-5'>模型</b>

    超小型Neuton机器学习模型, 在任何系统级芯片(SoC)上解锁边缘人工智能应用.

    Neuton 是一家边缘AI 公司,致力于机器 学习模型更易于使用。它创建的模型比竞争对手的框架小10 倍,速度也快10 倍,甚至可以在最
    发表于 07-31 11:38

    边缘计算中的机器学习:基于 Linux 系统的实时推理模型部署与工业集成!

    你好,旅行者!欢迎来到Medium的这一角落。在本文中,我们将把一个机器学习模型(神经网络)部署到边缘设备上,利用从ModbusTCP寄存器获取的实时数据来预测一台复古音频放大器的当前健康状况。你将
    的头像 发表于 06-11 17:22 794次阅读
    边缘计算中的<b class='flag-5'>机器</b><b class='flag-5'>学习</b>:基于 Linux 系统的实时推理<b class='flag-5'>模型</b>部署与工业集成!

    cyusb3014在安装驱动的时候,默认的pid变成了pid_00bc,不再是默认的pid_00f3,如何改回默认的pid_00f3呢?

    在安装驱动的时候,默认的pid变成了pid_00bc,不再是默认的pid_00f3,如何改回默认的pid_00f3呢?
    发表于 05-21 06:25

    【「# ROS 2智能机器人开发实践」阅读体验】机器人入门的引路书

    的限制和调控) 本书还有很多前沿技术项目的扩展 比如神经网络识别例程,机器学习图像识别的原理,yolo图像追踪的原理 机器学习训练三大点: 先准备一个基本的
    发表于 04-30 01:05

    通过启发式参数提取校准半导体光放大器的TLM模型

    的合理近似。为此,提出的方法调整了有源区厚度、约束因子、线性增益系数和透明电流等参数。该方法可用于不同的 SOAs,从而对黑盒子器件进行更精确的数值预测。
    的头像 发表于 03-27 10:03 665次阅读
    通过启发式参数提取校准半导体光放大器的TLM<b class='flag-5'>模型</b>

    机器学习模型市场前景如何

    当今,随着算法的不断优化、数据量的爆炸式增长以及计算能力的飞速提升,机器学习模型的市场前景愈发广阔。下面,AI部落小编将探讨机器学习
    的头像 发表于 02-13 09:39 627次阅读

    如何陪伴机器人更懂家庭

    随着ChatGPT等AI的出现,《her》似乎不再是科幻。大家开始探索AI陪聊、AI心理咨询,甚至是AI男友/女友等等,而在这个过程中,一直属于机器人中的“小透明“,AI陪伴机器人首次站在了行业的聚光灯下。
    的头像 发表于 01-20 17:21 1377次阅读

    【「具身智能机器人系统」阅读体验】2.具身智能机器人大模型

    中取得了令人瞩目的效果。 阅读感悟 从传统的手动编程到借助大模型实现智能化、自主化,从单一模态的交互到多模态信息的深度融合,再到扩散模型的应用,机器人控制技术正在以惊人的速度进化。这不仅
    发表于 12-29 23:04

    《具身智能机器人系统》第7-9章阅读心得之具身智能机器人与大模型

    医疗领域,手术辅助机器人需要毫米级的精确控制,书中有介绍基于视觉伺服的实时控制算法,以及如何利用大模型优化手术路径规划。工业场景中,协作机器人面临的主要挑战是快速适应新工艺流程。具身智能通过在线
    发表于 12-24 15:03