0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

详谈机器学习的决策树模型

如意 来源:逍遥埠 作者:逍遥埠 2020-07-06 09:49 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

决策树模型是白盒模型的一种,其预测结果可以由人来解释。我们把机器学习模型的这一特性称为可解释性,但并不是所有的机器学习模型都具有可解释性。

作为可解释性属性的一部分,特征重要性是一个衡量每个输入特征对模型预测结果贡献的指标,即某个特征上的微小变化如何改变预测结果。

直觉

不同于基尼不纯度或熵,没有一个通用的数学公式来定义特征的重要性,而特征的重要性在不同的模型中是不同的。

例如,对于线性回归模型,假设所有输入特征具有相同的尺度(如[0,1],那么每个特征的特征重要性就是与该特征相关的权值的绝对值。从这个公式可以看出线性回归模型的f (X) =∑i = 1 n (wixi),模型的结果是线性正比于每个组件(wixi)这是由重量决定的(wi)的组件。

对于决策树,为了度量特征的重要性,我们需要研究模型,看看每个特征是如何在模型的最终“决策”中发挥作用的。从前面的文章中我们了解到,在决策树模型中,在每个决策节点上,我们选择最佳的特征进行分割,以便进一步区分到达该决策节点的样本。在每一次分割中,我们都更接近最终的决定(即叶节点)。因此,我们可以说,在每个决策节点上,所选择的分割特征决定了最终的预测结果。直观地说,我们也可以说,那些被选择的特征比那些实际上在决策过程中没有作用的非被选择的特征更重要。现在,剩下的问题是我们如何量化地衡量这种重要性。

有人可能还记得,我们使用信息增益或基尼系数来衡量分割的质量。当然,还可以将增益与所选择的特性关联起来,并使用增益来量化该特性在这个特定的分裂发生时的贡献。此外,我们可以累积决策树中出现的每个特征的增益。

最后,每个特征的累积增益可以作为决策树模型的特征重要性。

另一方面,作为一个可能会注意到,这一决定节点不是同样重要的是,自从决定节点树的根可以帮助过滤所有的输入样本,而决定节点树的底部有助于区分总样本的只有少数。因此,一个特征在每个决策节点获得的增益的权重并不相同,即一个特征在一个决策节点获得的增益应按该决策节点帮助区分的样本比例进行加权。

基于上述直觉,我们可以推导出以下公式来计算决策树中每个特征的重要性I:

详谈机器学习的决策树模型

注:我们可以用上述公式中的信息增益来代替基尼系数增益度量,只要我们对所有特征都使用相同的度量。

通过上面的公式,我们可以得到一个值来衡量决策树中每个特征的重要性。有时,可能需要对值进行规范化,以便更直观地比较这些值,即将所有值缩放到(0,1)的范围内。例如,如果有两个特征经过归一化后得分相同(即0.5),我们可以说它们在决策树中同等重要。

举个例子

让我们看一个具体的例子,看看我们如何应用上面的公式来计算决策树中的特征重要性。首先,我们在下图中展示了一个实例决策树。

详谈机器学习的决策树模型

从图中可以看出,该树中共有3个决策节点。在每个决策节点中,我们指出了三条信息:

1、选择要分割的特性。

2、特征获得的基尼系数

3、分别分配给左子节点和右子节点的样本数量。

此外,我们可以看出决策树总共训练了100个样本。

因此,我们可以计算出树中涉及的两个特征的特征重要性如下:

详谈机器学习的决策树模型

进一步,我们可以得到归一化特征重要性如下:

详谈机器学习的决策树模型

后记:路漫漫其修远兮,吾将上下而求索!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    67

    文章

    8570

    浏览量

    137381
  • 决策树
    +关注

    关注

    3

    文章

    96

    浏览量

    14114
  • 白盒测试
    +关注

    关注

    1

    文章

    15

    浏览量

    10891
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    从采购设备到选择伙伴:2026年高压试验变压器选型决策树

    “选择一个能支撑业务发展的战略伙伴”。以下决策树模型,将助您拨开迷雾,做出科学选择。第一步:核心场景定义——您的“主战场”在哪里?这是所有决策的起点。请明确您70%
    的头像 发表于 05-18 16:32 60次阅读
    从采购设备到选择伙伴:2026年高压试验变压器选型<b class='flag-5'>决策树</b>

    科技,IPO申请获受理

    ,宇科技本次公开发行新股不低于4044.64万股,募集资金计划用于智能机器模型研发、机器人本体研发、新型智能机器人产品开发及智能
    的头像 发表于 03-20 18:33 4382次阅读
    宇<b class='flag-5'>树</b>科技,IPO申请获受理

    算法工程师需要具备哪些技能?

    :自动化任务(如数据预处理、模型训练调度)。Git版本控制:团队协作开发(如分支管理、代码合并)。 机器学习监督学习:线性回归、逻辑回归、决策树
    发表于 02-27 10:53

    强化学习会让自动驾驶模型学习更快吗?

    是一种让机器通过“试错”学会决策的办法。与监督学习不同,监督学习是有人提供示范答案,让模型去模仿;而强化
    的头像 发表于 01-31 09:34 931次阅读
    强化<b class='flag-5'>学习</b>会让自动驾驶<b class='flag-5'>模型</b><b class='flag-5'>学习</b>更快吗?

    NVIDIA Cosmos世界基础模型如何塑造机器人未来

    在这一演进过程中,世界模型逐渐成为连接高层智能与底层执行的关键基础设施。通过对环境状态及其时间演化进行建模,世界模型使机器人系统能够在受控环境中进行仿真、训练与决策推演,从而为
    的头像 发表于 01-22 16:38 898次阅读
    NVIDIA Cosmos世界基础<b class='flag-5'>模型</b>如何塑造<b class='flag-5'>机器</b>人未来

    机器学习和深度学习中需避免的 7 个常见错误与局限性

    无论你是刚入门还是已经从事人工智能模型相关工作一段时间,机器学习和深度学习中都存在一些我们需要时刻关注并铭记的常见错误。如果对这些错误置之不理,日后可能会引发诸多麻烦!只要我们密切关注
    的头像 发表于 01-07 15:37 390次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>和深度<b class='flag-5'>学习</b>中需避免的 7 个常见错误与局限性

    基于ETAS嵌入式AI工具链将机器学习模型部署到量产ECU

    AI在汽车行业的应用日益深化,如何将机器学习领域的先进模型(如虚拟传感器)集成到ECU软件中,已成为业界面临的核心挑战。
    的头像 发表于 12-24 10:55 6485次阅读
    基于ETAS嵌入式AI工具链将<b class='flag-5'>机器</b><b class='flag-5'>学习</b><b class='flag-5'>模型</b>部署到量产ECU

    五大卫星运管中心大模型智能决策分系统软件的应用与未来发展

        五大机构/企业卫星运管中心大模型智能决策分系统实践综述    当前,随着大规模星座部署与智能化作战需求激增,以大模型驱动的卫星智能决策系统成为全球航天强国和头部企业的战略焦点。
    的头像 发表于 12-18 14:58 567次阅读

    基于级联分类器的人脸检测基本原理

    ,然后把滑动窗口中的像素灰度值和级联分类器里预先训练好的468棵决策树中的节点进行比较,得到该窗口检测结果为人脸的置信度。如果置信度大于一定的阈值,那么我们认为人脸被检测到了,反之则为未检测到人脸
    发表于 10-30 06:14

    科技发布H2仿生人形机器

    就在10月20日会跳舞的机器人来了,宇科技正式发布H2仿生人形机器人,高180cm,重70kg,配以31个关节。在宇科技展示的视频中,H2仿生人形
    的头像 发表于 10-20 17:52 2162次阅读

    科技预告新款人形机器人:有31个关节

    机器人似乎要搞大事了,宇科技发布了新款人形机器人的海报,虽然配文只有“敬请期待”几个字,但是根据海报信息显示新款机器人配备有31个关节
    的头像 发表于 08-19 23:10 2242次阅读

    宜科MVT阀岛在宇科技人形机器人中的应用

    在科技飞速发展的当下,机器人行业正以前所未有的速度蓬勃兴起。其中,宇科技作为行业内的佼佼者,凭借其创新的产品和领先的技术,在全球机器人市场中占据了重要地位。从四足机器人到人形
    的头像 发表于 08-16 17:31 1701次阅读

    超小型Neuton机器学习模型, 在任何系统级芯片(SoC)上解锁边缘人工智能应用.

    Neuton 是一家边缘AI 公司,致力于让机器 学习模型更易于使用。它创建的模型比竞争对手的框架小10 倍,速度也快10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文
    发表于 07-31 11:38

    光伏电站智能分析决策的系统化应用工具

    数据采集传输;然后经过一定的处理技术,对数据进行清洗与存储、提取复合特征,并基于机器学习以及深度学习算法,进行模型建设协同分析,从而实现趋势预测。 最重要的内容体现是在于智能
    的头像 发表于 07-03 14:56 894次阅读
    光伏电站智能分析<b class='flag-5'>决策</b>的系统化应用工具

    边缘计算中的机器学习:基于 Linux 系统的实时推理模型部署与工业集成!

    你好,旅行者!欢迎来到Medium的这一角落。在本文中,我们将把一个机器学习模型(神经网络)部署到边缘设备上,利用从ModbusTCP寄存器获取的实时数据来预测一台复古音频放大器的当前健康状况。你将
    的头像 发表于 06-11 17:22 1197次阅读
    边缘计算中的<b class='flag-5'>机器</b><b class='flag-5'>学习</b>:基于 Linux 系统的实时推理<b class='flag-5'>模型</b>部署与工业集成!