0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GBDT是如何用于分类的

深度学习自然语言处理 来源:深度学习自然语言处理 作者:深度学习自然语言 2020-12-26 10:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

❝ 因为用树模型太习以为常了,以至于看到这个标题很容易觉得这很显然。但越简单的东西越容易出现知识盲区,仔细想一下好像确实有点疑问:GBDT 用的是回归树,是如何做的分类呢? - 作者:1直在路上1 -https://www.cnblogs.com/always-fight/p/9400346.html 编辑:阿泽的学习笔记 ❞

一 简介

GBDT 在传统机器学习算法里面是对真实分布拟合的最好的几种算法之一,在前几年深度学习还没有大行其道之前,GBDT 在各种竞赛是大放异彩。原因大概有几个

效果确实挺不错;

既可以用于分类也可以用于回归;

可以筛选特征。

这三点实在是太吸引人了,导致在面试的时候大家也非常喜欢问这个算法。

GBDT 是通过采用加法模型(即基函数的线性组合),以及不断减小训练过程产生的残差来达到将数据分类或者回归的算法。

GBDT 通过多轮迭代,每轮迭代产生一个弱分类器,每个分类器在上一轮分类器的残差基础上进行训练。对弱分类器的要求一般是足够简单,并且是低方差和高偏差的。因为训练的过程是通过降低偏差来不断提高最终分类器的精度。

二 GBDT如何用于分类的

第一步:「训练的时候,是针对样本 X 每个可能的类都训练一个分类回归树」。如目前的训练集共有三类,即 K = 3,样本 x 属于第二类,那么针对样本x的分类结果,我们可以用一个三维向量 [0,1,0] 来表示,0 表示不属于该类,1 表示属于该类,由于样本已经属于第二类了,所以第二类对应的向量维度为 1,其他位置为 0。

针对样本有三类的情况,我们实质上是在每轮的训练的时候是同时训练三颗树。第一颗树针对样本 x 的第一类,输入是 ,第二颗树针对样本x的第二类,输入是 ,第三颗树针对样本x的第三类,输入是 。

在对样本 x 训练后产生三颗树,对 x 类别的预测值分别是 ,那么在此类训练中,样本 x 属于第一类,第二类,第三类的概率分别是:

然后可以求出针对第一类,第二类,第三类的残差分别是:

然后开始第二轮训练,针对第一类输入为 ,针对第二类输入为 ,针对第三类输入为 ,继续训练出三颗树。一直迭代M轮,每轮构建三棵树当训练完毕以后,新来一个样本 ,我们需要预测该样本的类别的时候,便产生三个值 ,则样本属于某个类别 c 的概率为:

三 GBDT多分类举例说明

下面以 Iris 数据集的六个数据为例来展示 GBDT 多分类的过程

d248a150-4692-11eb-8b86-12bb97331649.png

具体应用到 gbdt 多分类算法。我们用一个三维向量来标志样本的 label,[1,0,0] 表示样本属于山鸢尾,[0,1,0] 表示样本属于杂色鸢尾,[0,0,1] 表示属于维吉尼亚鸢尾。

gbdt 的多分类是针对每个类都独立训练一个 CART Tree。所以这里,我们将针对山鸢尾类别训练一个 CART Tree 1。杂色鸢尾训练一个 CART Tree 2 。维吉尼亚鸢尾训练一个CART Tree 3,这三个树相互独立。

我们以样本 1 为例:

针对 CART Tree1 的训练样本是 [5.1,3.5,1.4,0.2],label 是 1,模型输入为 [5.1, 3.5, 1.4, 0.2, 1]

针对 CART Tree2 的训练样本是 [5.1,3.5,1.4,0.2],label 是 0,模型输入为 [5.1, 3.5, 1.4, 0.2, 0]

针对 CART Tree3 的训练样本是 [5.1,3.5,1.4,0.2],label 是 0,模型输入为[5.1, 3.5, 1.4, 0.2, 0]

下面我们来看 CART Tree1 是如何生成的,其他树 CART Tree2 , CART Tree 3 的生成方式是一样的。CART Tree 的生成过程是从这四个特征中找一个特征做为 CART Tree1 的节点。

比如花萼长度做为节点。6 个样本当中花萼长度大于等于 5.1 cm 的就是 A 类,小于 5.1 cm 的是 B 类。生成的过程其实非常简单,问题

是哪个特征最合适?

是这个特征的什么特征值作为切分点?

即使我们已经确定了花萼长度做为节点。花萼长度本身也有很多值。在这里我们的方式是遍历所有的可能性,找到一个最好的特征和它对应的最优特征值可以让当前式子的值最小:

我们以第一个特征的第一个特征值为例。R1 为所有样本中花萼长度小于 5.1cm 的样本集合,R2 为所有样本中花萼长度大于等于 5.1cm 的样本集合,所以 。

d2763b74-4692-11eb-8b86-12bb97331649.png

为 R1 所有样本label的均值:, 为 R2 所有样本 label 的均值:

下面计算损失函数的值,采用平方误差,分别计算 R1 和 R2 的误差平方和,样本 2 属于 R1 的误差:,样本 1,3,4,5,6 属于 R2 的误差和:

接着我们计算第一个特征的第二个特征值,即 R1 为所有样本中花萼长度小于 4.9 cm 的样本集合,R2 为所有样本当中花萼长度大于等于 4.9 cm 的样本集合,, 为 R1 所有样本 label 的均值:0, 为 R2 所有样本 label 的均值:

d2b2c436-4692-11eb-8b86-12bb97331649.png

计算所有样本的损失值,样本 1 和 2 属于 R2,损失值为:,样本 3,4,5,6 也属于 R2,损失值为:,两组损失值和为 2.222,大于特征一的第一个特征值的损失值,所以我们不取这个特征的特征值。

「继续,这里有四个特征,每个特征有六个特征值,所有需要 6*4=24 个损失值的计算,我们选取值最小的分量的分界点作为最佳划分点,这里我们就不一一计算了,直接给出最小的特征花萼长度,特征值为 5.1 cm。这个时候损失函数最小为 0.8。于是我们的预测函数此时也可以得到:」

「此例子中,训练完以后的最终式子为:」

由这个式子,我们得到对样本属于类别 1 的预测值:,同理我们可以得到对样本属于类别 2,3 的预测值 ,样本属于类别 1 的概率

责任编辑:xj

原文标题:GBDT 如何用于分类问题

文章出处:【微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4761

    浏览量

    97153
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136236
  • GBDT
    +关注

    关注

    0

    文章

    13

    浏览量

    4168

原文标题:GBDT 如何用于分类问题

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    传感器大全分类

    传感器大全分类
    发表于 09-04 16:56 1次下载

    关于NanoEdge AI用于n-Class的问题求解

    我想请教一下关于NanoEdge AI用于n-Class的问题。我使用NanoEdge AI的n-Class模式,训练好模型,设计了3个分类,使用PC端的模拟工具测试过,模型可以正常对数据进行分类
    发表于 08-11 06:44

    产品分类管理API接口

    ​ 产品分类管理是现代电商、库存系统和内容管理平台的核心功能,它通过API接口实现高效的分类创建、查询、更新和删除操作。本文将逐步介绍产品分类管理API的设计原理、关键功能和实现方法,帮助您构建可靠
    的头像 发表于 07-25 14:20 318次阅读
    产品<b class='flag-5'>分类</b>管理API接口

    霍尔IC的原理和分类

    霍尔IC是一种能够进行高/低电平数字信号输出的传感器,便于后端驱动器和微控制器进行数据处理,因此被广泛应用于各种白色家电和工业设备中。本页将介绍霍尔IC的原理和分类
    的头像 发表于 07-08 14:28 1699次阅读
    霍尔IC的原理和<b class='flag-5'>分类</b>

    用一杯咖啡的时间,读懂AI二分类如何守护工业质量

    您是否想过,工厂里那些"非黑即白"的判断,正由AI用最简洁的逻辑守护质量?今天,让我们通过一个零件组装中的弹垫错装、漏装、多装、错序分类案例,拆解AI二分类技术的核心
    的头像 发表于 07-08 07:35 714次阅读
    用一杯咖啡的时间,读懂AI二<b class='flag-5'>分类</b>如何守护工业质量

     电源管理芯片的分类

    电源管理芯片的分类 电源管理芯片涵盖电压转换、电池管理、驱动控制等核心功能,并适配汽车、消费电子、工业等多样化场景,技术向高集成度与智能化推进。 一、按核心功能分类 电压转换 AC/DC调制芯片
    的头像 发表于 05-12 11:49 1453次阅读
     电源管理芯片的<b class='flag-5'>分类</b>

    电子元器件的分类方式

    电子元器件可以按照不同的分类标准进行分类,以下是一些常见的分类方式。
    的头像 发表于 04-16 14:52 2106次阅读

    何用几条命令搞定Ubuntu系统的网络配置

    在某些场景下,设备没有显示器或屏可以用,这时候通过命令行来设置网络就变得特别重要了。本文将介绍如何用几条命令搞定Ubuntu系统的网络配置。
    的头像 发表于 03-14 10:53 3264次阅读
    如<b class='flag-5'>何用</b>几条命令搞定Ubuntu系统的网络配置

    调制方式的分类与比较

    、频率或相位)以及调制信号的形式(连续波或脉冲)。 调制方式的分类 1. 模拟调制 模拟调制是指将模拟信号直接调制到载波上。这种调制方式主要用于早期的无线电通信和一些现代的无线通信系统。 幅度调制(AM) :通过改变载波的
    的头像 发表于 01-21 09:16 2964次阅读

    AN-737: 如何用ADIsimADC完成ADC建模

    电子发烧友网站提供《AN-737: 如何用ADIsimADC完成ADC建模.pdf》资料免费下载
    发表于 01-13 14:54 1次下载
    AN-737: 如<b class='flag-5'>何用</b>ADIsimADC完成ADC建模

    断路器的分类及应用领域

    断路器的分类 断路器可以根据不同的标准进行分类,以下是几种常见的分类方式: 按极数分类 : 单极断路器:用于单相电路。 双极断路器:
    的头像 发表于 01-03 09:33 2885次阅读

    ADS1294如何用来测心电?

    请教一下ADS1294 如何用来测心电
    发表于 12-31 06:16

    安规电容的分类及特性

    安规电容的分类 安规电容可以根据不同的标准和应用场景进行分类,主要包括以下几种: X电容(X类电容器) X电容主要用于电源线路中,用于抑制差模噪声。 它们通常具有较低的电容值,并且能够
    的头像 发表于 12-26 09:42 1675次阅读

    ddc与其他分类系统的比较

    DDC(Dewey Decimal Classification,即杜威十进制分类法)与其他分类系统在多个方面存在差异。以下是对DDC与其他分类系统(如体系分类法、网络
    的头像 发表于 12-18 15:10 1472次阅读

    如何使用ddc进行数据分类

    在探讨如何使用DDC(Dewey Decimal Classification,即杜威十进制分类法)进行数据分类时,我们首先需要明确DDC是一种用于图书馆分类和组织图书的体系,它按照一
    的头像 发表于 12-18 15:05 1805次阅读