0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

线性判别分析LDA背后的数学原理

jf_78858299 来源:人工智能大讲堂 作者:人工智能大讲堂 2023-04-19 11:30 次阅读

线性判别分析(LDA)是一种降维技术,其目标是将数据集投影到较低维度空间中。线性判别分析也被称为正态判别分析(NDA)或判别函数分析,是Fisher线性判别的推广。

线性判别分析(LDA)和主成分分析(PCA)都是常用的线性变换技术,用于降低数据的维度。

PCA可以描述为“无监督”算法,因为它“忽略”类别标签,其目标是找到最大化数据集方差的方向(所谓的主成分)。

与PCA不同,LDA是“有监督的”,它计算出能够最大化多个类别之间间隔的轴(“线性判别”)。

图片

LDA是如何工作的?

LDA使用Fisher线性判别方法来区分类别。

Fisher线性判别是一种分类方法,它将高维数据投影到一维空间中,并在这个一维空间中进行分类。

投影最大化类别均值之间的距离,同时最小化每个类别内部的方差。

图片

类别:1、2和3

类别均值:µ1、µ2和µ3

类别间散布:SB1、SB2和SB3

类别内散布:SW1、SW2和SW3

数据集均值:µ

它的思想是最大化类别间散布SB,同时最小化类别内散布SW。

数学公式

图片

图片

动机

  • 寻找一个方向,可以放大类间差异。

  • 最大化投影后的均值之间的(平方)差异。

    (通过找到最大化类别均值之间差异的方向,LDA可以有效地将数据投影到一个低维子空间中,其中类别更容易分离)

图片

  • 最小化每个类别内的投影散布

    (通过找到最大化类别均值之间差异的方向,LDA可以有效地将数据投影到一个低维子空间中,其中类别更容易分离)

    图片

散布

图片

图片

均值差异

图片

散布差异

图片

Fischer 指数

图片

图片

这意味着在选择特征值时,我们将始终选择C-1个特征值及其相应的特征向量。其中,C为数据集中的类别数。

例子

**数据集

**

图片

步骤1:计算类内散布矩阵(SW)

图片

计算每个类别的协方差矩阵

类别1:

图片

Class 1

均值矩阵:

图片

协方差:

图片

图片

图片

将S1到 S5加在一起就得到了 Sc1

图片

类别2:

图片

Class 2

均值矩阵:

图片

图片

和 Sc1一样, 将S6 到S10加到一起, 就得到了协方差 Sc2 -

图片

将Sc1和Sc2相加就得到了类内散布矩阵Sw。

图片

步骤2:计算类间散布矩阵(SB)

图片

我们已经有了类别1和类别2每个特征的均值。

图片

步骤3:找到最佳LDA投影向量

与PCA类似,我们使用具有最大特征值的特征向量来找到最佳投影向量。该特征向量可以用以下形式表示。

图片

我们已经计算得到了SB和SW。

图片

解出lambda后,我们得到最高值lambda = 15.65。现在,对于每个lambda值,解出相应的向量。

图片

图片

图片

步骤4:将样本转换到新子空间上。

图片

因此,使用LDA我们进行了如下转换。

图片

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 函数
    +关注

    关注

    3

    文章

    3868

    浏览量

    61309
  • 线性
    +关注

    关注

    0

    文章

    188

    浏览量

    24973
  • LDA
    LDA
    +关注

    关注

    0

    文章

    28

    浏览量

    10536
收藏 人收藏

    评论

    相关推荐

    GraphSAGEGNN算法的数学原理是什么?

    本文深入讨论了GraphSAGEGNN算法的数学原理,并从多个维度分析了GNN加速器设计中的技术挑战。
    发表于 06-17 08:56

    变压变频调速的数学原理是什么

    变压变频调速系统的基本原则是什么?变压变频调速的数学原理是什么?
    发表于 08-03 06:10

    基于核函数的Fisher判别分析算法在人耳识别中的应用

    针对人耳图像自身的特点,并通过对现有生物识别技术的研究,本文尝试采用了一种基于核函数的Fisher 判别分析算法对人耳进行识别。该算法不仅可以有效地提取人耳特征,获得
    发表于 05-30 11:44 29次下载

    近邻边界Fisher判别分析

    将数据集进行合理的维数约简对于一些机器学习算法效率的提高起着至关重要的影响。该文提出了一种利用数据点邻域信息的线性监督降维算法:近邻边界Fisher 判别分析(Neighborhood Ma
    发表于 11-21 11:12 7次下载

    KPL特征提取在心电识别中的应用研究

    本文结合核方法、主元分析(PCA)和线性判别分析(LDA)等机器学习方法,提出了一种特征提取的KPL 方法。本文提出的KPL 方法,能够保持数据集的非
    发表于 01-27 14:02 18次下载

    虚电压的判别分析

    虚电压的判别分析
    发表于 08-08 17:37 1417次阅读
    虚电压的<b class='flag-5'>判别分析</b>图

    dq坐标变换数学原理

    dq坐标变换数学原理
    发表于 12-20 22:56 19次下载

    不相关判别分析算法在人脸识别中应用

    对高维数据降维并选取有效特征对分类起着关键作用。针对人脸识别中存在的高维和小样本问题,从特征选取和子空间学习入手,提出了一种L2.1范数正则化的不相关判别分析算法。该算法首先对训练样本矩阵进行
    发表于 11-22 14:40 1次下载

    人脸识别经典算法三:Fisherface(LDA

    斯坦福公开课机器学习或者补充线代等数学知识。 同时作者要感谢cnblogs上的大牛JerryLead,本篇博文基本摘自他的线性判别分析(Linear Discrimina
    发表于 12-04 20:30 1616次阅读

    核局部Fisher判别分析的行人重识别

    ;在度量学习方面,传统的核局部Fisher判别分析度量学习方法对所有查询图像统一映射到相同的特征空间中,忽略了查询图像不同区域的重要性,为此在核局部Fisher判别分析的基础上对特征进行区域分组,采用查询自适应得分融合方
    发表于 12-13 17:25 0次下载

    基于逐步判别分析的血液气味识别

    本文以血液气味色谱为基础,利用逐步判别分析法建立了血液气味识别模型,并对血液气味识别模型的建立进行了详细描述。以Matlab为计算工具,编写了血液气味识别模型的代码。以人体血液与犬、鸡的血液为例,讨论了血液气味识别模型的使用方法。血液气味识别模型能够正确区分人体血液与动物血液。
    发表于 01-04 16:38 0次下载
    基于逐步<b class='flag-5'>判别分析</b>的血液气味识别

    基于监督局部线性嵌入的中药材分类鉴别研究

    电子鼻所采集的中药材气味信息往往具有高维性和非线性。针对气味信息的这种特性,提出一种基于监督局部线性嵌入( SLLE)和线性判别分析LDA
    发表于 01-14 11:20 0次下载

    利用基于线性判别分析的多变量分析模型对豇豆种子进行分类

    判别分析LDA)的多变量分析模型,根据种子的老化程度、活力程度、幼苗生长状况和发芽速度将种子分为不同的类别。
    的头像 发表于 03-29 15:11 2234次阅读
    利用基于<b class='flag-5'>线性</b><b class='flag-5'>判别分析</b>的多变量<b class='flag-5'>分析</b>模型对豇豆种子进行分类

    深入卷积神经网络背后数学原理

    在计算机神经视觉技术的发展过程中,卷积神经网络成为了其中的重要组成部分,本文对卷积神经网络的数学原理进行了介绍。
    的头像 发表于 04-25 14:52 3360次阅读

    十大机器学习算法中的线性判别分析的详细介绍

    先前呢,我们在最受欢迎的十大机器学习算法-part1和最受欢迎的十大机器学习算法-part2两篇文章中简单介绍了十种机器学习算法,有的读者反映看完还是云里雾里,所以,我会挑几种难理解的算法详细讲解一下,今天我们介绍的是线性判别分析
    的头像 发表于 02-03 07:28 7026次阅读