张飞软硬开源基于STM32 BLDC直流无刷电机驱动器开发视频套件,👉戳此立抢👈

什么是PCA?何时应该使用PCA?PCA是如何工作的?

论智 2018-08-24 09:07 次阅读

编者按:General Assembly数据科学主讲Matt Brems讲解了主成分分析的原理、数学和最佳实践。

在统计学经典教材Casella & Berger的前言中,作者以完美的方式解释了他们选择编写这本教材的原因:

当有人发现你在编教材的时候,会问下面两个问题。第一个是“你为什么写书?”第二个是“你的书和现有的书有什么不一样?”第一个问题相当容易回答。写书是因为你对现有的文本不完全满意。

在统计学和数据科学中,主成分分析(PCA)是非常重要的技术……但我在备课的时候,发现网上的资料过于技术性,不能完全满足我的需要,甚至提供互相冲突的信息。所以我很有把握地说,我对“现有的文本不完全满意”。

因此,我打算讲述下PCA的3W1H:什么是PCA(What),何时应用PCA(When),PCA如何工作(How),为什么PCA有效(Why)。另外,我也将提供一些深入解释这一主题的资源。我特别想要呈现这一方法的原理,其下的数学,一些最佳实践,以及潜在的缺陷。

尽管我想要让PCA尽可能地平易近人,但我们将要讨论的算法是相当技术性的。熟悉以下知识能够更容易地理解本文和PCA方法:矩阵运算/线性代数(矩阵乘法,矩阵转置,矩阵取逆,矩阵分解,本征向量/本征值)和统计/机器学习(标准化、方差、协方差、独立、线性回归、特征选取)。在文章中,我加上了指向讲解这些主题的链接,但这些链接(我希望)主要起温习作用,以备遗忘,并不要求必须阅读。

什么是PCA?

假设你想要预测美国本年度的GDP。你具有大量信息:2017年第一季度的美国GDP数据,去年的GDP,前年的GDP……你有所有公开的经济指标,比如失业率、通胀率,等等。你有2010年的人口普查数据,可以估计每个行业中有多少美国人工作,以及在人口普查间隙更新这些估计的美国社区调查数据。你知道两党在参众两院各有多少席位。你可以收集股价、IPO数量,已经有多少CEO看起来对参政感兴趣。

TL;DR——有大量变量需要考虑。

如果你之前曾经处理过大量变量,你会知道这会带来问题。你了解所有变量之间的相互关系吗?你的变量是否多到导致过拟合风险显著加大?或者违背了建模策略的假设?

你也许会问:“我怎样才能仅仅关注收集变量中的一小部分呢?”用术语说,你想要“降低特征空间的维度”。通过降低特征空间的维度,你需要考虑的变量之间的关系不那么多了,过拟合的风险也不那么高了。(注意:这并不意味着再也不需要考虑过拟合等事项——不过,我们的方向是正确的!)

毫不令人意外,降低特征空间的维度称为“降维”。有许多降维的方法,但大部分降维技术属于:

特征消除

特征提取

顾名思义,特征消除(feature elimination)通过消除特征降低特征空间的维度。在上面举的GDP的例子中,我们可以保留三个我们认为最能预测美国的GDP的特征,丢弃所有其他特征,而不是考虑所有特征。特征消除方法的优势有:简单,保持变量的可解释性。

特征消除方法的缺点是你无法从丢弃变量中获得信息。如果我们仅仅使用去年的GDP,制造业人口比例(根据最新的美国社区调查数据),失业率来预测今年的GDP,我们将失去所有丢弃变量的信息,这些丢弃变量本可以为模型贡献力量。消除特征的同时,我们也完全消除了丢弃变量可能带来的任何好处。

而特征提取没有这个问题。假设我们有十个自变量。在特征提取时,我们创建十个“新”自变量,每个“新”自变量是“旧”自变量的组合。然而,我们以特定方式创建这些新自变量,并根据它们对因变量的预测能力排序。

你可能会说:“哪里体现了降维?”好吧,我们保留所需的新自变量,丢弃“最不重要的那些”。由于我们根据新变量预测因变量的能力排序,因此我们知道哪个变量最重要,哪个变量最不重要。但是——关键部分来了——由于这些新自变量是旧变量的组合,因此我们仍然保留了旧变量最有价值的部分,尽管我们丢弃了一个或几个“新”变量!

主成分分析是一种特征提取技术——以特定的方式组合输入变量,接着在保留所有变量最有价值部分的同时,丢弃“最不重要”的变量!这还带来了有益的副作用,PCA得到的所有“新”变量两两独立。这是有益的,因为线性模型的假设要求自变量互相独立。如果我们用这些“新”变量拟合一个线性回归模型(见后文的“主成分回归”),这一假设必定会满足。

何时应该使用PCA?

你是否想要降低变量的数目,但不能够识别可以完全移除的变量?

你是否想要确保变量相互独立?

你是否可以接受让自变量变得不那么容易解释?

如果这三个问题的回答都是“是”,那PCA是一个很合适的选择。如果第三问的回答是“否”,那么你不应该使用PCA。

PCA是如何工作的?

下一节将讨论PCA为何有效。让我们在讲解算法之前先简要概括下整个过程:

我们将计算概括变量互相关性的矩阵。

接着我们将这一矩阵分为两部分:方向和大小。之后我们可以了解数据的“方向”及其“大小”(也就是每个方向有多“重要”)。下图展示了数据的两个主要方向:“红向”和“绿向”。在这一情形下,“红向”更重要。我们将在后文讨论这是为什么,不过,看看给定的数据点排列的方式,你能看出为什么“红向”比“绿向”更重要吗?(提示:能最好地拟合这些数据的直线看起来是什么样?)

图片来源:setosa.io

我们将沿着重要方向(原变量的组合)转换原始数据。下图是经过转换的数据,x轴和y轴遵循“红向”和“绿向”。能最好地拟合这些数据的直线看起来会是什么样?

图片来源:setosa.io

尽管这里的可视化例子是二维的(因此我们有两个“方向”),我们可以设想数据具有更多维度的情形。通过识别哪些“方向”最“重要”,我们可以通过丢弃“最不重要”的“方向”将数据压缩进较小的特征空间。通过将数据投射到较小的特征空间,我们降低了特征空间的维度。但因为数据是根据这些不同的“方向”转换的,我们确保模型保留了所有原变量。

下面我将具体讲解推导PCA的算法。我尝试避免让本文过于技术性,但这里的细节不可能忽略,因此我的目标是尽可能明确地讲解。下一节将深入讨论为什么这一算法有效的直觉。

在开始之前,将数据整理成表格形式,n行,p+1列,其中一列对应因变量(通常记为Y),p列对应于自变量(这一自变量矩阵通常记为X)。

根据上一段的定义,将数据分成Y和X——我们主要处理X。

在自变量矩阵X的每一列上,从每个条目中减去该列的均值。(这确保每列的均值为0.)

决定是否标准化。给定X的列,是否高方差的特征比低方差的特征更重要?(这里重要指特征能更好地预测Y。)如果特征的重要性独立于特征的方差,那么将列中的每项观测除以该列的标准差。(结合第二步、第三步,我们将X的每列标准化了,确保每列的均值为零,标准差为1.)所得矩阵称为Z。

转置矩阵Z,将转置矩阵和原矩阵相乘。(数学上写为ZTZ.)所得矩阵为Z的协方差矩阵(无视常数差异)。

(这大概是最难的一步——跟紧了。)计算ZTZ的本征向量和相应的本征值。在大多数计算软件包下,这都很容易做到——事实上,ZTZ的本征分解为将ZTZ分解为PDP-1,其中P为本征向量矩阵,D为对角线为本征值、其余值均为零的对角矩阵。D的对角线上的本征值对应P中相应的列——也就是说,D对角线上的第一个元素是λ1,相应的本征向量是P的第一列。我们总是能够计算出这样的PDP-1。(奖励:致对此感兴趣的读者,我们之所以总是能够计算出这样的PDP-1是因为ZTZ是一个对称正定矩阵。)

将本征值λ1,λ2…,λp由大到小排列。并据此排列P中相应的本征向量。(例如,如果λ2是最大的本征值,那么就将P的第二列排到第一。)取决于计算软件包,这可能可以自动完成。我们将这一经过排序的本征向量矩阵记为P*。(P*的列数应当与P相同,只不过顺序可能不同。)注意这些本征向量相互独立。

计算Z* = ZP*。这一新矩阵Z*不仅是X的标准化版本,同时其中的每个观测是原变量的组合,其中的权重由本征向量决定。一个额外的好处是,由于P*中的本征向量是相互独立的,Z*的每一列也是相互独立的!

左为原数据X,右为经PCA转换后的数据Z*(图片来源:setosa.io)

上图中,有两点值得注意:

由于我们的主成分相互之间是正交的,因此它们在统计学上是相互独立的……这就是为什么Z*中的列相互独立的原因!

左图和右图显示的是同样的数据,但右图表现的是转换后的数据,坐标轴为主成分。

不管是左图还是右图,主成分相互垂直。事实上,所有主成分总是互相正交(正交是垂直的正式数学术语)。

最后,我们需要决定要保留多少特征,丢弃多少特征。决定这一事项有三种常见的方法,我们下面将讨论这三种方法并举例说明:

现在我们简单解释下解释方差比例这个概念。因为每个本征值大致等于相应本征向量的重要性,所以解释方差比例等于保留特征的本征值之和除以所有特征的本征值。

基因数据的陡坡图(来源:improvedoutcomes.com)

考虑上面的基因数据的陡坡图。红线表明每个特征的解释方差比例,将该主成分的本征值除以所有本征值之和可以得到这一数值。仅仅包括主成分1的解释方差比例是λ1/(λ1 + λ2 + … + λp),约为23%. 仅仅包括主成分2的解释方差比例是λ2/(λ1 + λ2 + … + λp),约为19%.

包括主成分1和主成分2的解释方差比例是(λ1 + λ2)/(λ1 + λ2 + … + λp),约为42%. 也就是图中黄线的部分,黄线表明包括到该点为止的所有主成分的解释方差比例。例如,PC2处的黄点表明包括主成分1和主成分2可以解释42%的模型总方差。

下面,让我们看一些例子:

注意:有些陡坡图的Y轴是本征向量大小而不是方差比例。这样的陡坡图得出的结果是等价的,不过需要手工计算方差比例。

图片来源:statsoft.com

法一:假设我想保留模型中的5个主成分。在上面的基因数据例子中,这5个主成分可以解释66%的总方差(包括全部13个主成分的方差)。

法二:假设我想包括足够的主成分,解释90%的总方差。在上面的基因数据例子中,我将包括前10个主成分,丢弃最后3个变量。

法三:这次我们想要“找到肘部”。从上图中,我们看到,在主成分2和主成分3之间有解释方差比例的较大下降。在这一情形下,我们打算包括前两个特征,丢弃其余特征。如你所见,这个方法有一定的主观性,因为“肘部”没有一个数学上精确的定义,并且在这个例子中,包括前两个特征的模型只能解释42%的总方差。

法一: 随意选择想要保留多少维度。也许我想在二维平面上可视化数据,所以我可能只保留两个特征。这取决于用例,没有硬性规则。

法二: 计算每个特征的解释方差比例(下面将简要解释这一概念),选取一个阈值,不断加上特征直到达到阈值。(例如,如果你想要让模型可以解释80%的总方差,那就加上解释方差比例最大的特征,直到可解释的方差比例达到或超过80%.)

法三: 这一方法和法二密切相关。计算每个特征的解释方差比例,根据解释方差比例排序特征,并随着更多特征的保留,标绘出解释方差的累计比例。(这一图形称为陡坡图,见下。)根据陡坡图可以决定包含的特征的数量,在陡坡图中找到解释方差比例明显小于前一点的点,然后选择到该点为止的特征。(这个方法叫做“找肘法”,因为它通过寻找陡坡图的“弯曲处”或“肘部”以判定解释方差比例最大下降在何处发生。)

丢弃了我们想要丢弃的转换后的变量,就可以收工了!这就是PCA.

但是,为什么PCA有效?

尽管PCA是一个深度依赖线性代数算法的非常技术性的方法,仔细想想,它其实是一个相对直观的方法。

首先,协方差矩阵ZTZ包含了Z中每个变量和其他各个变量相关性的估计。这是一个了解变量相关性的强力工具。

其次,本征值和本征向量很重要。本征向量表示方向。设想下将数据绘制在一张多维的散布图上。每个本征向量可以想像成数据散布图的一个“方向”。本征值表示大小,或者重要性。更大的本征值意味着更重要的方向。

最后,我们做了一个假设,一个特定方向上的更多差异和解释因变量行为的能力相关。大量差异通常意味着信号,而极少差异通常意味着噪音。因此,一个特定方向上的更多差异,理论上意味着这一方向上有一些我们想要检测的重要东西。

所以说,PCA是一个结合了以下概念的方法:

变量之间的相关性的测度(协方差矩阵)。

数据散布的方向(本征向量)。

这些不同方向的相对重要性(本征值)。

PCA组合了预测因子,让我们可以丢弃相对不那么重要的本征向量。

PCA有扩展吗?

有,不过限于篇幅,这里不多说。最常见到的是主成分回归,在Z*中未曾丢弃的特征子集上进行回归。这里Z*的相互独立发挥了作用;在Z*上回归Y,我们知道一定能满足自变量相互独立这一点。不过,我们仍然需要检查其他假设。

另一个常见的变体是核PCA,即先使用核函数升维,再使用PCA降维,从而将PCA应用于非线性情形。

原文标题:主成分分析PCA一站式指南

文章出处:【微信号:jqr_AI,微信公众号:论智】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
分享:

评论

相关推荐

java基础—变量_上

 课程介绍课程大纲课程目标JavaSE作为通向Java大神的必经之路,是做任何Java开发的必备核心基础技术。
发表于 09-14 00:00 0次 阅读
java基础—变量_上

多传感器多源信息融合理论及应用PDF电子书免费下载

本书是关于多传感器多源信息融合理论与应用的一本专著,主要汇集了作者近年来在多源信息融合基础理论与方法....
发表于 06-26 08:00 6次 阅读
多传感器多源信息融合理论及应用PDF电子书免费下载

请问主函数开始后先定义变量还是先初始化时钟?

变量很大
发表于 06-18 03:44 8次 阅读
请问主函数开始后先定义变量还是先初始化时钟?

Matlab的简介和使用及Matlab与数值分析相关内容说明

Matlab软件是一个功能非常强大的数学软件。 包括:科学计算、符号计算、图形处理等功能。 Mat....
发表于 06-13 16:24 27次 阅读
Matlab的简介和使用及Matlab与数值分析相关内容说明

rcS的中export配置环境变量提示错误

在数码相框的项目中,我在/etc/init.d/rcS文件中加入了挂载模块命令和环境变量配置命令, 启动开发板后,发现模块已经挂载上...
发表于 06-12 05:45 42次 阅读
rcS的中export配置环境变量提示错误

Java运算符应该如何使用详细使用说明

复合运算符: +=:把右边的数值与变量的值相加后赋值给变量。例如:int a=10; a+=10;....
发表于 06-11 17:47 5次 阅读
Java运算符应该如何使用详细使用说明

自动编码器与PCA的比较

自编码器虽然不像 PCA 那般在教科书上随处可见,但是在早期被拿来做深度网络的逐层预训练,其地位可见....
发表于 06-11 15:37 93次 阅读
自动编码器与PCA的比较

是否有可能向MESSG文本添加任何变量?

大家好,我正在玩编译消息的微调。我的代码是:问题是:是否有可能向“MESSG”文本添加任何变量????谢谢你 以上来...
发表于 06-11 06:14 30次 阅读
是否有可能向MESSG文本添加任何变量?

keil怎么处理中断中的临时变量?

临时函数1(){uint8_t  a;........} 中断函数1(){uint8_t   b;临时函数1()........} 临时函数2(){uint8_t&...
发表于 06-11 04:35 277次 阅读
keil怎么处理中断中的临时变量?

链接器浪费内存

我正在使用一个CY8C24123在项目中使用PSoC设计器5.3的项目。 代码大小将达到CY8C24123内存的限制,因此我非常关心内存...
发表于 06-10 15:39 56次 阅读
链接器浪费内存

递增的全局变量不能工作

您好,我自己还没有时间研究这个问题(……还没有),但是我发现当使用增量运算符时,我递增的全局变量不能工作。所以:..不能工...
发表于 06-10 06:45 25次 阅读
递增的全局变量不能工作

普通变量与寄存器变量速度对比

如果涉及取址运算,采用普通变量耗时0.7867秒,采用寄存器变量耗时0.4792秒,速度上的差别就没....
发表于 06-03 11:43 101次 阅读
普通变量与寄存器变量速度对比

静态变量、自动变量与寄存器变量的存储

register限定词通知编译器--程序中的变量将频繁使用。它的意思是建议编译器将程序中用regis....
发表于 06-03 11:27 87次 阅读
静态变量、自动变量与寄存器变量的存储

寄存器变量的存储类别

对于局部变量来说,static变量和auto变量是相对而言的。在语句块执行期间,static变量将始....
发表于 06-03 11:07 67次 阅读
寄存器变量的存储类别

寄存器变量定义

 寄存器变量和普通变量比起来速度上的差异很大,毕竟CPU的速度远远大于内存的速度。寄存器有这么两个特....
发表于 06-03 10:40 62次 阅读
寄存器变量定义

寄存器变量

C语言中使用关键字register来声明局部变量为寄存器变量。寄存器变量的值会被存放在CPU的寄存器....
发表于 06-03 10:13 85次 阅读
寄存器变量

变量命名神器

中国程序员开发的神奇网站:变量命名神器!
发表于 05-31 06:44 27次 阅读
变量命名神器

单片机的静态变量详细资料讲解

静态变量作用范围在一个文件内,程序开始时分配空间,结束时释放空间,默认初始化为0,使用时可以改变其值....
发表于 05-30 17:55 24次 阅读
单片机的静态变量详细资料讲解

请问怎么在整个工程里面进行查找?

如题,比如说要查找某个变量是否已宏定义,如何在整个工程里面进行查找,有无快捷键?...
发表于 05-29 03:43 32次 阅读
请问怎么在整个工程里面进行查找?

变量操作不起作用

大家好,我正在尝试读取和处理我的TCP/IP演示应用程序中的I2C数据。我使用了plib示例,它工作得很好(独立运行)。当我在...
发表于 05-27 11:54 40次 阅读
变量操作不起作用

监视变量在调试时显示为红色

当我调试一些显示在窗口上的值出现在Red上时,有人知道为什么会发生这种情况吗? 以上来自于百度翻译    &n...
发表于 05-27 08:14 19次 阅读
监视变量在调试时显示为红色

汽机PCA段系统图设计模型图资料免费下载

本文档的主要内容详细介绍的是汽机PC1A段系统图设计模型图资料免费下载。
发表于 05-17 08:00 46次 阅读
汽机PCA段系统图设计模型图资料免费下载

C语言的数据类型及其对应变量

初始化标识符iden是定义iden时给iden赋值,一个没有被赋值的iden里面存的是之前这块内存的....
发表于 05-16 14:39 87次 阅读
C语言的数据类型及其对应变量

STC单片机的CCP和PCA及PWM模块的原理及实现详细资料说明

STC15系列部分单片机内部集成了三路CCP/PCA/PWM模块,如图 24.1所示。注: STC1....
发表于 05-16 08:00 144次 阅读
STC单片机的CCP和PCA及PWM模块的原理及实现详细资料说明

需要了解表达式,语句,变量与宏的一些概念

从语言的角度看,变量是一个左值,可以放在赋值运算符的左边接受一个值或者是右边用来给别的变量赋值,同时....
发表于 05-15 17:26 36次 阅读
需要了解表达式,语句,变量与宏的一些概念

逻辑代数的基本定律详细实例说明

本文档的主要内容详细介绍的是逻辑代数的基本定律详细实例说明包括了:代入定理,反演定理,对偶定理。
发表于 05-05 08:00 83次 阅读
逻辑代数的基本定律详细实例说明

TensorFlow 变量:表示程序处理的共享持久状态的最佳方法

在 TensorFlow 内部,tf.Variable 会存储持久性张量。
的头像 TensorFlow 发表于 04-29 16:34 317次 阅读
TensorFlow 变量:表示程序处理的共享持久状态的最佳方法

组态王6.53版本如何设定管道流速

最近有朋友问我关于组态王流动怎么设定流速, 除了在画面属性里面编程, 还有没有其他更简单的方法。好像....
发表于 04-26 16:59 71次 阅读
组态王6.53版本如何设定管道流速

ADB与手机无线连接设置

通过adb命令进行无线调试,不需要手机root权限,方便、快捷,就这么简单。
发表于 04-20 09:53 126次 阅读
ADB与手机无线连接设置

51单片机中变量的定义及应用方法

如果省略存储器类型,系统则会按编译模式SMALL,COMPACT或LARGE所规定的默认存储器类型去....
发表于 04-15 15:39 381次 阅读
51单片机中变量的定义及应用方法

enum在单片机编程的应用详细资料说明

Monday,Tuesday,Wednesday,Thursday,Friday,Saturday,....
发表于 04-12 18:28 59次 阅读
enum在单片机编程的应用详细资料说明

C#面向对象设计的详细资料说明

所有东西都是对象:变量和方法的集合。 初级特性:OO最基本的概念,即类和对象。 中级特性:OO最....
发表于 04-11 08:00 80次 阅读
C#面向对象设计的详细资料说明

php unset如何销毁单个或多个变量

unset函数是php自带的一个销毁变量的函数,我们介绍了利用unset来销毁静态变量与全局变量的方....
发表于 03-22 16:45 75次 阅读
php unset如何销毁单个或多个变量

由浅入深的对其降维原理进行了详细总结

矩阵是由多个列向量组成的,因此矩阵降维思想与向量降维思想一样,只要求得矩阵在各基向量的投影即可,基向....
的头像 人工智能爱好者社区 发表于 03-22 14:01 606次 阅读
由浅入深的对其降维原理进行了详细总结

PHP教程之关键字及抽象类使用总结的详细资料说明

声明类成员或方法为static,就可以不实例化类而直接访问。不能通过一个对象来访问其中的静态成员(静....
发表于 03-21 13:40 74次 阅读
PHP教程之关键字及抽象类使用总结的详细资料说明

smarty如何调用PHP常量

保留变量不需要从PHP脚本中分配,是可以在模板中直接访问的数组类型变量,通常被用于访问一些特殊的模板....
发表于 03-20 15:24 51次 阅读
smarty如何调用PHP常量

C++程序设计教程之指针的详细资料说明

本文档详细介绍的是C++程序设计教程之指针的详细资料说明主要内容包括了:1. 指针的概念,2. 变量....
发表于 03-14 16:04 62次 阅读
C++程序设计教程之指针的详细资料说明

C++程序设计教程之数据类型与表达式的详细资料说明

本文档的主要内容详细介绍的是C++程序设计教程之数据类型与表达式的详细资料说明包括了:1 . C++....
发表于 03-14 14:48 54次 阅读
C++程序设计教程之数据类型与表达式的详细资料说明

数据库实战教程之一般变量与替代变量的详细资料说明

本文档的主要内容详细介绍的是数据库实战教程之一般变量与替代变量的详细资料说明。
发表于 03-07 15:16 142次 阅读
数据库实战教程之一般变量与替代变量的详细资料说明

深度学习网络训练技巧的详细资料汇总

本文档的主要内容详细介绍的是深度学习网络训练技巧汇总,总结训练网络的各种经验和技巧
发表于 03-07 08:00 247次 阅读
深度学习网络训练技巧的详细资料汇总

PHP中传值赋值和引用赋值的详细资料详解

本文档的主要内容详细介绍的是PHP中传值赋值和引用赋值的详细资料详解。
发表于 03-06 17:04 60次 阅读
PHP中传值赋值和引用赋值的详细资料详解

STC单片机PCA代码测试的方法及过程解析

MPC82G516为台湾笙泉公司生产的8位MCU,兼容8051。内建PCA功能6个模块,模块0—5对....
发表于 03-04 14:55 333次 阅读
STC单片机PCA代码测试的方法及过程解析

PHP八种变量类型的详细资料说明

本文档的主要内容详细介绍的是PHP八种变量类型的详细资料说明免费下载。
发表于 03-01 17:20 61次 阅读
PHP八种变量类型的详细资料说明

C语言程序设计教程之结构体与共用体的详细资料说明

本文档详细介绍的是C语言程序设计教程之结构体与共用体的详细资料说明主要内容包括了:1 结构体,2 共....
发表于 03-01 17:20 111次 阅读
C语言程序设计教程之结构体与共用体的详细资料说明

C语言教程之数据类型与运算符的详细资料说明

本文档的主要内容详细介绍的是C语言教程之数据类型与运算符的详细资料说明主要内容包括了:数据类型,常量....
发表于 03-01 17:20 114次 阅读
C语言教程之数据类型与运算符的详细资料说明

PHP基础知识的详细资料总结

本文档详细介绍的是PHP基础知识的详细资料总结主要内容包括了:1.PHP代码剖析,2.PHP的数据类....
发表于 03-01 15:35 62次 阅读
PHP基础知识的详细资料总结

C语言实用教程之数据类型运算符和表达式的详细资料说明

本文档详细介绍的是C语言实用教程之数据类型运算符和表达式的详细资料说明主要内容包括了:1 一个简单的....
发表于 02-26 14:45 73次 阅读
C语言实用教程之数据类型运算符和表达式的详细资料说明

Java程序设计教程之数据类型及其运算的详细资料说明

本文档的详细介绍的是Java程序设计教程之数据类型及其运算的详细资料说明主要内容包括了:1标识符和关....
发表于 02-22 10:27 91次 阅读
Java程序设计教程之数据类型及其运算的详细资料说明

PHP提示Undefined index的解决方法资料说明

首先,这个不是错误,是warning。所以如果服务器不能改,每个变量使用前应当先定义。
发表于 02-21 11:34 74次 阅读
PHP提示Undefined index的解决方法资料说明

PCA和KPCA傻傻分不清楚?戳进来教你如何区分

在格物汇之前的文章中,我们讨论了特征抽取的经典算法——主成分分析PCA与线性判别分析LDA的原理与应用场景。P
的头像 格创东智 发表于 01-28 13:02 649次 阅读
PCA和KPCA傻傻分不清楚?戳进来教你如何区分

C语言教程之C基础变量的技术总结

本文档的主要内容详细介绍的是C语言教程之C基础变量的技术总结。
发表于 01-22 16:18 143次 阅读
C语言教程之C基础变量的技术总结

基于判别核主元空间k近邻的批次过程监视

针对批次过程非线性、多模态等特征,提出一种基于判别核主元K近邻(Dis-kPCkNN)的故障检测方法....
发表于 01-22 15:54 132次 阅读
基于判别核主元空间k近邻的批次过程监视

JAVA教程之一维数组和二维数组的介绍和应用说明

声明一个数组就是要确定数组名、数组的维数和数组元素的数据类型。数组名是符合Java标识符定义规则的用....
发表于 01-16 11:02 148次 阅读
JAVA教程之一维数组和二维数组的介绍和应用说明

Python基础教程之Python快速入门课件资料免费下载

本文档的主要内容详细介绍的是Python基础教程之Python快速入门课件资料免费下载主要内容包括了....
发表于 01-15 17:17 178次 阅读
Python基础教程之Python快速入门课件资料免费下载

浅析特征抽取的经典算法PCA

之前格物汇的文章给大家介绍过,随着近几年大数据技术的普及,企业可以获取海量数据,但是这些海量数据带给我们更多信
的头像 格创东智 发表于 01-10 13:40 1132次 阅读
浅析特征抽取的经典算法PCA

用PCA还是LDA?特征抽取经典算法大PK

在之前的格物汇文章中,我们介绍了特征抽取的经典算法——主成分分析(PCA),了解了PCA算法实质上是进行了一次
的头像 格创东智 发表于 01-10 13:40 1273次 阅读
用PCA还是LDA?特征抽取经典算法大PK

python基础教程之变量如何命名变量命名规范的资料说明

python源码和其他一些书籍,命名各种个性,没有一个比较统一的命名规范。于是总结了一些,供参考。
发表于 01-04 17:51 129次 阅读
python基础教程之变量如何命名变量命名规范的资料说明

python基础教程之如何进行静态方法和类方法详细笔记说明

本文档的主要内容详细介绍的是python基础教程之如何进行静态方法和类方法详细笔记说明资料免费下载。
发表于 01-04 17:01 99次 阅读
python基础教程之如何进行静态方法和类方法详细笔记说明

如何使用多层非负局部Laplacian稀疏编码进行图像分类

针对单层稀疏编码结构对图像特征学习能力的局限性问题,提出了一个基于图像块稀疏表示的深层架构,即多层融....
发表于 01-02 15:17 132次 阅读
如何使用多层非负局部Laplacian稀疏编码进行图像分类

如何使用局部近邻标准化和动态主元分析进行故障检测分析策略

针对工业过程的动态和多模态特性,提出一种基于局部近邻标准化( LNS)和动态主元分析(DPCA)相结....
发表于 12-28 16:41 174次 阅读
如何使用局部近邻标准化和动态主元分析进行故障检测分析策略

如何使用改进偏最小二乘法进行多模态过程故障检测方法资料概述

针对传统的数据驱动方法偏最小二乘法( PLS)中存在的多模态数据故障检测效果不佳的问题,提出了一种新....
发表于 12-24 16:29 203次 阅读
如何使用改进偏最小二乘法进行多模态过程故障检测方法资料概述