0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

PCA和KPCA傻傻分不清楚?戳进来教你如何区分

格创东智 2019-01-28 13:02 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在格物汇之前的文章中,我们讨论了特征抽取的经典算法——主成分分析PCA与线性判别分析LDA的原理与应用场景。PCA是一种无监督的降维方法,寻找的是让数据方差最大的一种映射;LDA是一种有监督的降维方法,寻找的是让数据分类效果最好的一种映射。但是它们仍然有应用的局限性,今天我们就一起来了解下。


PCA的局限性

我们先来回顾一下PCA的降维原理:PCA试图通过旋转找到新的正交基,满足这样的两条性质:

1、最近重构性:样本点到新映射的正交基距离足够接近。

2、最大可分性:样本点在新正交基上方差最大。

最后我们推导得到:

1.jpg

我们只需要对协方差矩阵XX^T 进行特征值分解,得到的特征值和特征向量即是变换矩阵w的解和改主成分所解释的方差量。这样的降维方法是线性的降维方法,即从高维空间到低维空间的函数映射是线性的。然而在不少应用场景中,线性映射可能不能得到想要的结果,例如如下的例子:S型曲线的本真二维结构是其低维空间的原本形状,通过线性降维后得到的结果明显并不是我们所期望的。

2.jpg

核方法

我们介绍SVM的时候所介绍的核方法是一种可以进行升维来生成一些非线性的映射。这个方法我们可以同样使用在PCA降维分析中。

假设我们有一个样本集:

x1,x2xn

假设映射函数为,那么映射到高维以后,数据变成:

3.jpg

类似于PCA的求解方法, XX^T经过高维映射后得到

补.jpg

故:

4.jpg

我们把λ 移动到等号左边得到:

5.jpg

我们令:

6.jpg

做一个简单的替换,得到:

7.jpg

代入等式1,得到:

8.jpg

我们在左右两边同时乘上

bu2.jpg

得到:

9.jpg

做一下简单的改变:

10.jpg

非常幸运的是,我们设计出了

bu3.jpg

是否还记得我们在SVM的核函数中曾经验证过,在低维空间计算(+1)^2得到的结果与高维空间上计算

11.jpg

的结果相似,只是系数略有不同。因此我们也可以在此应用核方法来计算。我们在此定义核函数矩阵:

12.jpg

代入上面等式2,便可得到:

13.jpg


14.jpg

很明显,这又回到了特征值分解的问题,取K最大的d个特征值所对应的特征向量即可。

小结

我们通过将数据映射到高维以后,巧妙的构建出了

bu3.jpg

目的是为了通过在低维空间上应用核函数,计算得到跟高维空间上差不多的效果。PCA所做的是对坐标轴线性变换,即变换后的新基还是一条直线。而KPCA对坐标轴做了非线性变换,数据所映射的新基就不再是一条直线了,而是一条曲线或者曲面,如下图所示:

15.jpg

通过上面这个图,大家应该了解了KPCA和PCA区别了吧?好了,本期格物汇的内容就到这里,我们下期再见。

本文作者:格创东智OT团队(转载请注明作者及来源)



声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • PCA
    PCA
    +关注

    关注

    0

    文章

    91

    浏览量

    30800
  • KPCA
    +关注

    关注

    0

    文章

    9

    浏览量

    9318
  • LDA
    LDA
    +关注

    关注

    0

    文章

    30

    浏览量

    10955
  • 智能制造
    +关注

    关注

    48

    文章

    6139

    浏览量

    79471
  • 工业互联网
    +关注

    关注

    28

    文章

    4383

    浏览量

    95994
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    边缘计算和人工智能,别再傻傻分不清啦!

    这几年,只要聊到“智能制造”“智慧城市”“自动化工厂”, 边缘计算 和**人工智能(AI)**这两个词就总是成双成对地出现。 但你是不是也有点懵:到底谁在算?谁在“聪明”?它们又是什么关系? 别急,今天我们就用最通俗的方式,把这事讲明白 一、什么是“边缘计算”?——让数据不必跑那么远 传统做法是:设备采集的数据,全都上传到“云端”去处理。比如,一台产线设备温度异常,要传到服务器分析,再等结果回来。 但现实中,几秒的延
    的头像 发表于 11-19 15:46 135次阅读

    GPIO、PWM、ADC,到底怎么区分

    在嵌入式开发中,我们经常听到GPIO、PWM、ADC这些术语。初学者常常搞不清楚它们的区别和用途:“它们不是都是和电平有关吗?为什么还要分这么多种?”今天,我们就把这些基础概念讲清楚,让你在动手开发
    的头像 发表于 11-14 10:28 231次阅读
    GPIO、PWM、ADC,到底怎么<b class='flag-5'>区分</b>?

    UV三防漆vs普通三防漆:5大关键区别,教你精准避坑!

    别再傻傻分不清!选对三防漆,产品寿命翻倍不是梦。
    的头像 发表于 10-25 17:45 207次阅读
    UV三防漆vs普通三防漆:5大关键区别,<b class='flag-5'>教你</b>精准避坑!

    晶振 VS 晶体:别再傻傻分不清

    很多电子爱好者第一次接触电路时,经常会混淆“晶振”和“晶体”。其实,两者有相似之处,但用途和结构并不完全一样。 一、什么是晶体? 晶体(Crystal)是一块经过切割加工的石英晶体,它本身不会“自振”,需要放大器和电容等外部电路才能振荡。它就像一块“调音叉”,只提供频率参考。常见的就是32.768kHz晶体,在MCU的RTC模块中非常普遍。 二、什么是晶振? 晶振(Oscillator)则是一个完整的振荡器模块,里面已经把晶体和驱动电路集成好,能
    的头像 发表于 09-11 14:42 509次阅读
    晶振 VS 晶体:别再<b class='flag-5'>傻傻</b><b class='flag-5'>分不清</b>

    家里220V,工厂380V,电还分不同&quot;花色&quot;?揭秘三相四线与五线的关键选择

    火线、零线、地线傻傻分不清?电工师傅教你如何根据用电选对电能表
    的头像 发表于 09-10 10:48 617次阅读
    家里220V,工厂380V,电还分不同&quot;花色&quot;?揭秘三相四线与五线的关键选择

    导热 vs. 散热:别再傻傻分不清楚

    1一字之差,本质大不同在材料科学与热管理领域,“导热”与“散热”是紧密关联却又截然不同的两个概念,很多人常常将二者混淆,在实际应用中,准确理解它们的差异至关重要,这关系到电子产品、工业设备等能否稳定高效运行。下面,我们就来深入剖析一下导热与散热的区别。No.1导热导热是一个在介质内部进行热量传递的过程,就像是一场微观粒子间的“接力赛”。在这个过程中,热量借助
    的头像 发表于 09-07 09:21 1052次阅读
    导热 vs. 散热:别再<b class='flag-5'>傻傻</b><b class='flag-5'>分不清楚</b>!

    MDDTVS参数选型不清楚的常见问题解析

    TVS在不同应用条件下的综合特性,导致实际防护效果与预期差距较大,甚至引发器件失效或系统不稳定。下面是TVS选型不清楚的典型问题。一、对工作电压与击穿电压的理解不足
    的头像 发表于 08-20 10:16 534次阅读
    MDDTVS参数选型<b class='flag-5'>不清楚</b>的常见问题解析

    PCA9958HN-ARD】GUI工具的使用

    到LPC55S69开发板中。 我使用的是Flash Magic烧录的,烧录过程在这里就不在赘述了。 现在准备工作就全部完成了,接下来就可以链接开发板进行控制了。 三、GUI工具初体验 1、连接开发板 有些设置不清楚
    发表于 06-29 10:07

    WiFi和WLAN傻傻分不清楚?#WIFI #WLAN #网络 #科普

    WIFI
    安泰仪器维修
    发布于 :2025年05月28日 17:43:46

    秒懂CCC与CQC,别傻傻分不清

    通俗易懂说CCC与CQC
    的头像 发表于 05-06 10:23 7114次阅读
    秒懂CCC与CQC,别<b class='flag-5'>傻傻</b><b class='flag-5'>分不清</b>啦

    别再傻傻分不清!USB和TYPE-C的全面解析

    别再傻傻分不清!USB和TYPE-C的全面解析
    的头像 发表于 04-26 15:51 1.1w次阅读

    什么是有功功率/无功功率,电能表是如何计量的?

    什么是有功功率、无功功率,傻傻分不清
    的头像 发表于 04-11 08:25 5419次阅读
    什么是有功功率/无功功率,电能表是如何计量的?

    为什么聊自动驾驶的越来越多,聊无人驾驶的越来越少?

    “无人驾驶”与“自动驾驶”,傻傻分不清楚?就在之前的一篇文章中,引用了王传福的一句话,其说的是无人驾驶是“扯淡”( 相关阅读: 无人驾驶是“扯淡”?是皇帝的新装?),随后也有小伙伴问,无人驾驶
    的头像 发表于 02-23 10:52 1007次阅读
    为什么聊自动驾驶的越来越多,聊无人驾驶的越来越少?

    最大才1.45V,现在不清楚为啥那么大的电压?

    AD驱动器一个共模电压,按照ADC08D1020的datasheet第43页描述的,经过一个lmv321,到AD驱动器,现在我让ADC08D1020上电,给PD管脚一个低电平,然后测试AD的Vcmo输出电平,是1.83V,但是按照手册上说的是最大才1.45V,现在不清楚为啥那么大的电压?期待您的回复
    发表于 01-21 08:38