0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大学课程 数据分析 实战之K-means算法(1)理论讲解

通信工程师专辑 来源:未知 2023-02-10 08:45 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

”物以类聚,人以群分“!这句话的核心思想就是聚类!聚类是典型的无监督学习方法。不同于分类,分类是有监督学习,样本都有标签,分类模型重点考查的是模型的泛化能力,而聚类是按要求给样本加标签,重点考查模型聚类的效果,通常无训练集与测试集的划分。什么是聚类?所谓数据聚类是指根据数据的内在性质将数据分成一些聚合类,每一聚合类中的元素尽可能具有相同的特性,不同聚合类之间的特性差别尽可能大。聚类分析的目的是分析数据是否属于各个独立的分组,使一组中的成员彼此相似,而与其他组中的成员不同。它对一个数据对象的集合进行分析,但与分类分析不同的是,所划分的类是未知的,因此,聚类分析也称为无指导或无监督(Unsupervised)学习。聚类分析的一般方法是将数据对象分组为多个类或簇(Cluster),在同一簇中的对象之间具有较高的相似度,而不同簇中的对象差异较大。由于聚类分析的上述特征,在许多应用中,对数据集进行了聚类分析后,可将一个簇中的各数据对象作为一个整体对待。数据聚类 (Cluster analysis) 是对于静态数据分析的一门技术,在许多领域受到广泛应用,包括机器学习,数据挖掘,模式识别,图像分析以及生物信息。在物联网时代,传感器的数据比牛毛还多。作为数据分析中的主要手段——聚类肯定派的上用场。那就在大学先打下坚实的基础吧!

e709775c-a8da-11ed-bfe3-dac502259ad0.gif

聚类有哪几种方法?

常用的聚类方法有:K-Means,AgglomerativeClustering,DBSCAN,MeanShift,SpectralClustering等。这里介绍其中的几个聚类分析算法

K-Means

K-均值聚类也称为快速聚类法,在最小化误差函数的基础上将数据划分为预定的类数K。该算法原理简单并便于处理大量数据。本系列文章将展示算法程序!

K-中心

K-均值算法对孤立点的敏感性,K-中心点算法不采用簇中对象的平均值作为簇中心,而选用簇中离平均值最近的对象作为簇中心。

系统聚类

也称为层次聚类,分类的单位由高到低呈树形结构,且所处的位置越低,其所包含的对象就越少,但这些对象间的共同特征越多。该聚类方法只适合在小数据量的时候使用,数据量大的时候速度会非常慢。

e709775c-a8da-11ed-bfe3-dac502259ad0.gif

K-means方法!

这是本文讲解的重点!先来看这种方法的原理和步骤!

1)从数据集中随机抽取k个样本作为初始聚类的中心,由这个中心代表各个聚类。

2)计算数据集中所有的样本到这k个中心点的距离(哪几种距离),并将样本点归到离其最近的聚类里。

3)将聚类的中心点移动到各类的几何中心(即平均值)处。

4)重复第2步直到聚类的中心不再移动,此时算法收敛或者迭代的次数达到上限。

推荐一本好书!在这方面讲的非常好!照片为证!

e724c0ca-a8da-11ed-bfe3-dac502259ad0.jpge746c2ce-a8da-11ed-bfe3-dac502259ad0.jpge75c563e-a8da-11ed-bfe3-dac502259ad0.jpg

仔细看看!

e709775c-a8da-11ed-bfe3-dac502259ad0.gif

距离!

e7917daa-a8da-11ed-bfe3-dac502259ad0.png

将样本点分到距离聚类中心最近的那个簇中需要最近邻的度量策略,在欧式空间中采用的是欧式距离,在处理文档中采用的是余弦相似度函数,有时候也采用曼哈顿距离作为度量,不同的情况使用的度量公式是不同的。

原文标题:大学课程 数据分析 实战之K-means算法(1)理论讲解

文章出处:【微信公众号:通信工程师专辑】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 通信网络
    +关注

    关注

    22

    文章

    2098

    浏览量

    53984

原文标题:大学课程 数据分析 实战之K-means算法(1)理论讲解

文章出处:【微信号:gh_30373fc74387,微信公众号:通信工程师专辑】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    经营数据分析可以通过哪些方式

    在数聚股份看来,提起经营数据分析,大家往往会联想到一些密密麻麻的数字表格,或是高级的数据建模手法,再或是华丽的数据报表。其实,“ 分析 ”本身是每个人都具备的能力,对于业务决策者而言,
    的头像 发表于 12-05 16:31 350次阅读

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战课(11大系列课程,共5000+分钟)

    、运动控制、数据采集方面软件,具有丰富的非标自动化设备经验。精通LabVIEW、Halcon、深度学习算法部署,擅长将复杂技术转化为实战课程。授权16项labview视觉软件著作权;编
    发表于 12-04 09:28

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战可(11大系列课程,共5000+分钟)

    讲师,使用LabVIEW开发了大量视觉检测、运动控制、数据采集方面软件,具有丰富的非标自动化设备经验。精通LabVIEW、Halcon、深度学习算法部署,擅长将复杂技术转化为实战课程
    发表于 12-03 13:50

    学完这套EMC实战课程,规避90%设计问题

    SES当代工程师的EMC痛“每次产品送检都像在开盲盒”“为什么理论都懂,一实战就崩?”“我已经改了5版,EMC还是不过…”“团队曾经因一个时钟信号干扰问题,整整折腾了两个月,项目延期,客户投诉
    的头像 发表于 11-27 18:20 116次阅读
    学完这套EMC<b class='flag-5'>实战</b><b class='flag-5'>课程</b>,规避90%设计问题

    构建自定义电商数据分析API

    按需分析结果,帮助团队快速响应市场变化。本文将逐步指导您如何从头构建这样一个API,确保它可靠、高效且可扩展。 1. 理解电商数据分析基础 电商数据通常包括销售记录、用户行为、产品信息
    的头像 发表于 07-17 14:44 398次阅读
    构建自定义电商<b class='flag-5'>数据分析</b>API

    AI数据分析仪设计原理图:RapidIO信号接入 平板AI数据分析

    AI数据分析仪, 平板数据分析仪, 数据分析仪, AI边缘计算, 高带宽数据输入
    的头像 发表于 07-17 09:20 496次阅读
    AI<b class='flag-5'>数据分析</b>仪设计原理图:RapidIO信号接入 平板AI<b class='flag-5'>数据分析</b>仪

    张飞FOC磁场定向控制有感、无感电机驱动视频课程及STM32开发套件(共257集)

    )转子预定位+强拖运行 25)强拖切滑模无感思路分析及代码实现 26)速度环+电流环双闭环运行 乘风踏浪FOC课程硬件配置 课程配套使用电机驱动板 1)驱动板特性介绍: 2)
    发表于 07-02 15:59

    普源示波器如何连接MATLAB实现数据采集与分析

    、高级算法应用等。本文将详细讲解普源示波器与MATLAB的连接方法、配置步骤、高级功能及实战案例,帮助用户快速搭建高效的数据采集与分析系统。
    的头像 发表于 05-29 09:34 702次阅读

    学电路设计分享学习心得、技术疑问及实战成果

    活动介绍:随着物联网、智能硬件等领域的快速发展,硬件开发与电路设计技能成为电子工程师和创客的核心竞争力。为帮助刚入行的电子小白、高校大学生高效掌握从基础理论实战应用的能力,电子发烧友平台推出学习
    的头像 发表于 05-20 08:07 433次阅读
    学电路设计分享学习心得、技术疑问及<b class='flag-5'>实战</b>成果

    《手把手教你做星闪无人机—KaihongOS星闪无人机开发实战》系列课程课件汇总

    开发实战》全套课程分三个章节(共18课时),以一架真实的星闪四轴飞行器为例,重点讲解基于KaihongOS的星闪无线通信技术应用开发全流程,带领大家一步步做出一台可以稳定飞行的KaihongOS四轴飞行器。
    发表于 03-18 10:33

    EMC设计实战秘籍 I 第十期正式开启!

    第十期EMC实战特训营课程以“理论结合实践”为主线,系统讲解了EMC设计的关键技术与应用方法,助力工程师突破电磁干扰难题,提升产品竞争力。✦✧为何选择这门
    的头像 发表于 02-13 11:06 954次阅读
    EMC设计<b class='flag-5'>实战</b>秘籍  I  第十期正式开启!

    智能焊接数据分析设备提升工业效率与精度

    随着科技的不断进步,智能制造已经成为推动工业4.0发展的关键力量。在众多的智能制造技术中,智能焊接数据分析设备因其在提高生产效率和焊接质量方面的显著效果而受到广泛关注。本文将探讨智能焊接数据分析设备
    的头像 发表于 01-15 14:11 664次阅读

    提升开关电源效率的理论分析实战经验

    在这里有电源技术干货、电源行业发展趋势分析、最新电源产品介绍、众多电源达人与您分享电源技术经验,关注我们,与中国电源行业共成长! 提升开关电源效率的理论分析实战经验 引言 开关电源设
    的头像 发表于 01-09 10:04 1797次阅读
    提升开关电源效率的<b class='flag-5'>理论</b><b class='flag-5'>分析</b>与<b class='flag-5'>实战</b>经验

    Mathematica 在数据分析中的应用

    ,在数据分析领域发挥着重要作用。 1. 数据导入 在进行数据分析之前,首先需要将数据导入到Mathematica中。Mathematica支
    的头像 发表于 12-26 15:41 1077次阅读

    绝缘电阻测试仪数据分析与处理

    绝缘电阻测试仪主要用于检查电气设备或电气线路对地及相间的绝缘电阻。将所测得的结果与有关数据比较,这是对实验结果进行分析判断的重要方法。以下是对绝缘电阻测试仪的数据分析与处理方法的介绍: 一、
    的头像 发表于 12-10 15:00 1512次阅读