0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大学课程 数据分析 实战之K-means算法(1)理论讲解

通信工程师专辑 来源:未知 2023-02-10 08:45 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

”物以类聚,人以群分“!这句话的核心思想就是聚类!聚类是典型的无监督学习方法。不同于分类,分类是有监督学习,样本都有标签,分类模型重点考查的是模型的泛化能力,而聚类是按要求给样本加标签,重点考查模型聚类的效果,通常无训练集与测试集的划分。什么是聚类?所谓数据聚类是指根据数据的内在性质将数据分成一些聚合类,每一聚合类中的元素尽可能具有相同的特性,不同聚合类之间的特性差别尽可能大。聚类分析的目的是分析数据是否属于各个独立的分组,使一组中的成员彼此相似,而与其他组中的成员不同。它对一个数据对象的集合进行分析,但与分类分析不同的是,所划分的类是未知的,因此,聚类分析也称为无指导或无监督(Unsupervised)学习。聚类分析的一般方法是将数据对象分组为多个类或簇(Cluster),在同一簇中的对象之间具有较高的相似度,而不同簇中的对象差异较大。由于聚类分析的上述特征,在许多应用中,对数据集进行了聚类分析后,可将一个簇中的各数据对象作为一个整体对待。数据聚类 (Cluster analysis) 是对于静态数据分析的一门技术,在许多领域受到广泛应用,包括机器学习,数据挖掘,模式识别,图像分析以及生物信息。在物联网时代,传感器的数据比牛毛还多。作为数据分析中的主要手段——聚类肯定派的上用场。那就在大学先打下坚实的基础吧!

e709775c-a8da-11ed-bfe3-dac502259ad0.gif

聚类有哪几种方法?

常用的聚类方法有:K-Means,AgglomerativeClustering,DBSCAN,MeanShift,SpectralClustering等。这里介绍其中的几个聚类分析算法

K-Means

K-均值聚类也称为快速聚类法,在最小化误差函数的基础上将数据划分为预定的类数K。该算法原理简单并便于处理大量数据。本系列文章将展示算法程序!

K-中心

K-均值算法对孤立点的敏感性,K-中心点算法不采用簇中对象的平均值作为簇中心,而选用簇中离平均值最近的对象作为簇中心。

系统聚类

也称为层次聚类,分类的单位由高到低呈树形结构,且所处的位置越低,其所包含的对象就越少,但这些对象间的共同特征越多。该聚类方法只适合在小数据量的时候使用,数据量大的时候速度会非常慢。

e709775c-a8da-11ed-bfe3-dac502259ad0.gif

K-means方法!

这是本文讲解的重点!先来看这种方法的原理和步骤!

1)从数据集中随机抽取k个样本作为初始聚类的中心,由这个中心代表各个聚类。

2)计算数据集中所有的样本到这k个中心点的距离(哪几种距离),并将样本点归到离其最近的聚类里。

3)将聚类的中心点移动到各类的几何中心(即平均值)处。

4)重复第2步直到聚类的中心不再移动,此时算法收敛或者迭代的次数达到上限。

推荐一本好书!在这方面讲的非常好!照片为证!

e724c0ca-a8da-11ed-bfe3-dac502259ad0.jpge746c2ce-a8da-11ed-bfe3-dac502259ad0.jpge75c563e-a8da-11ed-bfe3-dac502259ad0.jpg

仔细看看!

e709775c-a8da-11ed-bfe3-dac502259ad0.gif

距离!

e7917daa-a8da-11ed-bfe3-dac502259ad0.png

将样本点分到距离聚类中心最近的那个簇中需要最近邻的度量策略,在欧式空间中采用的是欧式距离,在处理文档中采用的是余弦相似度函数,有时候也采用曼哈顿距离作为度量,不同的情况使用的度量公式是不同的。

原文标题:大学课程 数据分析 实战之K-means算法(1)理论讲解

文章出处:【微信公众号:通信工程师专辑】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 通信网络
    +关注

    关注

    22

    文章

    2112

    浏览量

    54459

原文标题:大学课程 数据分析 实战之K-means算法(1)理论讲解

文章出处:【微信号:gh_30373fc74387,微信公众号:通信工程师专辑】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    算法工程师需要具备哪些技能?

    :自动化任务(如数据预处理、模型训练调度)。Git版本控制:团队协作开发(如分支管理、代码合并)。 机器学习监督学习:线性回归、逻辑回归、决策树、SVM等。无监督学习:聚类(K-Means)、降维
    发表于 02-27 10:53

    API数据分析:淘宝流量来源分析,渠道优化!

    优化渠道策略。我们将使用Python作为工具,结合数据分析和统计方法,确保过程真实可靠。 1. 理解淘宝流量来源 淘宝流量主要来自多个渠道,包括: 直接访问 :用户直接输入淘宝网址或从收藏夹访问。 搜索引擎 :如百度或淘宝内搜索,贡献
    的头像 发表于 01-23 13:42 378次阅读
    API<b class='flag-5'>数据分析</b>:淘宝流量来源<b class='flag-5'>分析</b>,渠道优化!

    使用K-means算法进行异常侦测

    本帖最后由 jf_77210199 于 2026-1-19 09:48 编辑 使用K-means算法进行异常侦测 本案例运行于 AT32F403A MCU 平台,利用 LSM6DS3TR-C
    发表于 01-16 14:09

    经营数据分析可以通过哪些方式

    在数聚股份看来,提起经营数据分析,大家往往会联想到一些密密麻麻的数字表格,或是高级的数据建模手法,再或是华丽的数据报表。其实,“ 分析 ”本身是每个人都具备的能力,对于业务决策者而言,
    的头像 发表于 12-05 16:31 731次阅读

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战课(11大系列课程,共5000+分钟)

    、运动控制、数据采集方面软件,具有丰富的非标自动化设备经验。精通LabVIEW、Halcon、深度学习算法部署,擅长将复杂技术转化为实战课程。授权16项labview视觉软件著作权;编
    发表于 12-04 09:28

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战课程(11大系列课程,共5000+分钟)

    、运动控制、数据采集方面软件,具有丰富的非标自动化设备经验。精通LabVIEW、Halcon、深度学习算法部署,擅长将复杂技术转化为实战课程。授权16项labview视觉软件著作权;编
    发表于 12-03 13:50

    学完这套EMC实战课程,规避90%设计问题

    SES当代工程师的EMC痛“每次产品送检都像在开盲盒”“为什么理论都懂,一实战就崩?”“我已经改了5版,EMC还是不过…”“团队曾经因一个时钟信号干扰问题,整整折腾了两个月,项目延期,客户投诉
    的头像 发表于 11-27 18:20 556次阅读
    学完这套EMC<b class='flag-5'>实战</b><b class='flag-5'>课程</b>,规避90%设计问题

    如何通过数据分析识别设备故障模式?

    通过数据分析识别设备故障模式,本质是从声振温等多维数据中提取故障特征,建立 “数据特征 - 故障类型” 的映射关系,核心可通过特征提取、模式匹配、趋势分析三步实现,精准定位故障根源与发
    的头像 发表于 08-19 11:14 1113次阅读
    如何通过<b class='flag-5'>数据分析</b>识别设备故障模式?

    构建自定义电商数据分析API

    按需分析结果,帮助团队快速响应市场变化。本文将逐步指导您如何从头构建这样一个API,确保它可靠、高效且可扩展。 1. 理解电商数据分析基础 电商数据通常包括销售记录、用户行为、产品信息
    的头像 发表于 07-17 14:44 726次阅读
    构建自定义电商<b class='flag-5'>数据分析</b>API

    AI数据分析仪设计原理图:RapidIO信号接入 平板AI数据分析

    AI数据分析仪, 平板数据分析仪, 数据分析仪, AI边缘计算, 高带宽数据输入
    的头像 发表于 07-17 09:20 865次阅读
    AI<b class='flag-5'>数据分析</b>仪设计原理图:RapidIO信号接入 平板AI<b class='flag-5'>数据分析</b>仪

    如何使用协议分析仪进行数据分析与可视化

    错误率>1%触发邮件告警)。 安全与合规: 捕获敏感数据时启用加密存储(如.pcapng加密)。 遵守GDPR等法规,匿名化处理用户IP等PII信息。 六、总结协议分析仪的数据分析
    发表于 07-16 14:16

    张飞FOC磁场定向控制有感、无感电机驱动视频课程及STM32开发套件(共257集)

    )转子预定位+强拖运行 25)强拖切滑模无感思路分析及代码实现 26)速度环+电流环双闭环运行 乘风踏浪FOC课程硬件配置 课程配套使用电机驱动板 1)驱动板特性介绍: 2)
    发表于 07-02 15:59

    普源示波器如何连接MATLAB实现数据采集与分析

    、高级算法应用等。本文将详细讲解普源示波器与MATLAB的连接方法、配置步骤、高级功能及实战案例,帮助用户快速搭建高效的数据采集与分析系统。
    的头像 发表于 05-29 09:34 1388次阅读

    学电路设计分享学习心得、技术疑问及实战成果

    活动介绍:随着物联网、智能硬件等领域的快速发展,硬件开发与电路设计技能成为电子工程师和创客的核心竞争力。为帮助刚入行的电子小白、高校大学生高效掌握从基础理论实战应用的能力,电子发烧友平台推出学习
    的头像 发表于 05-20 08:07 730次阅读
    学电路设计分享学习心得、技术疑问及<b class='flag-5'>实战</b>成果

    活动名单公布!学电路设计分享学习心得、技术疑问及实战成果,赢取专属礼品!

    激励学员分享学习心得、提出技术问题、展示实战成果,打造活跃的技术交流社区,并为学员提供与讲师直接互动的机会。 本课程主要从怎样设计一个完整的项目入手,跟大家讲解了元器件的类别,熟悉元器件的封装,功率如何计算
    发表于 05-14 09:53