0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

常见的几种聚类算法

倩倩 来源:淮安海之声旗舰店 2020-04-15 15:23 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

目前,聚类算法被广泛应用于用户画像、广告推荐、新闻推送和图像分割等等。聚类算法是机器学习中一种“数据探索”的分析方法,它帮助我们在大量的数据中探索和发现数据的结构。那么机器学习中的聚类算法有哪几种呢?下面我将为大家一一介绍常见的几种聚类算法,分别是高斯聚类模型、基于密度的聚类算法、凝聚层次聚类和均值漂移算法。

1、高斯聚类模型

事实上,GMM 和 k-means 很像,不过 GMM 是学习出一些概率密度函数来,简单地说,k-means 的结果是每个数据点被 assign 到其中某一个 cluster 了,而 GMM 则给出这些数据点被 assign 到每个 cluster 的概率,又称作 soft assignment 。

2、基于密度的聚类算法

基于密度的聚类算法最大的优点在于无需定义类的数量,其次可以识别出局外点和噪声点、并且可以对任意形状的数据进行聚类。DBSCAN同样是基于密度的聚类算法,但其原理却与均值漂移大不相同:首先从没有被遍历的任一点开始,利用邻域距离epsilon来获取周围点;如果邻域内点的数量满足阈值则此点成为核心点并以此开始新一类的聚类;其邻域内的所有点也属于同一类,将所有的邻域内点以epsilon为半径进行步骤二的计算;重复步骤二、三直到变量完所有核心点的邻域点;此类聚类完成,同时又以任意未遍历点开始步骤一到四直到所有数据点都被处理;最终每个数据点都有自己的归属类别或者属于噪声。

3、K均值聚类

这一最著名的聚类算法主要基于数据点之间的均值和与聚类中心的聚类迭代而成。它主要的优点是十分的高效,由于只需要计算数据点与剧类中心的距离,其计算复杂度只有O(n)。其工作原理主要分为以下四步:首先我们需要预先给定聚类的数目同时随机初始化聚类中心。我们可以初略的观察数据并给出较为准确的聚类数目;每一个数据点通过计算与聚类中心的距离了来分类到最邻近的一类中;根据分类结果,利用分类后的数据点重新计算聚类中心;重复步骤二三直到聚类中心不再变化。

4、凝聚层次聚类

层次聚类法主要有自顶向下和自底向上两种方式。其中自底向上的方式,最初将每个点看作是独立的类别,随后通过一步步的凝聚最后形成独立的一大类,并包含所有的数据点。这会形成一个树形结构,并在这一过程中形成聚类。

5、均值漂移算法

这是一种基于滑动窗口的均值算法,用于寻找数据点中密度最大的区域。其目标是找出每一个类的中心点,并通过计算滑窗内点的均值更新滑窗的中心点。最终消除临近重复值的影响并形成中心点,找到其对应的类别。其工作原理主要是以下几点:首先以随机选取的点为圆心r为半径做一个圆形的滑窗。其目标是找出数据点中密度最高点并作为中心;在每个迭代后滑动窗口的中心将为想着较高密度的方向移动;连续移动,直到任何方向的移动都不能增加滑窗中点的数量,此时滑窗收敛;将上述步骤在多个滑窗上进行以覆盖所有的点。当过个滑窗收敛重叠时,其经过的点将会通过其滑窗聚类为一个类。

以上就是机器学习中常见的五种聚类算法,大家都了解了吗?如果还想深入学习聚类算法的相关内容,比如原理、算法效果的衡量标准以及基于Kmeans算法进行改进的优化方法,可以上博学谷官网进行有关课程的在线学习。希望大家通过课程可以学会使用聚类算法进行数据分析,挖掘商业价值。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4816

    浏览量

    98806
  • 聚类
    +关注

    关注

    0

    文章

    146

    浏览量

    14819
  • 机器学习
    +关注

    关注

    67

    文章

    8570

    浏览量

    137423
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    变频器的控制电路及几种常见故障

    变频器的控制电路本质上是变频器的“大脑”和“神经系统”,负责接收指令、处理数据并驱动主电路工作。其常见的故障也大多与这些核心环节相关。 控制电路的构成与核心功能 变频器的控制电路主要由以下几个部分
    的头像 发表于 05-07 15:33 161次阅读

    MLCC常见问题--快速应对

    MLCC常见分类,温度常常被问到啥是一、二陶瓷?这个温度多少?以下最常用MLCC代码参考~一(非铁电氧化钛体系)一MLCC相对比较少
    的头像 发表于 03-24 16:27 249次阅读
    MLCC<b class='flag-5'>常见</b>问题--快速应对

    算法工程师需要具备哪些技能?

    :自动化任务(如数据预处理、模型训练调度)。Git版本控制:团队协作开发(如分支管理、代码合并)。 机器学习监督学习:线性回归、逻辑回归、决策树、SVM等。无监督学习:(K-Means)、降维
    发表于 02-27 10:53

    C语言增量式PID的通用算法

    式PID算法,可以直接使用,不用更改什么东西,顶多改一下初始化时候的几个参数限制范围。 该算法的思想是设计一个PID控制器,使用的时候直接实例化一个PID对象即可,也可以实例化多个,每个都是独立
    发表于 01-14 08:28

    LED显示屏常见故障分类及处理方法

    常见故障分类LED显示屏常见故障分为三:LED模组常见故障、室内全彩显示屏故障及户外全彩显示屏故障。针对每一故障,我们将详细分析可能的原
    的头像 发表于 12-18 15:48 1948次阅读
    LED显示屏<b class='flag-5'>常见</b>故障分类及处理方法

    看懂C语言程序中的内和耦合

    一、原理篇 在软件工程中,模块的内和耦合是度量模块化质量的标准之一。内是指模块的功能强度的度量,即一个模块内部各个元素彼此结合的紧密程度的度量。若一个模块内各元素(语名之间、程序段之间)联系
    发表于 12-08 06:37

    用于单片机几种C语言算法

    为克服随机干扰引起的误差,硬件上可采用滤波技术,软件上可采用软件算法实现数字滤波。滤波算法往往是系统测控算法的一个重要组成部分,实时性很强。 采用数字滤波算法克服随机干扰的误差具有以下
    发表于 11-27 06:00

    C语言的常见算法

    # C语言常见算法 C语言中常用的算法可以分为以下几大类: ## 1. 排序算法 ### 冒泡排序 (Bubble Sort) ```c void bubbleSort(int
    发表于 11-24 08:29

    使用Otsu阈值算法将灰度图像二值化

    还是纯白,即利用此阈值将原图像分成前景、背景两个图象。不同阈值对于前景和背景图象的划分不同,一般来说,前景和背景图象的差别越大,表明划分的效果越好。在 Otsu 算法中,以间方差来衡量背景和前景图象
    发表于 10-28 06:49

    国密系列算法简介及SM4算法原理介绍

    算法可用于无线局域网产品;SM7算法可用于身份识别、票务、支付与通卡业务。ZUC算法可用于移动通信网络。 密码杂凑算法:SM3
    发表于 10-24 08:25

    加密算法的应用

    加密算法和非对称加密算法。 对称加密是一种加密方式,也称为共享密钥加密。加密和解密使用同一个密钥。这种加密算法的优点是加密和解密速度快,适用于数据量较大的场景。但是,密钥的传输和管
    发表于 10-24 08:03

    有哪些常见的AI算法可以用于装置数据的异常检测?

    (如边缘 / 云端)。以下按 算法类型分类 ,详细介绍常见 AI 算法的原理、适用场景、优缺点及装置数据适配性: 一、无监督式异常检测算法(主流选择) 装置数据多为 无标注数据 (仅记
    的头像 发表于 09-18 09:27 1215次阅读
    有哪些<b class='flag-5'>常见</b>的AI<b class='flag-5'>算法</b>可以用于装置数据的异常检测?

    正确的连接电机传动轴的几种常见连接方式及其优缺点

    在工业机械和自动化设备中,电机与传动轴的连接方式直接影响设备的运行效率、稳定性和使用寿命。选择合适的连接方式需要综合考虑负载特性、安装精度、维护便利性以及成本等因素。以下是几种常见的电机传动轴连接
    的头像 发表于 09-10 07:41 4200次阅读

    【HarmonyOS 5】鸿蒙中常见的标题栏布局方案

    【HarmonyOS 5】鸿蒙中常见的标题栏布局方案 ##鸿蒙开发能力 ##HarmonyOS SDK应用服务##鸿蒙金融应用 (金融理财# 一、问题背景: 鸿蒙中常见的标题栏:矩形区域,左边
    的头像 发表于 07-11 18:30 1050次阅读
    【HarmonyOS 5】鸿蒙中<b class='flag-5'>常见</b>的标题栏布局方案

    飞光电总部大厦正式启用

    飞光电大厦位于平湖金融与现代服务业基地核心商圈,占地面积4,186平方米,总建筑面积40,519平方米,楼高99米,是面向未来的企业总部,集综合办公、总部运营、技术研发、商业配套等功能于一身
    的头像 发表于 06-06 15:26 1292次阅读