0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

常见的几种聚类算法

倩倩 来源:淮安海之声旗舰店 2020-04-15 15:23 次阅读

目前,聚类算法被广泛应用于用户画像、广告推荐、新闻推送和图像分割等等。聚类算法是机器学习中一种“数据探索”的分析方法,它帮助我们在大量的数据中探索和发现数据的结构。那么机器学习中的聚类算法有哪几种呢?下面我将为大家一一介绍常见的几种聚类算法,分别是高斯聚类模型、基于密度的聚类算法、凝聚层次聚类和均值漂移算法。

1、高斯聚类模型

事实上,GMM 和 k-means 很像,不过 GMM 是学习出一些概率密度函数来,简单地说,k-means 的结果是每个数据点被 assign 到其中某一个 cluster 了,而 GMM 则给出这些数据点被 assign 到每个 cluster 的概率,又称作 soft assignment 。

2、基于密度的聚类算法

基于密度的聚类算法最大的优点在于无需定义类的数量,其次可以识别出局外点和噪声点、并且可以对任意形状的数据进行聚类。DBSCAN同样是基于密度的聚类算法,但其原理却与均值漂移大不相同:首先从没有被遍历的任一点开始,利用邻域距离epsilon来获取周围点;如果邻域内点的数量满足阈值则此点成为核心点并以此开始新一类的聚类;其邻域内的所有点也属于同一类,将所有的邻域内点以epsilon为半径进行步骤二的计算;重复步骤二、三直到变量完所有核心点的邻域点;此类聚类完成,同时又以任意未遍历点开始步骤一到四直到所有数据点都被处理;最终每个数据点都有自己的归属类别或者属于噪声。

3、K均值聚类

这一最著名的聚类算法主要基于数据点之间的均值和与聚类中心的聚类迭代而成。它主要的优点是十分的高效,由于只需要计算数据点与剧类中心的距离,其计算复杂度只有O(n)。其工作原理主要分为以下四步:首先我们需要预先给定聚类的数目同时随机初始化聚类中心。我们可以初略的观察数据并给出较为准确的聚类数目;每一个数据点通过计算与聚类中心的距离了来分类到最邻近的一类中;根据分类结果,利用分类后的数据点重新计算聚类中心;重复步骤二三直到聚类中心不再变化。

4、凝聚层次聚类

层次聚类法主要有自顶向下和自底向上两种方式。其中自底向上的方式,最初将每个点看作是独立的类别,随后通过一步步的凝聚最后形成独立的一大类,并包含所有的数据点。这会形成一个树形结构,并在这一过程中形成聚类。

5、均值漂移算法

这是一种基于滑动窗口的均值算法,用于寻找数据点中密度最大的区域。其目标是找出每一个类的中心点,并通过计算滑窗内点的均值更新滑窗的中心点。最终消除临近重复值的影响并形成中心点,找到其对应的类别。其工作原理主要是以下几点:首先以随机选取的点为圆心r为半径做一个圆形的滑窗。其目标是找出数据点中密度最高点并作为中心;在每个迭代后滑动窗口的中心将为想着较高密度的方向移动;连续移动,直到任何方向的移动都不能增加滑窗中点的数量,此时滑窗收敛;将上述步骤在多个滑窗上进行以覆盖所有的点。当过个滑窗收敛重叠时,其经过的点将会通过其滑窗聚类为一个类。

以上就是机器学习中常见的五种聚类算法,大家都了解了吗?如果还想深入学习聚类算法的相关内容,比如原理、算法效果的衡量标准以及基于Kmeans算法进行改进的优化方法,可以上博学谷官网进行有关课程的在线学习。希望大家通过课程可以学会使用聚类算法进行数据分析,挖掘商业价值。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4458

    浏览量

    90764
  • 聚类
    +关注

    关注

    0

    文章

    146

    浏览量

    14168
  • 机器学习
    +关注

    关注

    66

    文章

    8134

    浏览量

    130580
收藏 人收藏

    评论

    相关推荐

    基于FPGA的常见的图像算法模块总结

    意在给大家补充一下基于FPGA的图像算法基础,于是讲解了一下常见的图像算法模块,经过个人的总结,将知识点分布如下所示。
    的头像 发表于 04-28 11:45 119次阅读
    基于FPGA的<b class='flag-5'>常见</b>的图像<b class='flag-5'>算法</b>模块总结

    光耦失效的几种常见问题解析

    光耦失效的几种常见问题解析  光耦失效是一个常见的问题,特别是在电子设备中经常使用光耦进行隔离和信号传输的情况下。下面将详细介绍一些光耦失效的常见问题以及解析。 1. 输出信号弱或无输
    的头像 发表于 12-25 14:30 1839次阅读

    光耦失效的几种常见原因及分析

    光耦失效的几种常见原因及分析  光耦是一种光电耦合器件,由发光二极管和光探测器组成。它能够将电流信号转换为光信号,或者将光信号转换为电流信号。但是,由于各种原因,光耦可能会出现失效的情况。本文
    的头像 发表于 11-20 15:13 1868次阅读

    MCU批量生产下载程序的几种常见方法

    MCU批量生产下载程序的几种常见方法
    的头像 发表于 10-24 17:22 1012次阅读
    MCU批量生产下载程序的<b class='flag-5'>几种</b><b class='flag-5'>常见</b>方法

    常见几种硬盘的简单介绍

    常见几种硬盘的简单介绍 硬盘是服务器托管用户主机主要的数据存储介质。目前硬盘的种类有三,不同的选择方案也会有不同的优劣对比。下面讲讲他们之间有什么不同吧    固态硬盘:  用固态电子存储芯片阵列
    发表于 10-18 16:56

    理解STM32控制中常见的PID算法

    理解STM32控制中常见的PID算法
    的头像 发表于 10-17 17:28 1719次阅读
    理解STM32控制中<b class='flag-5'>常见</b>的PID<b class='flag-5'>算法</b>

    市场上几种常见的测量长度的工业仪器

    在现代工业领域中,长度尺寸测量至关重要。无论是制造业、建筑业还是科学研究,准确测量长度都是保证质量和安全的基础。为满足多样化的测量需求,如今市场上测量长度的工业仪器有许多种类型,本文介绍几种常见
    发表于 10-11 14:34

    磁栅尺有几种常见故障?

    磁栅尺有几种常见故障?磁栅尺是一种高精度的测量工具,主要用于数控车床、数控机床等设备中。但是,在使用中,磁栅尺也会出现一些常见的故障。下面我们就介绍几种
    的头像 发表于 09-26 14:44 1747次阅读
    磁栅尺有<b class='flag-5'>几种</b><b class='flag-5'>常见</b>故障?

    常见几种负载均衡技术介绍

    在大力建设算力网络的大背景下,随着SDN思潮的深入推进、网络集群的部署,负载均衡成为了一种不可或缺的技术,它在云,网,边都起了至关重要的作用。本文会对常见几种负载均衡技术进行介绍,同时对各种技术的不足之处进行思考。
    的头像 发表于 09-25 10:30 670次阅读
    <b class='flag-5'>常见</b>的<b class='flag-5'>几种</b>负载均衡技术介绍

    几种常见嵌入式设备通信协议

    几种常见嵌入式设备通信协议
    的头像 发表于 09-18 16:43 1110次阅读
    <b class='flag-5'>几种</b><b class='flag-5'>常见</b>嵌入式设备通信协议

    介绍几种常见的保护器件类型

    保护器件用于保护电路和设备免受电力故障或其他损坏。以下是几种常见的保护器件类型及其说明:
    的头像 发表于 07-26 09:41 1352次阅读

    智驾系统感知层面最常见几种传感器

    感知算法精准地复现出周围环境,再由决策算法基于对周围环境的认知来进行车辆的路径规划。今天我们就来说说智驾系统感知层面最常见几种传感器,它们有什么区别?又如何实现互补? 摄像头 摄像头
    的头像 发表于 07-13 16:22 792次阅读

    分享常见水晶头有几种型号

    水晶头是连接网线和各类设备的重要介质,其实水晶头还会细分几种型号,大家可以选择适合的型号,下面科兰通讯为大家分享常见水晶头有几种型号,帮助大家正确选择。 常见水晶头有
    的头像 发表于 06-28 11:33 1793次阅读
    分享<b class='flag-5'>常见</b>水晶头有<b class='flag-5'>几种</b>型号

    智驾系统感知层面常见几种传感器

    感知算法精准地复现出周围环境,再由决策算法基于对周围环境的认知来进行车辆的路径规划。 今天我们就来说说智驾系统感知层面最常见几种传感器,它们有什么区别?又如何实现互补?     摄像
    的头像 发表于 06-25 17:25 630次阅读

    常见排序算法分类

    本文将通过动态演示+代码的形式系统地总结十大经典排序算法。 排序算法 算法分类 —— 十种常见排序算法可以分为两大类: 比较类排序:通过比较
    的头像 发表于 06-22 14:49 634次阅读
    <b class='flag-5'>常见</b>排序<b class='flag-5'>算法</b>分类