资料介绍
聚类分析是将研究对象分为相对同质的群组的统计分析技术,聚类分析的核心就是发现有用的对象簇。K-means聚类算法由于具有出色的速度和良好的可扩展性,一直备受广大学者的关注。然而,传统的K-means算法,未考虑各个属性对于最终聚类结果的影响差异性,这使得聚类的精度有一定的影响。针对上述问题,本文提出一种改进的特征加权算法。改进算法通过采用信息熵和ReliefF特征选择算法对特征进行加权选择,修正聚类对象间的距离函数,使算法达到更准确更高效的聚类效果。仿真实验结果表明,与传统的K-means算法相比,改进后的算法聚类结果稳定,聚类的精度有明显提升。
数据挖掘是目前人工智能和数据库领域研究的热点问题,指从大量的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。聚类分析现在已经成为数据挖掘领域中一个非常重要的研究方向。MacQueen 提出的K-means 算法是聚类分析中最常用的方法之一。它采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。K-means 算法假设样本的每个特征对最终聚类的贡献程度一样,但在实际情况中某些特征在聚类的过程中起到很大的作用,而某些特征的作用却很小,甚至对聚类过程没有影响。
针对传统K-means 算法的这一问题,学者们进行了大量研究,研究表明:通过对特征赋予不同的特征权值,能够有效解决上述问题并提高聚类性能。目前,计算特征权重的算法有很多种:等人提出一种结合限制数据的特征权值量化函数,该函数通过用户指定的限制数据进行特征权值量化并对不同的限制数据赋予不同的置信度,解决了限制数据分布不均匀和限制数据中可能包含不一致性的问题;LiJie 等人提出将针对分类问题的ReliefF 算法应用于聚类问题,通过ReliefF 算法计算特征权重值,并对各维特征进行加权,提高聚类的性能;Meng Qian 等人提出通过梯度下降技术最小化特征评估函数FLearning (w)为每个特征分配权重并进行加权,该算法采用遗传算法和模拟退火算法的优点,减弱冗余特征的影响,解决了容易陷入局部最优解的问题。Songtao Shang 等人提出一种改进的基尼指数算法计算特征权重,该算法克服了原始Gini 的缺点,将条件概率与后验概率结合,抑制训练集不平衡时的影响。利用信息论中的信息熵计算特征权重并对各位特征加权,有效的解决了特征对聚类的影响。
综上所述,为了提高传统K-means 算法的聚类精度,国内外学者对K-means 算法进行了大量改进探索研究,并取得了一些阶段性的成果。本文拟研究传统K-means 算法在聚类过程中聚类对象的每个特征对聚类结果的贡献度,使贡献程度大的特征优先利用,理论上讲可以有效提升K-means 算法聚类的准确率和精度。因此,本文提出将熵值法和ReliefF 特征选择算法有机融合,通过采用信息熵和ReliefF 特征选择算法对特征进行加权选择,修正聚类对象间的距离函数,使算法达到更准确更高效的聚类效果。实验结果表明,改进后的算法聚类结果稳定,且具有较高的准确率,达到预期目的。
- 基于特征和实例迁移的加权多任务聚类算法 3次下载
- 基于北京加权的多特征融合目标跟踪算法 4次下载
- 集成簇内和簇间距离的加权k-means聚类方法 1次下载
- 一种改进互信息的加权朴素贝叶斯算法 12次下载
- 机器学习教程之机器学习10大经典算法的详细资料讲解 24次下载
- 如何使用多维网格空间进行改进K-means聚类算法资料概述 1次下载
- PID程序算法的详细资料概述免费下载 36次下载
- 如何采用DSP兼容的第三方算法来进行视频成像技术的详细资料概述 4次下载
- TI的基于DSP兼容的第三方算法协议的详细资料概述 8次下载
- 基于改进k-means算法的MANET异常检测方法 0次下载
- K_means算法的改进及应用_王刚勇 0次下载
- 基于改进K_means聚类的欠定盲分离算法_柴文标 0次下载
- K-means+聚类算法研究综述 27次下载
- 改进的k-means聚类算法在供电企业CRM中的应用 15次下载
- 一种增强的K-means聚类算法在入侵检测中的应用 14次下载
- 基于K-means聚类算法的图像分割 458次阅读
- 基于距离的聚类算法K-means的设计实现 1773次阅读
- 库卡机器人模拟量输入输出编程的详细资料概述 6123次阅读
- 如何设计CEV模型与质量甜点算法详细资料概述 3060次阅读
- 基本的k-means算法流程 1.8w次阅读
- 开关电源的正激变换器基本工作原理及元器件如何选择等详细资料概述 1.1w次阅读
- PLC常用基本环节梯形图和详细文字说明详细资料概述 7777次阅读
- K-Means算法的简单介绍 4522次阅读
- 变压器保护的基本要求,保护配置和运行规定的详细资料概述 7151次阅读
- Python无监督学习的几种聚类算法包括K-Means聚类,分层聚类等详细概述 2.9w次阅读
- 基于数字特征的识别算法设计实现 1w次阅读
- K-means算法原理理论+opencv实现 5863次阅读
- K-means的优缺点及改进 3.1w次阅读
- k-means算法原理解析 8105次阅读
- 关联规则挖掘——Apriori算法的基本原理以及改进 9119次阅读
下载排行
本周
- 1TC358743XBG评估板参考手册
- 1.36 MB | 330次下载 | 免费
- 2开关电源基础知识
- 5.73 MB | 11次下载 | 免费
- 3嵌入式linux-聊天程序设计
- 0.60 MB | 3次下载 | 免费
- 4DIY动手组装LED电子显示屏
- 0.98 MB | 3次下载 | 免费
- 5基于FPGA的C8051F单片机开发板设计
- 0.70 MB | 2次下载 | 免费
- 651单片机窗帘控制器仿真程序
- 1.93 MB | 2次下载 | 免费
- 751单片机大棚环境控制器仿真程序
- 1.10 MB | 2次下载 | 免费
- 8基于51单片机的RGB调色灯程序仿真
- 0.86 MB | 2次下载 | 免费
本月
- 1OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234315次下载 | 免费
- 2555集成电路应用800例(新编版)
- 0.00 MB | 33566次下载 | 免费
- 3接口电路图大全
- 未知 | 30323次下载 | 免费
- 4开关电源设计实例指南
- 未知 | 21549次下载 | 免费
- 5电气工程师手册免费下载(新编第二版pdf电子书)
- 0.00 MB | 15349次下载 | 免费
- 6数字电路基础pdf(下载)
- 未知 | 13750次下载 | 免费
- 7电子制作实例集锦 下载
- 未知 | 8113次下载 | 免费
- 8《LED驱动电路设计》 温德尔著
- 0.00 MB | 6656次下载 | 免费
总榜
- 1matlab软件下载入口
- 未知 | 935054次下载 | 免费
- 2protel99se软件下载(可英文版转中文版)
- 78.1 MB | 537798次下载 | 免费
- 3MATLAB 7.1 下载 (含软件介绍)
- 未知 | 420027次下载 | 免费
- 4OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234315次下载 | 免费
- 5Altium DXP2002下载入口
- 未知 | 233046次下载 | 免费
- 6电路仿真软件multisim 10.0免费下载
- 340992 | 191186次下载 | 免费
- 7十天学会AVR单片机与C语言视频教程 下载
- 158M | 183279次下载 | 免费
- 8proe5.0野火版下载(中文版免费下载)
- 未知 | 138040次下载 | 免费
评论
查看更多