电子发烧友App

硬声App

0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示
电子发烧友网>电子资料下载>电子论文>网络协议论文>基于局部孤立系数的孤立点挖掘

基于局部孤立系数的孤立点挖掘

2009-08-11 | rar | 156 | 次下载 | 免费

资料介绍

提出了一种基于局部孤立系数(LOC)的孤立点挖掘算法。该算法是对基于局部稀疏系数(LSC)孤立点挖掘论文中局部稀疏率和局部稀疏系数计算的一种改进。实验表明,LOC 算法在发现孤立点方面比LSC 算法更高效。
孤立点检测在数据挖掘领域是一项重要的挖掘技术。孤立点检测的研究对象是数据集中
偏离绝大多数对象的很小一部分数据。在许多KDD 应用中,研究孤立点比研究聚类更有用、更重要。因为,在某些应用领域中研究孤立点的异常行为能发现隐藏在数据集中更有价值的知识。诸如,在欺诈探测中,孤立点可能预示着欺诈行为;在市场分析中,可用于确定极低或极高的收入的消费行为;在医疗分析中,用于发现对多种治疗方式的不寻常的反映;因此,孤立点检测是一个重要的数据挖掘任务,称为孤立点挖掘或异常挖掘。孤立点挖掘可以描述如下:给定一个n 个数据点或对象的集合,及预期的孤立点的数目k,发现与剩余的数据相比是显著相异的、异常的或不一致的头k 个对象[1]。
在数据挖掘中,孤立点检测算法大体上可分为以下几类:统计学方法,基于距离的方法,基于偏离的方法和基于密度的方法。
基于密度的方法能够挖掘出比基于距离异常算法所不能识别的一类异常数据—局部异
常。局部异常观点摈弃了以前所有的异常定义中非此即彼的绝对异常观念,这更加符合现实生活中的应用。近年来,一些研究人员提出局部孤立点探测[2,3,4,5],就是对每个对象赋予某个度,这个度决定了这个对象成为孤立点的程度。每个点的孤立程度只与它和周围点的距离有关,而与数据集中其他的点没有任何关系,这就体现了“局部”的特性。局部稀疏系数(LSC)就是其中一种,Malik Agyemang 提出的基于局部稀疏系数 (LSC)孤立点挖掘[4]算法的主要思想是对数据集中每个对象,计算出离它最近K 个对象的距离,并从中选出最大的距离作为该点的K-距离,对数据集中每个对象计算出与它的距离不大于该对象K-距离的邻近对象形成一个集合,然后计算每个对象与其对应集合的所有对象之间平均距离的反比,即局部稀疏率,最后计算集合内所有对象的局部稀疏率之和与该点的局部稀疏率比值的平均比率,即局部稀疏系数(LSC);根据每个对象的LSC 值从大到小的顺序排列整个数据集,并把前n 个对象作为孤立点。
在局部稀疏系数(LSC)算法中,需要计算数据集中每个对象的局部稀疏率和局部稀疏
系数,当数据集很大时,计算每个对象的局部稀疏率和局部稀疏系数耗费很大的计算量。本文提出了基于局部孤立系数(LOC)孤立点算法,它是对LSC 算法的改进,LOC 算法的主要思想是:对于数据集中每个点,计算出离它最近K 个对象的距离并选出其中最大距离作为该点的K-距离,并把最近K 个距离的和作为该点的局部距离之和;然后计算每个点的局部距离之和与它K-距离内每个对象的局部距离之和的总和平均值的比率(LOC)作为该点的孤立因子,按LOC 值从大到小的顺序选出前n 个作为孤立点。本文给出了LSC 算法和LOC 算法的实验结果,实验结果表明LOC 算法在发现孤立点方面比LSC 算法效率高。
下载该资料的人也在下载 下载该资料的人还在阅读
更多 >

评论

查看更多

下载排行

本周

  1. 1电子电路原理第七版PDF电子教材免费下载
  2. 0.00 MB  |  1490次下载  |  免费
  3. 2单片机典型实例介绍
  4. 18.19 MB  |  93次下载  |  1 积分
  5. 3S7-200PLC编程实例详细资料
  6. 1.17 MB  |  27次下载  |  1 积分
  7. 4笔记本电脑主板的元件识别和讲解说明
  8. 4.28 MB  |  18次下载  |  4 积分
  9. 5开关电源原理及各功能电路详解
  10. 0.38 MB  |  10次下载  |  免费
  11. 6基于AT89C2051/4051单片机编程器的实验
  12. 0.11 MB  |  4次下载  |  免费
  13. 7基于单片机和 SG3525的程控开关电源设计
  14. 0.23 MB  |  3次下载  |  免费
  15. 8基于单片机的红外风扇遥控
  16. 0.23 MB  |  3次下载  |  免费

本月

  1. 1OrCAD10.5下载OrCAD10.5中文版软件
  2. 0.00 MB  |  234313次下载  |  免费
  3. 2PADS 9.0 2009最新版 -下载
  4. 0.00 MB  |  66304次下载  |  免费
  5. 3protel99下载protel99软件下载(中文版)
  6. 0.00 MB  |  51209次下载  |  免费
  7. 4LabView 8.0 专业版下载 (3CD完整版)
  8. 0.00 MB  |  51043次下载  |  免费
  9. 5555集成电路应用800例(新编版)
  10. 0.00 MB  |  33562次下载  |  免费
  11. 6接口电路图大全
  12. 未知  |  30320次下载  |  免费
  13. 7Multisim 10下载Multisim 10 中文版
  14. 0.00 MB  |  28588次下载  |  免费
  15. 8开关电源设计实例指南
  16. 未知  |  21539次下载  |  免费

总榜

  1. 1matlab软件下载入口
  2. 未知  |  935053次下载  |  免费
  3. 2protel99se软件下载(可英文版转中文版)
  4. 78.1 MB  |  537791次下载  |  免费
  5. 3MATLAB 7.1 下载 (含软件介绍)
  6. 未知  |  420026次下载  |  免费
  7. 4OrCAD10.5下载OrCAD10.5中文版软件
  8. 0.00 MB  |  234313次下载  |  免费
  9. 5Altium DXP2002下载入口
  10. 未知  |  233046次下载  |  免费
  11. 6电路仿真软件multisim 10.0免费下载
  12. 340992  |  191183次下载  |  免费
  13. 7十天学会AVR单片机与C语言视频教程 下载
  14. 158M  |  183277次下载  |  免费
  15. 8proe5.0野火版下载(中文版免费下载)
  16. 未知  |  138039次下载  |  免费