大文本数据集的间接谱聚类
大小:0.59 MB 人气: 2018-02-24 需要积分:1
标签:数据集(24113)
针对谱聚类存在计算瓶颈的问题,提出了一种快速的集成算法,称为间接谱聚类。它首先运用K-Means算法对数据集进行过分聚类,然后把每个过分簇看成一个基本对象,最后在过分簇的级别上利用标准谱聚类来完成总体的聚类。将该思想应用于大文本数据集的聚类问题后,过分簇中心之间的相似性度度量方法可以采用常用的余弦距离法。在20-Newgroups大本数据上的实验结果表明:间接谱聚类算法在聚类准确性上比K-Means算法平均高出14. 72%;比规范割谱聚类仅低0.88%,但算法所需的计算时间平均不到规范割谱聚类的1/16,且随着数据集的增大当规范割谱聚类遭遇计算瓶颈时,提出的算法却能快速地给出次优解。
非常好我支持^.^
(0) 0%
不好我反对
(0) 0%
下载地址
大文本数据集的间接谱聚类下载
相关电子资料下载
- 中国手机厂商发力这一领域 外媒:大戏刚刚开始 262
- 干掉激光雷达,极越锚定纯视觉智驾路线 428
- 虹科干货 | Redis Enterprise 自动分层技术:大数据集高性能解决方案 70
- Redis Enterprise自动分层技术:大数据集高性能解决方案 79
- 港中文贾佳亚团队联手MIT发布超长文本扩展技术,打破LLM遗忘魔咒 97
- CPU后端和CUDA后端的执行代码和效果 153
- 2023年人工智能状态报告 535
- 一款整合了ChatGPT的源IP扫描工具 69
- Python中进行特征重要性分析的9个常用方法 91
- Direct Inversion:三行代码提升基于扩散的图像编辑效果 198