基于MapReduce数据流相似性搜索并行算法
大小:0.92 MB 人气: 2017-12-07 需要积分:2
设计时间序列数据在Hadoop分布式文件系统(HDFS)中的有效存储方式,利用分布式缓存工具Distributed Cache将各子序列分发到Hadoop集群的计算节点上,将动态时间弯曲距离矩阵划分成多个子矩阵,采取并行迭代计算每条反对角线上子矩阵的方法,基于MapReduce编程模型,实现高效并行计算时间序列动态弯曲距离,通过改进剪裁冗余计算方法,设计实现一种数据流多模式相似性搜索并行算法。中国雪深长时间序列数据集的实验结果表明,当每条时间序列的长度达到5000以上时,并行计算动态弯曲距离所需时间少于串行计算所需时间,当每条时间序列的长度达到9000以上时,参与计算的集群节点越多,并行计算所需时间越少;当模式长度达到4000、参与计算的集群节点数达5个以上时,从数据流中并行搜索出与模式匹配的相似子序列所需时间约为串行搜索所需时间的20%。
非常好我支持^.^
(0) 0%
不好我反对
(0) 0%
下载地址
基于MapReduce数据流相似性搜索并行算法下载
相关电子资料下载
- wifi7什么时候出来 wifi7手机有哪些 580
- wifi7是什么意思 wifi7什么时候上市 429
- Spectrum仪器数字化仪可以10GS/s采样速度传输无限数据流 72
- 华为星闪技术原理 星闪技术怎么使用 14960
- 如何解决内存溢出 195
- 系统架构图中功能模块数据流与状况 156
- 自动驾驶系统信号描述 127
- 鲲云科技携可重构数据流技术出席全球AI芯片峰会 313
- PCIe相关问题解答 288
- 控制流和数据流的区别 735