资料介绍
针对传统的主动学习算法只能处理中小型数据集的问题,提出一种基于MapReduce的大数据主动学习算法。首先,在有类别标签的初始训练集上,用极限学习机( ELM)算法训练一个分类器,并将其输出用软最大化函数变换为一个后验概率分布。然后,将无类别标签的大数据集划分为Z个子集,并部署到Z个云计算节点上。在每一个节点,用训练出的分类器并行地计算各个子集中样例的信息熵,并选择信息熵大的前q个样例进行类别标注,将标注类别的Z×q个样例添加到有类别标签的训练集中。重复以上步骤直到满足预定义的停止条件。在Artificial、Skin、Statlog和Poker 4个数据集上与基于ELM的主动学习算法进行了比较,结果显示,所提算法在4个数据集上均能完成主动样例选择,而基于ELM的主动学习算法只在规模最小的数据集上能完成主动样例选择。实验结果表明,所提算法优于基于极限学习机的主动学习算法。

大数据具有以下几个特征:海量( Volume)、多模态(Variety)、变化速度快(Velocity)、蕴含价值高(Value)和可靠性高( Veracity)。在大数据环境下,传统的机器学习面临着巨大的挑战,其中也包括主动学习。主动学习算法大致可以分为两大类:基于池的主动学习算法和基于流的主动学习算法。
- 大数据环境下的移动学习发展趋势 21次下载
- 基于MapReduce的时间序列索引及数据查询 7次下载
- 车联网场景下汽车大数据应用模式综述 13次下载
- 一种改进的主动标记分布学习算法 7次下载
- 一种改进的主动标记分布学习算法 7次下载
- 一种面向MapReduce的中间数据传输流水线优化机制 4次下载
- 基于MapReduce和加权网络信息熵的DBWGIE-MR算法 11次下载
- SDR 主动学习模块
- 基于MapReduce/Spark的大规模压缩模糊K-近邻算法 5次下载
- 大数据时代有什么样的利与弊 11次下载
- 大数据环境下的移动学习发展是怎么样的 0次下载
- 水文大数据标准化方法和水文大数据共享平台关键技术的设计和资料概述 12次下载
- 如何使用Q学习算法进行X光主动视觉的安检方法资料说明概述 2次下载
- 面向并行迭代的MapReduce模型 1次下载
- 基于PRank算法的主动排序学习算法
- 学习大数据前必须知道的知识 3.1k次阅读
- 零基础可以学习大数据开发吗?学什么内容? 4k次阅读
- 大数据技术发展史简介 浅谈大数据挖掘与机器学习 7.9k次阅读
- 大数据技术如何进行融合发展 9.9k次阅读
- 视觉大数据领域的最好分析方法之一:深度学习 5.4k次阅读
- 大数据是什么_大数据技术和应用的现状与前景 2.5w次阅读
- java工程师有必要转做大数据吗大数据学习路线你了解吗 8k次阅读
- 大数据产业生态联盟的中国大数据产业发展白皮书 6.2k次阅读
- 大数据分析到底需要多少种工具_大数据分析总结 1.2w次阅读
- mapreduce二次排序_ mapreduce二次排序原理 6.6k次阅读
- mapreduce的应用开发步骤 5.1k次阅读
- 详解MapReduce的模式、算法和用例 7.5k次阅读
- mapreduce编程实例 1.7w次阅读
- 什么是mapreduce_mapreduce工作原理_mapreduce_mapreduce逻辑模型图 2.6w次阅读
- 机器学习究竟如何促进大数据管理的革命以及解决问题而采取的行动 3.6k次阅读
下载排行
本周
- 1PD取电芯片 ECP5702规格书
- 0.88 MB | 3次下载 | 免费
- 2氮化镓GaN FET/GaN HEMT 功率驱动电路选型表
- 0.10 MB | 2次下载 | 免费
- 3EMC PCB设计总结
- 0.33 MB | 2次下载 | 免费
- 41节电池用电池保护IC S-8261D系列数据手册
- 3.07 MB | 1次下载 | 1 积分
- 5PD取电芯片,可取5/9/12/15/20V电压ECP5702数据手册
- 0.88 MB | 1次下载 | 免费
- 6飞腾FT2000-4 COM Express核心板技术手册0603
- 1.22 MB | 1次下载 | 免费
- 7飞腾S5000C-64双路服务器系列应用宣传册--一乘科技
- 945.81 KB | 1次下载 | 免费
- 8IP2345支持PD3.0等多种快充协议 支持4~6节串联电池最大充电功率30W异步升降压充电IC
- 1.41 MB | 次下载 | 免费
本月
- 1美的电磁炉电路原理图资料
- 4.39 MB | 22次下载 | 10 积分
- 2反激式开关电源设计解析
- 0.89 MB | 16次下载 | 5 积分
- 3耗尽型MOS FET产品目录选型表
- 0.14 MB | 3次下载 | 免费
- 4PD取电芯片 ECP5702规格书
- 0.88 MB | 3次下载 | 免费
- 5氮化镓GaN FET/GaN HEMT 功率驱动电路选型表
- 0.10 MB | 2次下载 | 免费
- 6EMC PCB设计总结
- 0.33 MB | 2次下载 | 免费
- 7PC5200 700V_10A GaN HEMT驱动器数据手册
- 1.63 MB | 1次下载 | 免费
- 81节电池用电池保护IC S-8261D系列数据手册
- 3.07 MB | 1次下载 | 1 积分
总榜
- 1matlab软件下载入口
- 未知 | 935137次下载 | 10 积分
- 2开源硬件-PMP21529.1-4 开关降压/升压双向直流/直流转换器 PCB layout 设计
- 1.48MB | 420064次下载 | 10 积分
- 3Altium DXP2002下载入口
- 未知 | 233095次下载 | 10 积分
- 4电路仿真软件multisim 10.0免费下载
- 340992 | 191457次下载 | 10 积分
- 5十天学会AVR单片机与C语言视频教程 下载
- 158M | 183360次下载 | 10 积分
- 6labview8.5下载
- 未知 | 81605次下载 | 10 积分
- 7Keil工具MDK-Arm免费下载
- 0.02 MB | 73831次下载 | 10 积分
- 8LabVIEW 8.6下载
- 未知 | 65991次下载 | 10 积分
电子发烧友App





创作
发文章
发帖
提问
发资料
发视频
上传资料赚积分
评论