首页: 电子电路图,电子技术资料网站首页

电子资料下载: 电子资料下载频道 -- 为电子工程师提供激发创新灵感的新方案、新的参考设计、新的设计构想等可下载的电子资料！

电子技术应用: 电子技术应用频道 -- 为电子工程师提供电子产品设计所需的技术分析、设计技巧、设计工具、测试工具等技术文章！

电子元器件: 专业的电子元器件平台 -- 及时发布大量最新IC、分立器件、模组等电子元器件产品信息！

电子电路图: 电路图频道 -- 提供电子电路图,原理图,汽车电路图,手机电路图,功放电路图,电源电路图等电路图纸

电子技术论坛: 构建电子工程师交流的平台 -- 在交流中进一步学习设计技巧、规划技术人生、提升自我价值！

源码下载: 源码下载频道; uCOS编程 C/C++语言编程 Symbian编程 Linux/uClinux/Unix编程 Windows编程 matlab源程序 php源码下载 asp.net源码下载 java源码下载汇编编程驱动程序单片机编程数值算法/人工智能

您的位置：电子发烧友网>源码下载>数值算法/人工智能>

R语言机器学习算法的性能分析比较

大小：0.6 MB 人气： 2017-10-12 需要积分：1

推荐 + 挑错 + 收藏(0) + 用户评论（0）

前往下载地址

分享到:

标签：机器学习(129859)

你如何有效地计算出不同机器学习算法的估计准确性？在这篇文章中，你将会学到8种技术，用来比较R语言机器学习算法。你可以使用这些技术来选择最精准的模型，并能够给出统计意义方面的评价，以及相比其它算法的绝对优势。
　　选择最好的机器学习模型
　　你如何根据需求选择最好的模型？
　　在你进行机器学习项目的时候，往往会有许多良好模型可供选择。每个模型都有不同的性能特点。
　　使用重采样方法，如交叉验证，就可以得到每个模型在未知数据上精准度的估计。你需要利用这些估计从你创建的一系列模型中选择一到两个最好的模型。
　　仔细比较机器学习模型
　　当你有了新数据集，使用多种不同的图形技术可视化数据是个好主意，你可以从不同角度来观察数据。
　　这种想法也可以用于模型选择。你应该使用不同的方法来进行估计机器学习算法的准确率，依此来选择一到两个模型。
　　你可以使用不同的可视化方法来显示平均准确率、方差和模型精度分布的其他性质。
　　比较并选择R语言的机器学习模型
　　在本节中，你将会学到如何客观地比较R语言机器学习模型。
　　通过本节中的案例研究，你将为皮马印第安人糖尿病数据集创建一些机器学习模型。然后你将会使用一系列不同的可视化技术来比较这些模型的估计准确率。
　　本案例研究分为三个部分：
　　准备数据集：加载库文件和数据集，准备训练模型。训练模型：在数据集上训练标准机器学习模型，准备进行评估。比较模型：使用8种不同的技术比较训练得到的模型。
　　准备数据集
　　本研究案例中使用的数据集是皮马印第安人糖尿病数据集，可在UCI机器学习库中获取。也可在R中的mlbench包中获取。
　　这是一个二元分类问题，预测患者在五年之内糖尿病是否会发作。入参是数值型，描述了女性患者的医疗信息。
　　现在来加载库文件和数据集。
　　# load librarieslibrary（mlbench） library（caret） # load the datasetdata（PimaIndiansDiabetes）
　　训练模型
　　在本节中，我们将会训练在下一节中将要比较的5个机器学习模型。
　　我们将使用重复交叉验证，folds为10，repeats为3，这是比较模型的常用标准配置。评估指标是精度和kappa，因为它们很容易解释。
　　根据算法的代表性和学习风格方式进行半随机选择。它们有：
　　分类和回归树线性判别分析使用径向基函数的支持向量机K-近邻随机森林
　　训练完模型之后，将它们添加到一个list中，然后调用resamples（）函数。此函数可以检查模型是可比较的，并且模型都使用同样的训练方案（训练控制配置）。这个对象包含每个待评估算法每次折叠和重复的评估指标。

非常好我支持^.^

(0) 0%

不好我反对

(0) 0%

下载地址

不能下载？请通知我们

R语言机器学习算法的性能分析比较下载

普通下载普通下载

用户评论

发表评论即可获得积分！ 详见积分规则

发表评论

用户评论

评价:好评中评差评

发表评论，获取积分！请遵守相关规定！

注册会员

游客:

R语言机器学习算法的性能分析比较

下载地址

R语言机器学习算法的性能分析比较下载

相关电子资料下载

用户评论

发表评论

分享你我的电子世界

实用电子设计资料下载

源码下载排行

热门词