0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浅谈机器学习技术中的随机森林算法

454398 来源:itpub技术栈 作者:sandag 2020-09-29 15:34 次阅读

本次主题是随机森林,杰里米(讲师)提供了一些基本信息以及使用Jupyter Notebook的提示和技巧。

Jeremy谈到的一些重要的事情是,数据科学并不等同于软件工程。 在数据科学中,我们做的是设计模型。 虽然软件工程有自己的一套实践,但数据科学也有自己的一套最佳实践。

模型构建和原型设计需要一个交互的环境,是一个迭代的过程。 我们建立一个模型。 然后,我们采取措施来改善它。 重复直到我们对结果满意为止。

随机森林

我听说过“随机森林”这个词,我知道它是现有的机器学习技术之一,但是老实说,我从来没有想过要去了解它。 我一直热衷于更多地了解深度学习技术。

从这次演讲中,我了解到随机森林确实很棒。

它就像一个通用的机器学习技术,既可以用于回归,也可以用于分类。 这意味着你可以使用随机森林来预测股票价格以及对给定的医疗数据样本进行分类。

一般来说,随机森林模型不会过拟合,即使它会,它也很容易阻止过拟合。

对于随机森林模型,不需要单独的验证集。

随机森林只有一些统计假设。 它也不假设你的数据是正态分布的,也不假设这些关系是线性的。

它只需要很少的特征工程。

因此,如果你是机器学习的新手,它可以是一个很好的起点。

其他概念

维数诅咒是一个概念,意思是你拥有的数据特征越多,数据点就会越分散。 这意味着两点之间的距离没有意义。

Jeremy确信,在实践中,情况并非如此,事实上,你的数据拥有的特征越多,对模型的训练效果就越好。

没有免费午餐定理是这样一个概念:没有一个模型可以完美地适用于任何类型的数据。

技巧和窍门

你可以在Jupyter Notebook中使用!来执行bash命令,例如。

!ls

!mkdir new_dr

Python 3.6中追加字符串的新方法。

name = ‘Sabina’

print(f‘Hello {name}’)no_of_new_msg = 11

print(f‘Hello {name}, you have {no_of_new_msg} new messages’)

不需要离开Jupyter notebook就可以查看python函数。在函数名前使用?获取它的文档。

from sklearn.ensemble import RandomForestClassifier?RandomForestClassifier.fit()

如果你想阅读源代码,可以使用??在函数名称前。

from sklearn.ensemble import RandomForestClassifier??RandomForestClassifier.fit()

通过使用to_feather方法保存处理过的数据集,将数据集以存储在RAM中的相同格式保存到磁盘。可以使用read_feather方法从保存的文件中读取数据。注意,为了使用这些方法,你需要安feather-format库。

import pandasdf = pd.DataFrame()

df.to_feather(‘filename’)saved_df= pd.read_feather(‘filename’)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8134

    浏览量

    130580
  • 深度学习
    +关注

    关注

    73

    文章

    5239

    浏览量

    119927
  • 随机森林
    +关注

    关注

    1

    文章

    22

    浏览量

    4234
收藏 人收藏

    评论

    相关推荐

    基于Python实现随机森林算法

    机器学习算法是数据挖掘、数据能力分析和数学建模必不可少的一部分,而随机森林算法和决策树
    的头像 发表于 09-21 11:17 663次阅读
    基于Python实现<b class='flag-5'>随机</b><b class='flag-5'>森林</b><b class='flag-5'>算法</b>

    机器学习有哪些算法机器学习分类算法有哪些?机器学习预判有哪些算法

    机器学习有哪些算法机器学习分类算法有哪些?机器
    的头像 发表于 08-17 16:30 1410次阅读

    机器学习vsm算法

    机器学习vsm算法 随着机器学习技术的不断发展,相似性计算是
    的头像 发表于 08-17 16:29 580次阅读

    机器学习算法入门 机器学习算法介绍 机器学习算法对比

    ,讨论一些主要的机器学习算法,以及比较它们之间的优缺点,以便于您选择适合的算法。 一、机器学习
    的头像 发表于 08-17 16:27 632次阅读

    机器学习算法总结 机器学习算法是什么 机器学习算法优缺点

    机器学习算法总结 机器学习算法是什么?机器
    的头像 发表于 08-17 16:11 1096次阅读

    机器学习算法汇总 机器学习算法分类 机器学习算法模型

    机器学习算法汇总 机器学习算法分类 机器
    的头像 发表于 08-17 16:11 730次阅读

    机器学习算法的5种基本算子

    机器学习算法的5种基本算子 机器学习是一种重要的人工智能技术,它是为了让计算机能够通过数据自主的
    的头像 发表于 08-17 16:11 1343次阅读

    机器学习和深度学习的区别

    机器学习和深度学习的区别 随着人工智能技术的不断发展,机器学习和深度
    的头像 发表于 08-17 16:11 3399次阅读

    人工智能课程学什么

    其次,在机器学习方面,你需要学习机器学习相关的算法和数据结构,
    的头像 发表于 08-13 14:25 638次阅读

    智能数字辨识水表-基于机器学习算法

    智智能数字辨识水表-基于机器学习算法
    的头像 发表于 08-10 11:26 403次阅读
    智能数字辨识水表-基于<b class='flag-5'>机器</b><b class='flag-5'>学习</b><b class='flag-5'>算法</b>

    基于机器学习算法的校准优化方案

    基于机器学习算法的校准优化方案
    发表于 06-29 12:35 257次阅读
    基于<b class='flag-5'>机器</b><b class='flag-5'>学习</b><b class='flag-5'>算法</b>的校准优化方案

    使用机器学习森林动物计数器

    电子发烧友网站提供《使用机器学习森林动物计数器.zip》资料免费下载
    发表于 06-12 14:46 0次下载
    使用<b class='flag-5'>机器</b><b class='flag-5'>学习</b>的<b class='flag-5'>森林</b>动物计数器

    机器学习理论:k近邻算法

    KNN(k-Nearest Neighbors)思想简单,应用的数学知识几乎为0,所以作为机器学习的入门非常实用、可以解释机器学习算法使用过
    的头像 发表于 06-06 11:15 435次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>理论:k近邻<b class='flag-5'>算法</b>

    机器学习的经典算法与应用

      一、机器学习基础概念   关于数据   机器学习就是喂入算法和数据,让算法从数据中寻找一种相
    的头像 发表于 05-28 11:29 751次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>的经典<b class='flag-5'>算法</b>与应用

    随机森林算法及其实现

    其实从直观角度来解释,每棵决策树都是一个分类器(假设现在针对的是分类问题),那么对于一个输入样本,N棵树会有N个分类结果。而随机森林集成了所有的分类投票结果,将投票次数最多的类别指定为最终的输出,这就是一种最简单的 Bagging 思想。
    的头像 发表于 05-15 09:46 1585次阅读
    <b class='flag-5'>随机</b><b class='flag-5'>森林</b><b class='flag-5'>算法</b>及其实现