0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一文解析机器学习常用35大算法

Hx 作者:工程师陈翠 2018-06-30 04:24 次阅读

本文将带你遍历机器学习领域最受欢迎的算法系统地了解这些算法有助于进一步掌握机器学习当然,本文收录的算法并不完全,分类的方式也不唯一不过,看完这篇文章后,下次再有算法提起,你想不起它长处和用处的可能性就很低了本文还附有两张算法思维导图供学习使用

在本文中,我将提供两种分类机器学习算法的方法一是根据学习方式分类,二是根据类似的形式或功能分类这两种方法都很有用,不过,本文将侧重后者,也就是根据类似的形式或功能分类在阅读完本文以后,你将会对监督学习中最受欢迎的机器学习算法,以及它们彼此之间的关系有一个比较深刻的了解

事先说明一点,我没有涵盖机器学习特殊子领域的算法,比如计算智能(进化算法等)、计算机视觉(CV)、自然语言处理(NLP)、推荐系统、强化学习和图模型

下面是一张算法思维导图,点击放大查看

一文解析机器学习常用35大算法

从学习方式分类

算法对一个问题建模的方式很多,可以基于经历、环境,或者任何我们称之为输入数据的东西机器学习和人工智能的教科书通常会让你首先考虑算法能够采用什么方式学习实际上,算法能够采取的学习方式或者说学习模型只有几种,下面我会一一说明对机器学习算法进行分类是很有必要的事情,因为这迫使你思考输入数据的作用以及模型准备过程,从而选择一个最适用于你手头问题的算法

监督学习

输入数据被称为训练数据,并且每一个都带有标签,比如“广告/非广告”,或者当时的股票价格通过训练过程建模,模型需要做出预测,如果预测出错会被修正直到模型输出准确的结果,训练过程会一直持续常用于解决的问题有分类和回归常用的算法包括逻辑回归和BP神经网络

无监督学习

输入数据没有标签,输出没有标准答案,就是一系列的样本无监督学习通过推断输入数据中的结构建模这可能是提取一般规律,可以是通过数学处理系统地减少冗余,或者根据相似性组织数据常用于解决的问题有聚类、降维和关联规则的学习常用的算法包括 Apriori 算法和 K 均值算法

半监督学习

半监督学习的输入数据包含带标签和不带标签的样本半监督学习的情形是,有一个预期中的预测,但模型必须通过学习结构整理数据从而做出预测常用于解决的问题是分类和回归常用的算法是所有对无标签数据建模进行预测的算法(即无监督学习)的延伸

从功能角度分类

研究人员常常通过功能相似对算法进行分类例如,基于树的方法和基于神经网络的方法这种方法也是我个人认为最有用的分类方法不过,这种方法也并非完美,比如学习矢量量化(LVQ),就既可以被归为神经网络方法,也可以被归为基于实例的方法此外,像回归和聚类,就既可以形容算法,也可以指代问题

为了避免重复,本文将只在最适合的地方列举一次下面的算法和分类都不齐备,但有助于你了解整个领域大概(说明:用于分类和回归的算法带有很大的个人主观倾向;欢迎补充我遗漏的条目)

回归算法

回归分析是研究自变量和因变量之间关系的一种预测模型技术这些技术应用于预测时间序列模型和找到变量之间关系回归分析也是一种常用的统计学方法,经由统计机器学习融入机器学习领域“回归”既可以指算法也可以指问题,因此在指代的时候容易混淆实际上,回归就是一个过程而已常用的回归算法包括:

普通最小二乘回归(OLSR)

线性回归

逻辑回归

逐步回归

多元自适应回归样条法(MARS

局部估计平滑散点图(LOESS)

基于实例的学习算法

基于实例的学习通过训练数据的样本或事例建模,这些样本或事例也被视为建模所必需的这类模型通常会建一个样本数据库,比较新的数据和数据库里的数据,通过这种方式找到最佳匹配并做出预测换句话说,这类算法在做预测时,一般会使用相似度准则,比对待预测的样本和原始样本之间的相似度,再做出预测因此,基于实例的方法也被称之为赢家通吃的方法(winner-take-all)和基于记忆的学习(memory-based learning)常用的基于实例的学习算法包括:

k-邻近算法(kNN)

学习矢量量化算法(LVQ)

自组织映射算法(SOM)

局部加权学习算法(LWL)

正则化算法

正则化算法背后的思路是,参数值比较小的时候模型更加简单对模型的复杂度会有一个惩罚值,偏好简单的、更容易泛化的模型,正则化算法可以说是这种方法的延伸我把正则化算法单独列出来,原因就是我听说它们十分受欢迎、功能强大,而且能够对其他方法进行简单的修饰常用的正则化算法包括:

岭回归

LASSO 算法

Elastic Net

最小角回归算法(LARS)

决策树算法

决策树算法的目标是根据数据属性的实际值,创建一个预测样本目标值的模型训练时,树状的结构会不断分叉,直到作出最终的决策也就是说,预测阶段模型会选择路径进行决策决策树常被用于分类和回归决策树一般速度快,结果准,因此也属于最受欢迎的机器学习算法之一常用的决策树算法包括:

分类和回归树(CART)

ID3 算法

C4.5 算法和 C5.0 算法(它们是一种算法的两种不同版本)

CHAID 算法

单层决策树

M5 算法

条件决策树

贝叶斯算法

贝叶斯方法指的是那些明确使用贝叶斯定理解决分类或回归等问题的算法常用的贝叶斯算法包括:

朴素贝叶斯算法

高斯朴素贝叶斯算法

多项式朴素贝叶斯算法

AODE 算法

贝叶斯信念网络(BBN)

贝叶斯网络(BN)

聚类算法

聚类跟回归一样,既可以用来形容一类问题,也可以指代一组方法聚类方法通常涉及质心(centroid-based)或层次(hierarchal)等建模方式,所有的方法都与数据固有的结构有关,目标是将数据按照它们之间共性最大的组织方式分成几组换句话说,算法将输入样本聚成围绕一些中心的数据团,通过这样的方式发现数据分布结构中的规律常用的聚类算法包括:

K-均值

K-中位数

EM 算法

分层聚类算法

关联规则学习

关联规则学习在数据不同变量之间观察到了一些关联,算法要做的就是找出最能描述这些关系的规则,也就是获取一个事件和其他事件之间依赖或关联的知识常用的关联规则算法有:

Apriori 算法

Eclat 算法

人工神经网络

人工神经网络是一类受生物神经网络的结构及/或功能启发而来的模型它们是一类常用于解决回归和分类等问题的模式匹配,不过,实际上是一个含有成百上千种算法及各种问题变化的子集注意这里我将深度学习从人工神经网络算法中分离了出去,因为深度学习实在太受欢迎人工神经网络指的是更加经典的感知方法常用的人工神经网络包括:

感知机

反向传播算法(BP 神经网络)

Hopfield网络

径向基函数网络(RBFN)

深度学习算法

深度学习算法是人工神经网络的升级版,充分利用廉价的计算力近年来,深度学习得到广泛应用,尤其是语音识别、图像识别深度学习算法会搭建规模更大、结构更复杂的神经网络,正如上文所说,很多深度学习方法都涉及半监督学习问题,这种问题的数据一般量极大,而且只有很少部分带有标签常用的深度学习算法包括:

深度玻尔兹曼机(DBM)

深度信念网络(DBN)

卷积神经网络(CNN)

栈式自编码算法(Stacked Auto-Encoder)

降维算法

降维算法和聚类有些类似,也是试图发现数据的固有结构但是,降维算法采用的是无监督学习的方式,用更少(更低维)的信息进行总结和描述降维算法可以监督学习的方式,被用于多维数据的可视化或对数据进行简化处理很多降维算法经过修改后,也被用于分类和回归的问题常用的降维算法包括:

主成分分析法(PCA)

主成分回归(PCR)

偏最小二乘回归(PLSR)

萨蒙映射

多维尺度分析法(MDS)

投影寻踪法(PP)

线性判别分析法(LDA)

混合判别分析法(MDA)

二次判别分析法(QDA)

灵活判别分析法(Flexible Discriminant Analysis,FDA)

模型融合算法

模型融合算法将多个简单的、分别单独训练的弱机器学习算法结合在一起,这些弱机器学习算法的预测以某种方式整合成一个预测通常这个整合后的预测会比单独的预测要好一些构建模型融合算法的主要精力一般用于决定将哪些弱机器学习算法以什么样的方式结合在一起模型融合算法是一类非常强大的算法,因此也很受欢迎常用的模型融合增强方法包括:

Boosting

Bagging

AdaBoost

堆叠泛化(混合)

GBM 算法

GBRT 算法

随机森林

其他

还有很多算法都没有涉及例如,支持向量机(SVM)应该被归为哪一组?还是说它自己单独成一组?我还没有提到的机器学习算法包括:

特征选择算法

Algorithm accuracy evaluation

Performance measures

再附一张思维导图

一文解析机器学习常用35大算法

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8122

    浏览量

    130562
收藏 人收藏

    评论

    相关推荐

    分享一些最常见最实用的机器学习算法

    在这篇文章中,分享一些最常用机器学习算法
    的头像 发表于 10-14 14:24 8854次阅读
    分享一些最常见最实用的<b class='flag-5'>机器</b><b class='flag-5'>学习</b><b class='flag-5'>算法</b>

    【阿里云大学免费精品课】机器学习入门:概念原理及常用算法

    摘要: 阿里云大学联合蚂蚁金服高级算法专家推出了免费的机器学习入门课程:机器学习入门:概念原理及常用
    发表于 06-23 13:51

    常用python机器学习库盘点

    现在人工智能非常火爆,机器学习应该算是人工智能里面的个子领域,而其中有块是对文本进行分析,对数据进行深入的挖掘提取些特征值,然后用
    发表于 05-10 15:20

    经典算法大全(51个C语言算法+单片机常用算法+机器学十大算法

    试题学SPFA算法整体来说,机器学习算法可以分为 3 大类:0.1 监督学习 工作原理:该算法
    发表于 10-23 14:31

    机器学习算法常用指标汇总

    机器学习性能评价标准是模型优化的前提,在设计机器学习算法过程中,不同的问题需要用到不同的评价标准,本文对
    的头像 发表于 02-13 15:09 3980次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b><b class='flag-5'>算法</b><b class='flag-5'>常用</b>指标汇总

    10大常用机器学习算法汇总

    本文介绍了10大常用机器学习算法,包括线性回归、Logistic回归、线性判别分析、朴素贝叶斯、KNN、随机森林等。
    发表于 11-20 11:10 2492次阅读

    最实用的的五种机器学习算法

    最实用的机器学习算法Top5 demi 在 周一, 04/01/2019 - 10:35 提交 本文将推荐五种机器
    的头像 发表于 03-24 16:14 6090次阅读

    17个机器学习常用算法

    根据数据类型的不同,对一个问题的建模有不同的方式。在机器学习或者人工智能领域,人们首先会考虑算法学习方式。在机器
    的头像 发表于 08-11 11:20 1517次阅读

    17个机器学习常用算法

    源自:AI知识干货 根据数据类型的不同,对一个问题的建模有不同的方式。在机器学习或者人工智能领域,人们首先会考虑算法学习方式。在机器
    的头像 发表于 08-22 09:57 1559次阅读
    17个<b class='flag-5'>机器</b><b class='flag-5'>学习</b>的<b class='flag-5'>常用</b><b class='flag-5'>算法</b>!

    常用机器学习算法的基本概念和特点

    。因此对于数据科学家来说,理解算法显得格外重要,理解不同算法的思想可以帮助数据科学家更从容地面对不同的应用场景。 本文列出了常用机器学习
    的头像 发表于 01-17 15:43 3055次阅读

    机器学习算法的5种基本算子

    自主决策的方法和插件,其中包含了一系列常用的基本算子。在本文中,我们将会介绍机器学习算法的五种基本算子。 一、 求值算子 求值算子是常用
    的头像 发表于 08-17 16:11 1337次阅读

    机器学习算法汇总 机器学习算法分类 机器学习算法模型

    是解决具体问题的一系列步骤,机器学习算法被设计用于从大量的数据中自动学习并不断改进自身的性能。本文将为大家介绍机器
    的头像 发表于 08-17 16:11 727次阅读

    机器学习算法总结 机器学习算法是什么 机器学习算法优缺点

    机器学习算法总结 机器学习算法是什么?机器
    的头像 发表于 08-17 16:11 1078次阅读

    机器学习算法入门 机器学习算法介绍 机器学习算法对比

    机器学习算法入门 机器学习算法介绍 机器
    的头像 发表于 08-17 16:27 630次阅读

    机器学习有哪些算法机器学习分类算法有哪些?机器学习预判有哪些算法

    机器学习有哪些算法机器学习分类算法有哪些?机器
    的头像 发表于 08-17 16:30 1398次阅读