最流行的10种人工智能机器学习的算法-电子发烧友网

人工智能是什么？很多人都知道，但大多又都说不清楚。

事实上，人工智能已经存在于我们生活中很久了。

比如我们常常用到的邮箱，其中垃圾邮件过滤就是依靠人工智能；

比如每个智能手机都配备的指纹识别或人脸识别，也是用人工智能技术实现的；

比如疫情期间大规模使用的无人体温检测仪，同样也使用了人工智能；

但对很多人来讲，人工智能还是一个较为“高深”的技术，然而再高深的技术，也是从基础原理开始的。

人工智能领域中就流传着10大算法，它们的原理浅显，很早就被发现、应用，甚至你在中学时就学过，在生活中也都极为常见。

本文学堂君就为大家用最简单的语言来介绍目前最流行的10种人工智能机器学习的算法，让对人工智能感兴趣，或想要入门的同学，能有更为直观的了解。

线性回归

线性回归（Linear Regression）可能是最流行的机器学习算法。线性回归就是要找一条直线，并且让这条直线尽可能地拟合散点图中的数据点。它试图通过将直线方程与该数据拟合来表示自变量（x 值）和数值结果（y 值）。

然后就可以用这条线来预测未来的值！这种算法最常用的技术是最小二乘法（Least of squares）。这个方法计算出最佳拟合线，以使得与直线上每个数据点的垂直距离最小。总距离是所有数据点的垂直距离（绿线）的平方和。其思想是通过最小化这个平方误差或距离来拟合模型。

例如，简单线性回归，它有一个自变量（x 轴）和一个因变量（y 轴）比如预测明年的房价涨幅、下一季度新产品的销量等等。听起来并不难，不过线性回归算法的难点并不在于得出预测值，而在于如何更精确。为了那个可能十分细微的数字，多少工程师为之耗尽了青春和头发。

逻辑回归

逻辑回归（Logistic regression）与线性回归类似，但逻辑回归的结果只能有两个的值。如果说线性回归是在预测一个开放的数值，那逻辑回归更像是做一道是或不是的判断题。逻辑函数中Y值的范围从 0 到 1，是一个概率值。逻辑函数通常呈S 型，曲线把图表分成两块区域，因此适合用于分类任务。

比如上面的逻辑回归曲线图，显示了通过考试的概率与学习时间的关系，可以用来预测是否可以通过考试。逻辑回归经常被电商或者外卖平台用来预测用户对品类的购买偏好。

决策树

如果说线性和逻辑回归都是把任务在一个回合内结束，那么决策树（Decision Trees）就是一个多步走的动作，它同样用于回归和分类任务中，不过场景通常更复杂且具体。举个简单例子，老师面对一个班级的学生，哪些是好学生？如果简单判断考试90分就算好学生好像太粗暴了，不能唯分数论。那面对成绩不到90分的学生，我们可以从作业、出勤、提问等几个方面分开讨论。

以上就是一个决策树的图例，其中每一个有分叉的圈称为节点。在每个节点上，我们根据可用的特征询问有关数据的问题。左右分支代表可能的答案。最终节点（即叶节点）对应于一个预测值。

每个特征的重要性是通过自顶向下方法确定的。节点越高，其属性就越重要。比如在上面例子中的老师就认为出勤率比做作业重要，所以出勤率的节点就更高，当然分数的节点更高。

朴素贝叶斯

朴素贝叶斯（Naive Bayes）是基于贝叶斯定理，即两个条件关系之间。它测量每个类的概率，每个类的条件概率给出 x 的值。这个算法用于分类问题，得到一个二进制“是 / 非”的结果。看看下面的方程式。

朴素贝叶斯分类器是一种流行的统计技术，经典应用是过滤垃圾邮件。

当然，学堂君赌一顿火锅，80%的人没看懂上面这段话。（80%这个数字是学堂君猜的，但经验直觉就是一种贝叶斯式的计算。）用非术语解释贝叶斯定理，就是通过A条件下发生B的概率，去得出B条件下发生A的概率。

比如说，小猫喜欢你，有a%可能性在你面前翻肚皮，请问小猫在你面前翻肚皮，有多少概率喜欢你？当然，这样做题，等于抓瞎，所以我们还需要引入其他数据，比如小猫喜欢你，有b%可能和你贴贴，有c%概率发出呼噜声。所以我们如何知道小猫有多大概率喜欢自己呢，通过贝叶斯定理就可以从翻肚皮，贴贴和呼噜的概率中计算出来。

支持向量机

支持向量机（Support Vector Machine，SVM）是一种用于分类问题的监督算法。支持向量机试图在数据点之间绘制两条线，它们之间的边距最大。为此，我们将数据项绘制为 n 维空间中的点，其中，n 是输入特征的数量。在此基础上，支持向量机找到一个最优边界，称为超平面（Hyperplane），它通过类标签将可能的输出进行最佳分离。超平面与最近的类点之间的距离称为边距。最优超平面具有最大的边界，可以对点进行分类，从而使最近的数据点与这两个类之间的距离最大化。

所以支持向量机想要解决的问题也就是如何把一堆数据做出区隔，它的主要应用场景有字符识别、面部识别、文本分类等各种识别。

K- 最近邻算法（KNN）

K- 最近邻算法（K-Nearest Neighbors，KNN）非常简单。KNN 通过在整个训练集中搜索 K 个最相似的实例，即 K 个邻居，并为所有这些 K 个实例分配一个公共输出变量，来对对象进行分类。

K 的选择很关键：较小的值可能会得到大量的噪声和不准确的结果，而较大的值是不可行的。它最常用于分类，但也适用于回归问题。

用于评估实例之间相似性的距离可以是欧几里得距离（Euclidean distance）、曼哈顿距离（Manhattan distance）或明氏距离（Minkowski distance）。欧几里得距离是两点之间的普通直线距离。它实际上是点坐标之差平方和的平方根。

KNN分类示例

KNN理论简单，容易实现，可用于文本分类、模式识别、聚类分析等。

K- 均值

K- 均值（K-means）是通过对数据集进行分类来聚类的。例如，这个算法可用于根据购买历史将用户分组。它在数据集中找到 K 个聚类。K- 均值用于无监督学习，因此，我们只需使用训练数据 X，以及我们想要识别的聚类数量 K。

该算法根据每个数据点的特征，将每个数据点迭代地分配给 K 个组中的一个组。它为每个 K- 聚类（称为质心）选择 K 个点。基于相似度，将新的数据点添加到具有最近质心的聚类中。这个过程一直持续到质心停止变化为止。

生活中，K- 均值在欺诈检测中扮演了重要角色，在汽车、医疗保险和保险欺诈检测领域中广泛应用。

随机森林

随机森林（Random Forest）是一种非常流行的集成机器学习算法。这个算法的基本思想是，许多人的意见要比个人的意见更准确。在随机森林中，我们使用决策树集成（参见决策树）。

（a）在训练过程中，每个决策树都是基于训练集的引导样本来构建的。

（b）在分类过程中，输入实例的决定是根据多数投票做出的。

随机森林拥有广泛的应用前景，从市场营销到医疗保健保险，既可以用来做市场营销模拟的建模，统计客户来源、保留及流失，也可以用来预测疾病的风险和病患者的易感性。

降维

由于我们今天能够捕获的数据量之大，机器学习问题变得更加复杂。这就意味着训练极其缓慢，而且很难找到一个好的解决方案。这一问题，通常被称为“维数灾难”（Curse of dimensionality）。

降维（Dimensionality reduction）试图在不丢失最重要信息的情况下，通过将特定的特征组合成更高层次的特征来解决这个问题。主成分分析（Principal Component Analysis，PCA）是最流行的降维技术。

主成分分析通过将数据集压缩到低维线或超平面 / 子空间来降低数据集的维数。这尽可能地保留了原始数据的显著特征。

可以通过将所有数据点近似到一条直线来实现降维的示例。

人工神经网络（ANN）

人工神经网络（Artificial Neural Networks，ANN）可以处理大型复杂的机器学习任务。神经网络本质上是一组带有权值的边和节点组成的相互连接的层，称为神经元。在输入层和输出层之间，我们可以插入多个隐藏层。人工神经网络使用了两个隐藏层。除此之外，还需要处理深度学习。

人工神经网络的工作原理与大脑的结构类似。一组神经元被赋予一个随机权重，以确定神经元如何处理输入数据。通过对输入数据训练神经网络来学习输入和输出之间的关系。在训练阶段，系统可以访问正确的答案。

如果网络不能准确识别输入，系统就会调整权重。经过充分的训练后，它将始终如一地识别出正确的模式。

每个圆形节点表示一个人工神经元，箭头表示从一个人工神经元的输出到另一个人工神经元的输入的连接。

责任编辑：lq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人工智能

人工智能

+关注

关注
1775

文章
43710

浏览量
230488
机器学习

机器学习

+关注

关注
66

文章
8095

浏览量
130515
线性回归

线性回归

+关注

关注
0

文章
41

浏览量
4251

原文标题：人工智能十大流行算法，通俗易懂讲明白

文章出处：【微信号：vision263com，微信公众号：新机器视觉】欢迎添加关注！文章转载请注明出处。

5G智能物联网课程之Aidlux下人工智能开发

*附件：初学者完整学习流程实现手写数字识别案例.pdf 人工智能 语音对话机器人案例 26分03秒 https://t.elecfans.com/v/27185.html *附件：语音对话机

发表于 04-01 10:40

嵌入式人工智能的就业方向有哪些?

联网ARM开发 NB-IoT开发及实战七：python工程师，人工智能工程师 python语法基础 python核心编程基于OpenCV的机器视觉开发嵌入式人工智能渗入生活的方方面面，广泛应用

发表于 02-26 10:17

深度学习在人工智能中的 8 种常见应用

深度学习简介深度学习是人工智能（AI）的一个分支，它教神经网络学习和推理。近年来，它解决复杂问题并在各个领域提供尖端性能的能力引起了极大的兴趣和吸引力。深度

发表于 12-01 08:27 •880次阅读

ai人工智能机器人

随着时间的推移，人工智能的发展越来越成熟，智能时代也离人们越来越近，近几年人工智能越来越火爆，人工智能的应用已经开始渗透到各行各业，与生活交融，成为人们无法拒绝，无法失去的一个重要存在

发表于 09-21 11:09

《通用人工智能：初心与未来》-试读报告

、社交、想象力、创造力、感知力，这是无法用逻辑和推理去定义和构造的。人工智能路途遥远，远远还不到与人类竞争的程度，而且也不会反生的。与其胡思乱想，不如好好学习发展人工智能，让社会的生产力继续提高，让

发表于 09-18 10:02

不可错过！人工神经网络算法、PID算法、Python人工智能学习等资料包分享（附源代码）

3.Python人工智能学习工具包+入门与实践资料集锦本资料的主要内容详细介绍的是Python工具包合集包括了：网页爬虫工具集，文本处理工具集，Python科学计算工具包，Python机器

发表于 09-13 16:41

如何将人工智能应用到效能评估系统软件中去解决

以使用机器学习算法，对实时数据进行分析和处理，以便更好地总结和预测未来趋势。　　其次，华盛恒辉人工智能可以帮助我们识别业务流程中的瓶颈和短板，并提供更有效的解决方案。例如，我们可以使

发表于 08-30 12:58

人工智能和机器学习的区别有哪些

人工智能和机器学习通常可以互换着使用，但是人工智能更加宽泛，人工智能由更多的技术所组成，机器

发表于 08-25 08:23 •1353次阅读

机器学习有哪些算法？机器学习分类算法有哪些？机器学习预判有哪些算法？

机器学习有哪些算法？机器学习分类算法有哪些？机器

发表于 08-17 16:30 •1370次阅读

人工智能需要学习什么

和层次，分析人工智能需要学习的内容。 1. 数据学习 人工智能最根本的就是数据，只有通过数据的学习和处理，才能让

发表于 08-12 17:12 •613次阅读

怎么学习人工智能

怎么学习人工智能 人工智能是当今最热门的领域之一，因其在工业、商业、医疗和其他行业中的应用而广受欢迎。学习人工智能可以带来许多好处，例如深入

发表于 08-12 16:43 •711次阅读

人工智能的算法有哪些？

人工智能的算法有哪些？随着人工智能技术的快速发展，在不断地挖掘和研究中，在人工智能算法中也出现了越来越多的类型。目前，人工智能算法主要包括

发表于 08-09 17:49 •1821次阅读

AI 人工智能的未来在哪？

人工智能、AI智能大模型已经孵化；繁衍过程将突飞猛进，ChatGPT已经上线。世界首富马斯克认为AI对人类是一种威胁；谷歌前CEO施密特认为AI和机器

发表于 06-27 10:48

【书籍评测活动NO.16】通用人工智能：初心与未来

之后的达特茅斯研讨会开始，用机器来模仿人类学习及其他方面的智能，即实现“人工智能”（Artificial Intelligence，AI）便成为计算机领域持续的研究热点。时至今日，以深

发表于 06-21 14:41

人工智能、算法与机器学习辨析

人工智能 (AI)、机器学习 (ML) 和算法这几个词经常出现误用、混淆和误解。尽管它们都有各自的固定含义，但是人们常常会将这几个概念互换使用。遗憾的是，如果没有领会这些含义，它们可能

发表于 05-09 10:55 •1452次阅读

搜索历史

最流行的10种人工智能机器学习的算法

评论

5G智能物联网课程之Aidlux下人工智能开发

嵌入式人工智能的就业方向有哪些?

深度学习在人工智能中的 8 种常见应用

ai人工智能机器人

《通用人工智能：初心与未来》-试读报告

不可错过！人工神经网络算法、PID算法、Python人工智能学习等资料包分享（附源代码）

如何将人工智能应用到效能评估系统软件中去解决

人工智能和机器学习的区别有哪些

机器学习有哪些算法？机器学习分类算法有哪些？机器学习预判有哪些算法？

人工智能需要学习什么

怎么学习人工智能

人工智能的算法有哪些？

AI 人工智能的未来在哪？

【书籍评测活动NO.16】通用人工智能：初心与未来

人工智能、算法与机器学习辨析