0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器学习:基本概念、五大流派与九种常见算法

新机器视觉 来源:深度学习冲鸭 作者:深度学习冲鸭 2021-03-29 11:38 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

一、机器学习概览

5bf72a2c-8e94-11eb-8b86-12bb97331649.jpg

1. 什么是机器学习?

机器通过分析大量数据来进行学习。比如说,不需要通过编程来识别猫或人脸,它们可以通过使用图片来进行训练,从而归纳和识别特定的目标。

2. 机器学习和人工智能的关系

机器学习是一种重在寻找数据中的模式并使用这些模式来做出预测的研究和算法的门类。机器学习是人工智能领域的一部分,并且和知识发现与数据挖掘有所交集。

5c202044-8e94-11eb-8b86-12bb97331649.jpg

3. 机器学习的工作方式

①选择数据:将你的数据分成三组:训练数据、验证数据和测试数据

②模型数据:使用训练数据来构建使用相关特征的模型

③验证模型:使用你的验证数据接入你的模型

④测试模型:使用你的测试数据检查被验证的模型的表现

⑤使用模型:使用完全训练好的模型在新数据上做预测

⑥调优模型:使用更多数据、不同的特征或调整过的参数来提升算法的性能表现

5c5e3ae6-8e94-11eb-8b86-12bb97331649.jpg

4. 机器学习所处的位置

①传统编程:软件工程师编写程序来解决问题。首先存在一些数据→为了解决一个问题,软件工程师编写一个流程来告诉机器应该怎样做→计算机遵照这一流程执行,然后得出结果

②统计学:分析师比较变量之间的关系

③机器学习:数据科学家使用训练数据集来教计算机应该怎么做,然后系统执行该任务。首先存在大数据→机器会学习使用训练数据集来进行分类,调节特定的算法来实现目标分类→该计算机可学习识别数据中的关系、趋势和模式

④智能应用:智能应用使用人工智能所得到的结果,如图是一个精准农业的应用案例示意,该应用基于无人机所收集到的数据

5cc0812e-8e94-11eb-8b86-12bb97331649.jpg

5. 机器学习的实际应用

机器学习有很多应用场景,这里给出了一些示例,你会怎么使用它?

快速三维地图测绘和建模:要建造一架铁路桥,PwC 的数据科学家和领域专家将机器学习应用到了无人机收集到的数据上。这种组合实现了工作成功中的精准监控和快速反馈。

增强分析以降低风险:为了检测内部交易,PwC 将机器学习和其它分析技术结合了起来,从而开发了更为全面的用户概况,并且获得了对复杂可疑行为的更深度了解。

预测表现最佳的目标:PwC 使用机器学习和其它分析方法来评估 Melbourne Cup 赛场上不同赛马的潜力。

二、机器学习的演化

5cf85fa4-8e94-11eb-8b86-12bb97331649.jpg

几十年来,人工智能研究者的各个「部落」一直以来都在彼此争夺主导权,参阅机器之心文章《华盛顿大学教授 Pedro Domingos:机器学习领域五大流派(附演讲 ppt)》。现在是这些部落联合起来的时候了吗?他们也可能不得不这样做,因为合作和算法融合是实现真正通用人工智能(AGI)的唯一方式。这里给出了机器学习方法的演化之路以及未来的可能模样。 1. 五大流派 ①符号主义:使用符号、规则和逻辑来表征知识和进行逻辑推理,最喜欢的算法是:规则和决策树 ②贝叶斯派:获取发生的可能性来进行概率推理,最喜欢的算法是:朴素贝叶斯或马尔可夫 ③联结主义:使用概率矩阵和加权神经元来动态地识别和归纳模式,最喜欢的算法是:神经网络 ④进化主义:生成变化,然后为特定目标获取其中最优的,最喜欢的算法是:遗传算法 ⑤Analogizer:根据约束条件来优化函数(尽可能走到更高,但同时不要离开道路),最喜欢的算法是:支持向量机

5d215d8c-8e94-11eb-8b86-12bb97331649.jpg

2. 演化的阶段 1980 年代

主导流派:符号主义

架构:服务器或大型机

主导理论:知识工程

基本决策逻辑:决策支持系统,实用性有限

1990 年代到 2000 年

主导流派:贝叶斯

架构:小型服务器集群

主导理论:概率论

分类:可扩展的比较或对比,对许多任务都足够好了

2010 年代早期到中期

主导流派:联结主义

架构:大型服务器农场

主导理论:神经科学和概率

识别:更加精准的图像和声音识别、翻译、情绪分析等

5d60fcbc-8e94-11eb-8b86-12bb97331649.jpg

3. 这些流派有望合作,并将各自的方法融合到一起 2010 年代末期

主导流派:联结主义+符号主义

架构:许多云

主导理论:记忆神经网络、大规模集成、基于知识的推理

简单的问答:范围狭窄的、领域特定的知识共享

2020 年代+

主导流派:联结主义+符号主义+贝叶斯+……

架构:云计算和雾计算

主导理论:感知的时候有网络,推理和工作的时候有规则

简单感知、推理和行动:有限制的自动化或人机交互

2040 年代+

主导流派:算法融合

架构:无处不在的服务器

主导理论:最佳组合的元学习

感知和响应:基于通过多种学习方式获得的知识或经验采取行动或做出回答

三、机器学习的算法

5da31ae8-8e94-11eb-8b86-12bb97331649.jpg

你应该使用哪种机器学习算法?这在很大程度上依赖于可用数据的性质和数量以及每一个特定用例中你的训练目标。不要使用最复杂的算法,除非其结果值得付出昂贵的开销和资源。这里给出了一些最常见的算法,按使用简单程度排序。更多内容可参阅机器之心的文章《机器学习算法集锦:从贝叶斯到深度学习及各自优缺点》和《经验之谈:如何为你的机器学习问题选择合适的算法?》 1. 决策树(Decision Tree):在进行逐步应答过程中,典型的决策树分析会使用分层变量或决策节点,例如,可将一个给定用户分类成信用可靠或不可靠。

优点:擅长对人、地点、事物的一系列不同特征、品质、特性进行评估

场景举例:基于规则的信用评估、赛马结果预测

5e04bfe6-8e94-11eb-8b86-12bb97331649.jpg

2. 支持向量机(Support Vector Machine):基于超平面(hyperplane),支持向量机可以对数据群进行分类。

优点:支持向量机擅长在变量 X 与其它变量之间进行二元分类操作,无论其关系是否是线性的

场景举例:新闻分类、手写识别。

3. 回归(Regression):回归可以勾画出因变量与一个或多个因变量之间的状态关系。在这个例子中,将垃圾邮件和非垃圾邮件进行了区分。

优点:回归可用于识别变量之间的连续关系,即便这个关系不是非常明显

场景举例:路面交通流量分析、邮件过滤

5e3f1bf0-8e94-11eb-8b86-12bb97331649.jpg

4. 朴素贝叶斯分类(Naive Bayes Classification):朴素贝叶斯分类器用于计算可能条件的分支概率。每个独立的特征都是「朴素」或条件独立的,因此它们不会影响别的对象。例如,在一个装有共 5 个黄色和红色小球的罐子里,连续拿到两个黄色小球的概率是多少?从图中最上方分支可见,前后抓取两个黄色小球的概率为 1/10。朴素贝叶斯分类器可以计算多个特征的联合条件概率。

优点:对于在小数据集上有显著特征的相关对象,朴素贝叶斯方法可对其进行快速分类

场景举例:情感分析、消费者分类

5. 隐马尔可夫模型(Hidden Markov model):显马尔可夫过程是完全确定性的——一个给定的状态经常会伴随另一个状态。交通信号灯就是一个例子。相反,隐马尔可夫模型通过分析可见数据来计算隐藏状态的发生。随后,借助隐藏状态分析,隐马尔可夫模型可以估计可能的未来观察模式。在本例中,高或低气压的概率(这是隐藏状态)可用于预测晴天、雨天、多云天的概率。

优点:容许数据的变化性,适用于识别(recognition)和预测操作

场景举例:面部表情分析、气象预测

5e904a66-8e94-11eb-8b86-12bb97331649.jpg

6. 随机森林(Random forest):随机森林算法通过使用多个带有随机选取的数据子集的树(tree)改善了决策树的精确性。本例在基因表达层面上考察了大量与乳腺癌复发相关的基因,并计算出复发风险。

优点:随机森林方法被证明对大规模数据集和存在大量且有时不相关特征的项(item)来说很有用

场景举例:用户流失分析、风险评估

7. 循环神经网络(Recurrent neural network):在任意神经网络中,每个神经元都通过 1 个或多个隐藏层来将很多输入转换成单个输出。循环神经网络(RNN)会将值进一步逐层传递,让逐层学习成为可能。换句话说,RNN 存在某种形式的记忆,允许先前的输出去影响后面的输入。

优点:循环神经网络在存在大量有序信息时具有预测能力

场景举例:图像分类与字幕添加、政治情感分析

5f9a9be6-8e94-11eb-8b86-12bb97331649.jpg

8. 长短期记忆(Long short-term memory,LSTM)与门控循环单元神经网络(gated recurrent unit nerual network):早期的 RNN 形式是会存在损耗的。尽管这些早期循环神经网络只允许留存少量的早期信息,新近的长短期记忆(LSTM)与门控循环单元(GRU)神经网络都有长期与短期的记忆。换句话说,这些新近的 RNN 拥有更好的控制记忆的能力,允许保留早先的值或是当有必要处理很多系列步骤时重置这些值,这避免了「梯度衰减」或逐层传递的值的最终 degradation。LSTM 与 GRU 网络使得我们可以使用被称为「门(gate)」的记忆模块或结构来控制记忆,这种门可以在合适的时候传递或重置值。

优点:长短期记忆和门控循环单元神经网络具备与其它循环神经网络一样的优点,但因为它们有更好的记忆能力,所以更常被使用

场景举例:自然语言处理、翻译

9. 卷积神经网络(convolutional neural network):卷积是指来自后续层的权重的融合,可用于标记输出层。

优点:当存在非常大型的数据集、大量特征和复杂的分类任务时,卷积神经网络是非常有用的

场景举例:图像识别、文本转语音、药物发现

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像识别
    +关注

    关注

    9

    文章

    535

    浏览量

    40242
  • 机器学习
    +关注

    关注

    67

    文章

    8570

    浏览量

    137421
  • 自然语言处理

    关注

    1

    文章

    630

    浏览量

    14756

原文标题:三张图读懂机器学习:基本概念、五大流派与九种常见算法

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    人工智能五大核心:芯片、算力、数据、算法、能源 !

    、数据、算法与能源电力。这五大层次自微观至宏观、从硬件到软件、由物质基础到能量支撑,共同构筑起人工智能完整的“身体图谱”,形成其闭环式技术体系,也成为当今大国科技竞
    的头像 发表于 04-16 12:47 828次阅读
    人工智能<b class='flag-5'>五大</b>核心:芯片、算力、数据、<b class='flag-5'>算法</b>、能源 !

    开关电源的基本概念和分析方法

    开关电源的基本概念和分析方法
    发表于 04-10 15:20 1次下载

    烧录芯片总失败?五大常见错误与解决方法

    产线常见 Verify Error 校验错误,多非芯片本身问题,而是五大典型因素导致:烧录座接触不良、电源供电不稳、信号与时序异常、加密保护误触、静电与温度影响。按物理连接、电气环境、软件配置逐级排查,规范耗材更换与产线防护,可显著提升烧录良率与稳定性。
    的头像 发表于 02-24 15:37 1598次阅读

    2026 年全球五大机器人趋势 - 国际机器人联合会报告

    全球工业机器人安装的全球市场价值已达到 167 亿美元的历史新高。未来的需求将由一系列技术创新、市场力量和新业务领域驱动。国际机器人联合会报告了 2026 年机器人行业的五大趋势: 1
    的头像 发表于 01-12 16:01 621次阅读

    机器学习和深度学习中需避免的 7 个常见错误与局限性

    无论你是刚入门还是已经从事人工智能模型相关工作一段时间,机器学习和深度学习中都存在一些我们需要时刻关注并铭记的常见错误。如果对这些错误置之不理,日后可能会引发诸多麻烦!只要我们密切关注
    的头像 发表于 01-07 15:37 410次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>和深度<b class='flag-5'>学习</b>中需避免的 7 个<b class='flag-5'>常见</b>错误与局限性

    探秘安全生产预警预测系统的五大顶尖平台

    探秘安全生产预警预测系统的五大顶尖平台
    的头像 发表于 10-16 09:56 1518次阅读
    探秘安全生产预警预测系统的<b class='flag-5'>五大</b>顶尖平台

    影响同步带模组成本的五大核心变量分析

    影响同步带模组成本的五大核心变量
    的头像 发表于 10-15 17:52 814次阅读
    影响同步带模组成本的<b class='flag-5'>五大</b>核心变量分析

    学习物联网怎么入门?

    联网的基本概念和技术是学习物联网的重要第一步。物联网是指互联网上的物品相互连接,通过网络实现信息交流和共享的一技术。学习物联网需要了解物联网的基本
    发表于 10-14 10:34

    五大电磁频谱管理系统:原理、架构与应用全景解析

    五大电磁频谱管理系统:原理、架构与应用全景解析
    的头像 发表于 09-26 10:21 733次阅读
    <b class='flag-5'>五大</b>电磁频谱管理系统:原理、架构与应用全景解析

    五大海上安全事件应急处置系统:有哪些优点和缺点

    五大海上安全事件应急处置系统:有哪些优点和缺点
    的头像 发表于 09-04 17:09 1275次阅读
    <b class='flag-5'>五大</b>海上安全事件应急处置系统:有哪些优点和缺点

    晶体晶振在机器五大核心模块的关键作用

    你以为机器人那些流畅的动作和适宜的反应,只靠一颗强大的CPU就够了吗?NO,NO,NO! 再聪明的大脑也需要晶体晶振来统筹全局!晶体晶振就像机器人的「心跳」和「指挥棒」,决定了它每一个动作、每一条指令的精准触达。今天,我们就来解析这颗「芯」在
    的头像 发表于 09-03 09:36 1121次阅读
    晶体晶振在<b class='flag-5'>机器</b>人<b class='flag-5'>五大</b>核心模块的关键作用

    广汽人形机器人GoMate的五大核心技术

    在2025世界机器人大会上,广汽第三代具身智能机器人GoMate一经亮相,便迅速成为全场焦点。凭借多项领先技术,GoMate在众多国内外优秀机器人企业的同台竞技中脱颖而出,成为炙手可热的“明星”。接下来,小编为大家深度解码GoM
    的头像 发表于 08-14 16:25 1186次阅读

    隧道施工安全管理系统:构筑隧道施工安全防线隧道五大系统

    隧道施工安全管理系统隧道五大系统建设隧道人员定位
    的头像 发表于 08-12 12:05 1075次阅读
    隧道施工安全管理系统:构筑隧道施工安全防线隧道<b class='flag-5'>五大</b>系统

    ARM入门学习方法分享

    。 以下是一些入门学习方法的分享: 一、 理解基本概念:首先,了解ARM是什么以及它的基本概念是很重要的。ARM(Advanced RISC Machines)指的是一精简指令集
    发表于 07-23 10:21

    电压波动与闪变的基本概念

    如果您是电力系统工程师、电气设备维护人员或者相关专业的学生,应该注意到了有关电能质量的国家标准GB/T 12326-2008是有关电压波动和闪变的,那这两个参数的考核意义是什么?国家标准规定这两个参数如何计算、测量和考核?这篇文章带您全面了解电压波动和闪变的基本概念、重要性以及国家标准的规定。
    的头像 发表于 07-22 14:10 3605次阅读
    电压波动与闪变的<b class='flag-5'>基本概念</b>