0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器学习中的相关概念、数学知识和各种经典算法

电子工程师 来源:lp 2019-03-15 14:40 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,来自SAP(全球第一大商业软件公司)的梁劲(Jim Liang)公开了自己所写的一份 520 页的学习教程(英文版),详细、明了地介绍了机器学习中的相关概念、数学知识和各种经典算法。机器之心看到后,也迫不及待的推广给更多的读者。完整的 PDF 请从文后作者公开的链接下载。

在介绍中,Jim Liang写到:

人工智能是这两年风头正劲的领域,也是未来具有颠覆性可能的新领域。不少人尝试去学习机器学习相关的知识。然而,一旦越过最初的 overview 阶段,很多人就开始打退堂鼓了,然后迅速放弃。

为什么会这样?

极 高 的 学 习 曲 线

首当其冲就是数学,涉及统计学、微积分、概率、线性代数等,大家虽然都学过高等数学,但如果你还记得里面的细节,算你牛。更可能的情况是,多数人都对高等数学忘记了,面对各种算法里的大量公式,感到厌恶,甚至恐惧。

其次因为机器学习本身是一个综合性学科,而且是一个快速发展的学科,知识点散乱,缺乏系统性。

市面上的机器学习/深度学习书籍、文章、教程,遍地开花,但能以清晰的方式表达、循序渐进地讲解的教程,其实不多,大量的教程没有考虑到学习者的基础,使得初学者感到挫败和困惑。

图 解 机 器 学 习

正是对机器学习的过程中的痛苦有切身体会,我希望能做一份教程,以浅显易懂的方式去讲解它,降低大家的学习门槛。我为此花费了数月时间,经常做到深夜,把自己的学习笔记整理成了这份教程。

从结构来看,全部教程包含两部分:

Part 1 介绍了基本概念,包括:

机器学习的流程

数据处理

建模

评估指标(如 MSE、ROC 曲线)

模型部署

过度拟合

正则化等

在第一部分,作者先介绍了如今应用普遍的机器学习:从自动驾驶、语音助手到机器人。其中有些思想,也是众多读者们了解过的,例如:为何机器学习在这个时候会火(大数据、计算力、更好的算法);机器学习、人工智能、深度学习三者的关系等。

除了这些基础概念,这份教程也对机器学习模型的开发流程做了图像化展示(如下图),即使对此不太了解的读者,也能通过这种流程展示有所学习。

建立机器学习解决方案的步骤

在 Part1 的其他小节,作者以类似的图像展示,对数据、建模、模型部署等内容做了详细介绍,这里就不一一列举,可以从原报告查看。

在 Part2,作者介绍了 常用的算法,包括:

线性回归

逻辑回归

神经网络

SVM

Knn

K-Means

决策树

随机森林

AdaBoost

朴素贝叶斯

梯度下降

主成分分析

这部分包含了大量的数学公式,但作者尽力注解了其中的每个公式,从而充分、清晰地表达了众多数学概念。

例如在「神经网络」部分,作者整理了 59 页的笔记(从 311 页到 369 页)。作者从人脑中的神经元架构说起,介绍了人工神经网络(ANN)、人工神经元工作的原理。这份笔记非常注重图像化的概念解释,理解起来非常直观。

例如,下图中的概念解释很形象地展现了生物神经元和人工神经元工作方式的相似性。

生物神经元的树突输入-轴突输出模式和人工神经元的输入输出模式对比。

过拟合的解释。

人工神经元的基础结构。

在涉及到数学公式时,作者会在旁边有详细的注解,如下图所示:

对于并列的可选项(如激活函数、常用神经网络架构等),也会有全面的列表:

常用的激活函数。

然后会有每个激活函数的单独介绍:

Sigmoid 激活函数。

用神经网络分类手写数字的前向传播示例(softmax 激活函数)。

对于神经网络中较为复杂的概念(如求导、反向传播),几张图就能解释清楚:

关于神经网络的完整训练过程,作者用简略流程图+计算细节展开的方式呈现:

反向传播算法完整流程。

前向传播部分的计算细节。

就像前面提到的,这部分除了「神经网络」的介绍,还包括随机森林、梯度下降等概念的介绍,读者们可查看原教程。

总结

看完这份教程之后,小编觉得这是一份包罗万象的学习笔记,既适合非专业人士了解有关机器学习的基础概念,又适合有专业背景的学生进一步学习。

写教程是为了自己持续学习,分享教程是为了帮助更多人学习。就像作者所说,「Learning by doing/teaching, 写这个教程主要是强迫自己持续学习,另外,也想分享给他人,希望能帮助到更多想学习 Machine Learning 的人,降低大家的学习痛苦。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4840

    浏览量

    108146
  • 人工智能
    +关注

    关注

    1819

    文章

    50297

    浏览量

    266843
  • 机器学习
    +关注

    关注

    67

    文章

    8561

    浏览量

    137208

原文标题:520页的机器学习笔记

文章出处:【微信号:machine_vision_1,微信公众号:机器视觉智能检测】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    算法工程师需要具备哪些技能?

    算法工程师需要掌握一系列跨学科的技能,涵盖数学基础、编程能力、算法理论、工程实践以及业务理解等多个方面。 以下是具体技能及学习建议: 线性代数核心内容:矩阵运算、特征值分解、向量空间等
    发表于 02-27 10:53

    机器学习和深度学习需避免的 7 个常见错误与局限性

    无论你是刚入门还是已经从事人工智能模型相关工作一段时间,机器学习和深度学习中都存在一些我们需要时刻关注并铭记的常见错误。如果对这些错误置之不理,日后可能会引发诸多麻烦!只要我们密切关注
    的头像 发表于 01-07 15:37 342次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>和深度<b class='flag-5'>学习</b><b class='flag-5'>中</b>需避免的 7 个常见错误与局限性

    机器视觉光学基础概念——眩光、鬼影与热点

    分布,可能导致图像失真或信息丢失。本文将从光学原理角度阐述这些概念,并讨论其在工业应用的影响及优化策略。通过理解这些基础知识,用户可更好地设计和选用光学组件,以
    的头像 发表于 12-10 10:09 952次阅读
    <b class='flag-5'>机器</b>视觉光学基础<b class='flag-5'>概念</b>——眩光、鬼影与热点

    量子机器学习入门:三种数据编码方法对比与应用

    在传统机器学习数据编码确实相对直观:独热编码处理类别变量,标准化调整数值范围,然后直接输入模型训练。整个过程更像是数据清洗,而非核心算法组件。量子
    的头像 发表于 09-15 10:27 935次阅读
    量子<b class='flag-5'>机器</b><b class='flag-5'>学习</b>入门:三种数据编码方法对比与应用

    PID控制算法学习笔记资料

    用于新手学习PID控制算法
    发表于 08-12 16:22 7次下载

    【「Yocto项目实战教程:高效定制嵌入式Linux系统」阅读体验】+基础概念学习理解

    是 Yocto 项目的核心部分之一,书中对元数据的概念、文件、语法以及菜谱和层的相关内容进行了详细阐述。通过学习这部分内容,我了解到元数据在 Yocto 项目中的重要性,它定义了构建系统的各个方面,包括
    发表于 08-04 22:29

    ARM入门学习方法分享

    的官方文档,了解ARM架构的细节,并参考一些在线教程和博客来学习其他开发者的经验和技巧。 总的来说,学习ARM需要一定的耐心和实践。通过掌握基本概念学习汇编语言、使用开发工具、进行
    发表于 07-23 10:21

    FPGA在机器学习的具体应用

    ,越来越多地被应用于机器学习任务。本文将探讨 FPGA 在机器学习的应用,特别是在加速神经网
    的头像 发表于 07-16 15:34 3075次阅读

    任正非说 AI已经确定是第四次工业革命 那么如何从容地加入进来呢?

    以下是一些可以从容加入AI第四次工业革命的方法: 一、教育与学习方面 基础理论学习 深入学习数学知识,特别是线性代数、概率论与数理统计、微积分等。这些是AI
    发表于 07-08 17:44

    【嘉楠堪智K230开发板试用体验】K230机器视觉相关功能体验

    画图 机器学习模型在通过摄像头获取图像后,经过处理输入后,在输出环节通常还需要进行后处理,例如图像检测应用,目标位置的框选等。 在K230提供了画图的功能,可以实现画线段、画矩形
    发表于 07-08 17:25

    工业机器人与协作机器概念不同

    在自动化生产的浪潮,工业机器人与协作机器人逐渐成为企业提升效率、优化产能的得力助手。但它们并非同一概念,在功能、设计与应用场景上有着显著差异。北京沃华慧通测控有限公司凭借深厚的技术沉
    的头像 发表于 06-03 13:15 1317次阅读
    工业<b class='flag-5'>机器</b>人与协作<b class='flag-5'>机器</b>人<b class='flag-5'>概念</b>不同

    使用MATLAB进行无监督学习

    无监督学习是一种根据未标注数据进行推断的机器学习方法。无监督学习旨在识别数据隐藏的模式和关系,无需任何监督或关于结果的先验
    的头像 发表于 05-16 14:48 1585次阅读
    使用MATLAB进行无监督<b class='flag-5'>学习</b>

    【「# ROS 2智能机器人开发实践」阅读体验】视觉实现的基础算法的应用

    人部署,详细介绍了基于颜色阈值和深度学习的巡线方法。 二维码识别则广泛应用于机器人定位与任务触发,例如AGV(自动导引车)的路径规划。 深度学习机器人视觉
    发表于 05-03 19:41

    B10 BMS技术知识初探(上、下)

    商用的最核心技术之一。本课程对BMS技术相关知识, 进行概念级、扫盲级讲解;让所有关注、关心、以及想进入新能源行业发展的朋友们,能够对BMS技术知识有最基本的 认识;也希望通过本课程的
    发表于 05-02 11:04

    【「# ROS 2智能机器人开发实践」阅读体验】机器人入门的引路书

    的非常好的,特别是一些流程图,很清晰的阐释了概念 很适合作为初学者入门的引路书 还能了解很多技术和框架,破除初学者的自负困境,让初学者知道功能是由很多开发者维护的,前人已经为各种产品搭建了完善的框架。避免陷入得一个人单打独斗的错觉 一直蠢蠢欲动ros2和
    发表于 04-30 01:05