0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一本100页的机器学习书籍近日大受好评

DPVg_AI_era 来源:未知 作者:李倩 2018-11-20 09:27 次阅读

这是一本只有100页,任何只要有基础数学知识的人都能看懂的机器学习书籍。本书将涵盖非监督学习和监督学习、包括神经网络,以及计算机科学、数学和统计学中最重要的一些机器学习问题。

一本100页的机器学习书籍近日大受好评。

书名The Hundred-Page Machine Learning Book,作者Andriy Burkov是Gartner的机器学习团队leader,人工智能专业PhD,有近20年各种计算项目的工作经验。

作者表示,他的目标是写一本任何有基础数学知识的人都能看懂的机器学习书籍。

这本书的前5章已经在该书的配套网站上公开。这本书将涵盖非监督学习和监督学习,包括神经网络,以及计算机科学、数学和统计学中最重要的一些ML问题,并通过例子提供直观的解释。代码和数据也将在网站上公开。

作者相信一本书应该“先读后买”,不仅可以免费下载已公开的章节,你也可以在这里订阅即将出版的章节:

http://themlbook.com/wiki/doku.php

已发布章节:

第1章:简介

第一部分:监督学习

第2章:符号和定义

第3章:基本算法

第4章:剖析学习算法

第5章:基本实践

以下是试读:第3章:基本算法

试读:第3章:基本算法

在本章中,我们描述了五种算法,这些算法不仅是最著名的,而且要么自身非常有效,要么被用作最有效的学习算法的构建块。

3.1 线性回归

线性回归是一种常用的回归学习算法,它学习的模型是输入示例特征的线性组合。

问题陈述

我们有一个标记示例的集合,其中N是集合的大小,是示例i = 1的D维特征向量,是一个实值目标(也是一个实数。

我们想要建立一个模型作为示例x的特征的线性组合:

其中w是参数的D维向量,b*是实数,wx是点积。符号表示模型f由两个值参数化:w和b。

图1:一维示例的线性回归。

3.2 逻辑回归

首先要说的是逻辑回归不是回归,而是一个分类学习算法。这个名称来自统计学,因为逻辑回归的数学公式与线性回归的数学公式相似。

我们将在二元分类的情况下解释逻辑回归。但它也可以扩展到多元分类。

问题陈述

在逻辑回归中,我们仍然希望将这样的特征的线性组合是从负无穷大到正无穷大的函数,而只有两个可能的值。

在没有计算机的年代,科学家们不得不手工进行计算,他们非常想找到一个线性分类模型。他们发现如果将负标签定义为0,将正标签定义为1,就只需要找到一个codomain为(0,1)的简单连续函数。在这种情况下,如果模型为输入x返回的值更接近于0,那么我们为x分配负标签,否则,该示例将被标记为正。具有这种属性的一个函数是标准逻辑函数(也称为sigmoid函数):

如图3所示。

图3:标准逻辑函数

3.3 决策树学习

决策树是一个可用于做决策的非循环图。在图的每个分支节点中,检查特征向量的特定特征j。如果特征的值低于特定的阈值,则遵循左分支,否则,遵循右分支。当到达叶节点时,决定该示例所属的类。

问题陈述

我们有一组带标签的示例;标签属于集合{0,1}。我们想要构建一个决策树,允许我们在给定特征向量的情况下预测示例的类。

图4:决策树构建算法的图示。

3.4 支持向量机

关于SVM,有两个重要问题需要回答:

如果数据中存在噪声,并且没有超平面可以将正例和负例完美分开,该怎么办?

如果数据不能使用平面分离,但可以用高阶多项式分离呢?

图5:线性不可分的情况。左:存在噪音。右:固有的非线性。

如图5中描述的两种情况。在左边的示例中,如果没有噪声(异常值或带有错误标签的示例),数据可以用直线分隔。在正确的情况下,决策边界是一个圆,而不是一条直线。

3.5 k-Nearest Neighbors

k-Nearest Neighbors(kNN)是一种非参数学习算法。与其他在构建模型后丢弃训练数据的学习算法相反,kNN将所有训练示例保存在内存中。一旦出现了一个新的、以前没见过的示例,kNN算法会在D维空间中找到k个最接近的例子并返回多数标签(在分类的情况下)或平均标签(在回归的情况下)。

两点的接近程度由距离函数给出。例如,上面看到的Euclidean distance在实践中经常使用。距离函数的另一个常用选择是负余弦相似性。余弦相似度的定义如下:

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4570

    浏览量

    98709
  • 机器学习
    +关注

    关注

    66

    文章

    8112

    浏览量

    130545
  • 决策树
    +关注

    关注

    2

    文章

    95

    浏览量

    13345

原文标题:100页的机器学习入门书:只要有基础数学知识就能看懂!(免费下载)

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【RISC-V开放架构设计之道|阅读体验】一本别出心裁的RISC-V架构之书(第章)

    【RISC-V开放架构设计之道|阅读体验】一本别出心裁的RISC-V架构之书(第章) 申请这本书的时候就看到了书评中有几点吸引我,让我希望拜读下: 本书的作者是RISC-V架构的作者、著名
    发表于 01-24 19:06

    【RISC-V开放架构设计之道|阅读体验】学习处理器体系架构的一本好书

    并不是一本简单罗列指令的书籍,而是一本全面介绍指令设计理念的书籍书籍的内容充分反映了最新的计算机指令设计的理念,这是我推荐该书的最主要理由
    发表于 01-23 20:08

    《Linux常用命令自学手册》+一本手边linux速查字典

    ,即使不能时都记住,本书也可以作为办公桌边随时查阅的工具书。 我手头有一本也是《linux命令速查手册》,16K的很厚一本,和本书对比了下,有以下不同。 1、《Linux常用命令自
    发表于 12-26 08:46

    名单公布!【书籍评测活动NO.26】图灵奖得主亲自撰写!RISC-V开放架构设计之道

    和示例 此外,本书还介绍x86、ARM 和MIPS 的设计,通过对比分析,突显RISC-V 的优势。 《RISC-V开放架构设计之道》由中科院计算所包云岗老师团队担纲翻译,是一本著译双馨的上乘佳作
    发表于 12-13 17:25

    很好的书籍,学以致用

    BlueField系列DPU和NVIDIA DOCA的实用指南,使开发人员和数据科学家能走近DPU的应用和编程,是一本非常好的DPU入门书籍
    发表于 10-31 08:45

    书籍评测活动NO.23】数据处理器:DPU编程入门

    栈式计算公司,其拥有的数据中心规模产品服务正在重塑行业。 专家推荐 这是一本由浅入深介绍NVIDIA BlueField系列DPU及NVIDIA DOCA软件框架的入门书籍,内容覆盖了DPU及其编程
    发表于 10-24 15:21

    《运算放大器参数解析与LTspice应用仿真》+值得深入学习的好书

    书对自己来说简直就是雪中送炭般的存在。 这本书总共大概200左右,厚薄适中,书籍的内容分为两个部分,第部分介绍了运放的知识和市面上与运放相关的芯片,第二部分介绍了利用软件来仿真的知识。整本书拿在手里不重
    发表于 10-04 22:22

    给自己和初学者安利一本书:《RISC-V 手册》

    初入RISC-V 不了解的太多最近找到了一本电子书 。 内容非常详细。对本人很有帮助。也推荐给大家。*附件:RISC-V-Reader-Chinese-v2p1.pdf
    发表于 08-21 00:13

    一本教程将单片机外围电路讲全了

    这是一本专业说单片机外围电路设计的教程,非常经典,有了它,设计单片机的相关硬件电路将不再发愁,欢迎各位下载学习
    发表于 08-20 18:28

    机器学习有哪些算法?机器学习分类算法有哪些?机器学习预判有哪些算法?

    机器学习有哪些算法?机器学习分类算法有哪些?机器学习预判有哪些算法?
    的头像 发表于 08-17 16:30 1388次阅读

    机器学习和深度学习的区别

    机器学习和深度学习的区别 随着人工智能技术的不断发展,机器学习和深度学习已经成为大家熟知的两个术
    的头像 发表于 08-17 16:11 3371次阅读

    创建个边缘机器学习系统

    指南适用于系统设计人员,可能使用Arm Flexible access程序。 指南将帮助您开发可以执行机器学习的片上系统(SoC)在边缘。
    发表于 08-02 11:02

    请各位推荐一本C语言单片机的书籍

    以前直使用汇编编程,新塘M0汇编搞不定,求推荐几本好点的C语言单片机书籍,谢谢
    发表于 06-19 06:23

    《电子产品设计宝典可靠性原则2000条》+ 避免踩别人踩过的坑——一本非常由价值的经验总结分享书

    概览 封面是比较传统的工程类书籍的设计,比较低调,从书名就可以看出,是一本适合工程实践的经验分享总结书。 书已经是第二版了,印刷时间是2023年比较新,也说明书应该是比较受欢迎的。 从目录
    发表于 05-13 20:50

    参与电子发烧友签到活动——免费领开发板与学习书籍

    积极参与电子发烧友论坛的活动,得了开发板与专业学习书籍
    的头像 发表于 04-28 13:01 52.2w次阅读
    参与电子发烧友签到活动——免费领开发板与<b class='flag-5'>学习</b><b class='flag-5'>书籍</b>