0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

介绍七本在注重打好数据科学的数学基础上的技术读物

DPVg_AI_era 来源:lp 2019-04-19 08:56 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

机器学习和数据科学离不开数学,本文从数学基础的角度入手,推荐了数据科学和机器学习方面的七本参考书以及两本补充读物。相信对打好数学基础的相关人士会有所帮助。

大多数人学习数据科学的人都会把重点放在编程上,实际上编程能力确实是机器学习和数据科学领域的重要技能。但是,要真正精通数据科学和机器学习,必然不能忽视的数据科学背后的数学基础。

出于这个目的,本文介绍了七本在注重打好数据科学的数学基础上的技术读物。当然,涉及到数学,往往阅读体验可能不会很舒服,但要搞好机器学习,数学基础是必须要打牢的,所以努力读书吧!

先说一说为什么在数据科学学习时打好数学基础。

以下是我总结的几个原因:

AI领域无时无刻不在迅速变化。Hinton认为,我们也许应该重新思考反向传播。掌握牢固的数学知识有助于更好地理解AI的演变。一个数学基础深厚的人,对AI的理解和认识与其他仅从表面认识AI的人有很大的区别。此外,掌握数学知识还能更好地了解AI技术带来知识产权的潜力。最后,了解数据科学背后的数学知识,也可以让人更容易获得AI和数据科学的高端职位。

此外,作者推荐这几本书,还有两点个人原因:

1.作者在牛津大学教授物联网数据科学的课程,也包括一些AI技术应用方面的教学事务,在教学过程中涉及到数学基础知识和课程。

2.其次,作者在写一本书来简述人工智能,从数学的角度入手,目标读者是14到18岁的少年。要深入了解数学科学和人工智能数学的数学基础,你需要了解四个方面知识:线性代数,概率论,多元微积分和优化。目前在高中阶段至少会教授这些课程的一部分内容。因此,我试图将高中数学与人工智能和数据科学联系起来,重点是数学建模。

下面进入正题:

(1) The Nature Of Statistical Learning Theory《统计学习理论的本质》

作者:VladimirVapnik

PDF资源:

https://statisticalsupportandresearch.files.wordpress.com/2017/05/vladimir-vapnik-the-nature-of-statistical-learning-springer-2010.pdf

如果说要列一份关于数学的书单,这本书是绕不过去的。本书单中排名第一的就是俄罗斯著名数学家VladimirVapnik的《统计学习理论的本质》。在这份清单中的所有书籍中,Vapnik这本是最不好找的。VladimirVapnik是支持向量机(SVM)的创始人。他的维基百科页面中提供了更多关于他研究成果的介绍。

(2)Pattern Classification(2007-12-24)《模式分类》

作者:RichardODuda

PDF资源:

https://cds.cern.ch/record/683166/files/0471056693_TOC.pdf

就像Vapnik的著作一样,Duda的著作时另一个时代的另一部经典。本书初版于1973年,在二十多年后的2000年才推出第二版,此后一直未再版。时隔近二十年,本书仍然是一个重要资源。本书采用模式识别方法,并涵盖了广泛的算法

(3)

MachineLearning:AnAlgorithmicPerspective,SecondEdition(Chapman&Hall/CrcMachineLearning&PatternRecognition)

《机器学习:算法视角》

PDF资源:

https://doc.lagout.org/science/Artificial%20Intelligence/Machine%20learning/Machine%20Learning_%20An%20Algorithmic%20Perspective%20%282nd%20ed.%29%20%5BMarsland%202014-10-08%5D.pdf

这本书现在已经出版了第二版。此书第一版是我读过的最早的书关于机器学习和算法的著作之一,第二版增加了更多Python代码。与前两本书一样,本书也非常强调算法。

(4)

TheElementsofStatisticalLearning:DataMining,Inference,andPrediction,SecondEdition

《统计学习基础:数据挖掘、推理和预测》(第二版)

作者:TrevorHastie,RobertTibshirani,JeromeFriedman

PDF资源:https://web.stanford.edu/~hastie/Papers/ESLII.pdf

另一本经典之作,可以作为参考书。

(5)Pattern Recognition and Machine Learning (Information Science and Statistics)

《模式识别与机器学习(信息科学与统计)》

作者:ChristopherM.Bishop

PDF资源:http://users.isr.ist.utl.pt/~wurmd/Livros/school/Bishop%20-%20Pattern%20Recognition%20And%20Machine%20Learning%20-%20Springer%20%202006.pdf

ChristopherM.Bishop的模式识别和机器学习(信息科学和统计学)也是一本深入而精心设计的参考书。

(6)

MachineLearning:TheArtandScienceofAlgorithmsthatMakeSenseofData

作者:PeterFlach

PDF资源:http://www.cs.put.poznan.pl/tpawlak/files/ZMIO/W02.pdf

我喜欢PeterFlach的书,尽管亚马逊网站上的一些评论说这书写得太罗嗦,而且代码量显得不足。我特别喜欢这本书中的算法分组(逻辑模型,线性模型,概率模型)章节以及这些主题的整体讲述方式。

最后,是我最推荐的一本书:

(7)Deep Learning《深度学习

作者:Goodfellow、Bengio、Corville

相关资源:https://www.deeplearningbook.org/

如果你在找一本值得逐页读完的书,就是它了!这本书既详细,又有现代感,书中内容几乎涵盖了你能想到的关于深度学习的一切知识。

补充两本书:

A First Course in Machine Learning, Second Edition (Machine Learning & Pattern Recognition) by Simon Rogers, Mark Girolami

作者:SimonRogers,MarkGirolami

我觉得这本书并不太适合初学者,但它仍然是一本好书(特别是第二版)

MachineLearning:AProbabilisticPerspective

作者:KevinMurphy

这本书中评价也很高,但我个人没有读过(因此没有收集)。

写在最后:

除了最后一本《深度学习》之外,我建议其他书不必逐页阅读,而是将其作为参考书,根据需要按相应主题阅读相应的书籍。这些书教会了我时刻保持谦逊。无论我们现在知道了多少,掌握了多少知识,都总能在阅读过程中发现,这个领域原来是如此的庞大和复杂。

这些书已经超越了时间。VladimirVapnik现年已经81岁。Duda的著作初版于1973年。我预计50年以后,这个行业里的人们仍然会阅读这些著作。就像与那些经历了时间考验的老朋友们重逢一样。多年之后,也许你会发现,在眼花缭乱的技术、模型和框架背后,数学是永恒的。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38171

    浏览量

    296925
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136236
  • 数据科学
    +关注

    关注

    0

    文章

    168

    浏览量

    10751

原文标题:【荐书】提升机器学习数学基础,这7本书一定要读(附pdf资源)

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    利用 Banana Pi BPI-CM5 Pro(ARMSoM CM5 SoM) 加速保护科学

    损坏的风险(所有浸入水中的技术设备都是如此),这意味着数据可能会在不知不觉中丢失,而基线数据集的后续缺口可能会妨碍科学家得出具有统计意义的可靠结论。
    发表于 10-27 09:18

    Photonis 科学图像增强器介绍

    对于寻求先进图像增强技术的增强相机制造商,Photonis 提供具有无与伦比规格的科学级图像增强管。其中包括市场领先的信噪比 (SNR)、卓越的极限分辨率和亚纳秒级门控技术。 这些科学
    的头像 发表于 09-19 09:20 235次阅读
    Photonis <b class='flag-5'>科学</b>图像增强器<b class='flag-5'>介绍</b>

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    AI被赋予了人的智能,科学家们希望没有人类的引导下,AI自主的提出科学假设,诺贝尔奖级别的假设哦。 AI驱动科学被认为是科学发现的第五个范
    发表于 09-17 11:45

    能量收集技术物联网设备的应用与解决方案

    应用的热门发展方向。本文将为您介绍能量收集技术物联网设备的应用,以及由Silicon Labs(芯科科技)与合作伙伴所推出的相关解决方案。
    的头像 发表于 08-26 10:15 2913次阅读
    能量收集<b class='flag-5'>技术</b><b class='flag-5'>在</b>物联网设备<b class='flag-5'>上</b>的应用与解决方案

    【书籍评测活动NO.64】AI芯片,从过去走向未来:《AI芯片:科技探索与AGI愿景》

    DeepSeek,大模型应用密集出现、频繁升级,这让作者意识到有必要撰写一新的AI芯片图书,以紧跟时代步伐、介绍新兴领域和最新动向。 这就是《AI芯片:前沿技术与创新未来》的姊妹篇——《AI 芯片
    发表于 07-28 13:54

    【书籍评测活动NO.62】一书读懂 DeepSeek 全家桶核心技术:DeepSeek 核心技术揭秘

    。DeepSeek-V3 的发布几乎没有预热和炒作,仅凭借其出色的效果和超低的成本迅速走红。 DeepSeek-R1 则是 DeepSeek-V3 的基础上构建的推理模型,它在后训练阶段大规模使用强化学习技术
    发表于 06-09 14:38

    《电子电路原理第版》电子教材

    资料介绍电子电路和器件的基本概念、原理及分析方法。内容从半导体器件到功能电路,从电路结构到故障诊断,从理论分析到实际应用。半导体器件包括:二极管、双极型晶体管、结型场效应管、MOS场效应管、晶闸管
    发表于 04-11 15:55

    (专家著作,建议收藏)电机的数学研究方法

    鲁企圖系统地説明电机主要的、最新的数学研究方法。需的材料足够的程度上已包括用于研究电机过渡狀态和稳定 狀态的独特范圓。这些材料应用已經广泛流行的最新
    发表于 04-01 15:02

    国产首款量产型位半万用表!青岛汉泰开启国产高精度测量新篇章。

    的发布标志着国产高端测试仪器领域取得重大突破,也为国产仪器设备的自主创新树立了新标杆。 高精度测量 定义新标准 HDM3075 系列是青岛汉泰在其成熟的 HDM3065 系列基础上,通过技术升级与创新
    发表于 04-01 13:15

    【「芯片通识课:一书读懂芯片技术」阅读体验】图文并茂,全面详实,值得阅读的芯片科普书

    评估是否需要继续阅读下去。 大致浏览下书的目录,可以初步了解书的内容,可以看到是非常全面的。 二.本书特点2.1 本书是一全面的介绍芯片基本知识的科普书,本书一大特点是全面。从芯片的发展历史
    发表于 03-27 16:07

    马达控制必要的知识 三角函数

    ) 控制理论:普拉普斯变换,传递函数,古典控制(比例积分控制),滤波器 技术资料说明的是:三角函数。*附件:马达控制必要的知识 三角函数.pdf
    发表于 03-18 12:23

    NRK3301离线语音识别模块彩灯的应用方案

    的NRK3301语音识别模块。广州九芯电子推出的这款芯片,如何让彩灯摆脱“手动时代”?本文将拆解技术真相!   NRK3301是广州九芯电子专为智能家居场景打造的离线语音识别芯片,主打低成本、低功耗、高抗干扰特性。无需联网、不依赖APP,通过
    的头像 发表于 03-10 14:04 785次阅读
    NRK3301离线语音识别模块<b class='flag-5'>在</b><b class='flag-5'>七</b>彩灯<b class='flag-5'>上</b>的应用方案

    DLPC65404.3.0版下,keystone angles是否可以与keystone corners互相转换?

    如标题,客户想在自动keystone后(TOF采集数据后调整keystone angles),通过keystone corners来进一步进行细微矫正,目前无法已经做keystone的基础上用corners来微调。
    发表于 02-19 08:38

    名单公布!【书籍评测活动NO.57】芯片通识课:一书读懂芯片技术

    基于半导体材料,通过复杂的电路设计和光刻技术硅片构建出极其微小的晶体管和其他电子元件。这些晶体管以二进制的方式存储和处理信息,通过控制电路的通断来实现数据的传输与运算。 一个电子
    发表于 02-17 15:43

    首个科学计算基座大模型BBT-Neutron开源,助力突破大科学装置数据分析瓶颈

    大语言模型能否解决传统大语言模型大规模数值数据分析中的局限性问题,助力科学界大科学装置设计、高能物理领域科学计算? 高能物理是探索宇宙基本
    的头像 发表于 12-26 15:29 1144次阅读
    首个<b class='flag-5'>科学</b>计算基座大模型BBT-Neutron开源,助力突破大<b class='flag-5'>科学</b>装置<b class='flag-5'>数据</b>分析瓶颈