0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

介绍七本在注重打好数据科学的数学基础上的技术读物

DPVg_AI_era 来源:lp 2019-04-19 08:56 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

机器学习和数据科学离不开数学,本文从数学基础的角度入手,推荐了数据科学和机器学习方面的七本参考书以及两本补充读物。相信对打好数学基础的相关人士会有所帮助。

大多数人学习数据科学的人都会把重点放在编程上,实际上编程能力确实是机器学习和数据科学领域的重要技能。但是,要真正精通数据科学和机器学习,必然不能忽视的数据科学背后的数学基础。

出于这个目的,本文介绍了七本在注重打好数据科学的数学基础上的技术读物。当然,涉及到数学,往往阅读体验可能不会很舒服,但要搞好机器学习,数学基础是必须要打牢的,所以努力读书吧!

先说一说为什么在数据科学学习时打好数学基础。

以下是我总结的几个原因:

AI领域无时无刻不在迅速变化。Hinton认为,我们也许应该重新思考反向传播。掌握牢固的数学知识有助于更好地理解AI的演变。一个数学基础深厚的人,对AI的理解和认识与其他仅从表面认识AI的人有很大的区别。此外,掌握数学知识还能更好地了解AI技术带来知识产权的潜力。最后,了解数据科学背后的数学知识,也可以让人更容易获得AI和数据科学的高端职位。

此外,作者推荐这几本书,还有两点个人原因:

1.作者在牛津大学教授物联网数据科学的课程,也包括一些AI技术应用方面的教学事务,在教学过程中涉及到数学基础知识和课程。

2.其次,作者在写一本书来简述人工智能,从数学的角度入手,目标读者是14到18岁的少年。要深入了解数学科学和人工智能数学的数学基础,你需要了解四个方面知识:线性代数,概率论,多元微积分和优化。目前在高中阶段至少会教授这些课程的一部分内容。因此,我试图将高中数学与人工智能和数据科学联系起来,重点是数学建模。

下面进入正题:

(1) The Nature Of Statistical Learning Theory《统计学习理论的本质》

作者:VladimirVapnik

PDF资源:

https://statisticalsupportandresearch.files.wordpress.com/2017/05/vladimir-vapnik-the-nature-of-statistical-learning-springer-2010.pdf

如果说要列一份关于数学的书单,这本书是绕不过去的。本书单中排名第一的就是俄罗斯著名数学家VladimirVapnik的《统计学习理论的本质》。在这份清单中的所有书籍中,Vapnik这本是最不好找的。VladimirVapnik是支持向量机(SVM)的创始人。他的维基百科页面中提供了更多关于他研究成果的介绍。

(2)Pattern Classification(2007-12-24)《模式分类》

作者:RichardODuda

PDF资源:

https://cds.cern.ch/record/683166/files/0471056693_TOC.pdf

就像Vapnik的著作一样,Duda的著作时另一个时代的另一部经典。本书初版于1973年,在二十多年后的2000年才推出第二版,此后一直未再版。时隔近二十年,本书仍然是一个重要资源。本书采用模式识别方法,并涵盖了广泛的算法

(3)

MachineLearning:AnAlgorithmicPerspective,SecondEdition(Chapman&Hall/CrcMachineLearning&PatternRecognition)

《机器学习:算法视角》

PDF资源:

https://doc.lagout.org/science/Artificial%20Intelligence/Machine%20learning/Machine%20Learning_%20An%20Algorithmic%20Perspective%20%282nd%20ed.%29%20%5BMarsland%202014-10-08%5D.pdf

这本书现在已经出版了第二版。此书第一版是我读过的最早的书关于机器学习和算法的著作之一,第二版增加了更多Python代码。与前两本书一样,本书也非常强调算法。

(4)

TheElementsofStatisticalLearning:DataMining,Inference,andPrediction,SecondEdition

《统计学习基础:数据挖掘、推理和预测》(第二版)

作者:TrevorHastie,RobertTibshirani,JeromeFriedman

PDF资源:https://web.stanford.edu/~hastie/Papers/ESLII.pdf

另一本经典之作,可以作为参考书。

(5)Pattern Recognition and Machine Learning (Information Science and Statistics)

《模式识别与机器学习(信息科学与统计)》

作者:ChristopherM.Bishop

PDF资源:http://users.isr.ist.utl.pt/~wurmd/Livros/school/Bishop%20-%20Pattern%20Recognition%20And%20Machine%20Learning%20-%20Springer%20%202006.pdf

ChristopherM.Bishop的模式识别和机器学习(信息科学和统计学)也是一本深入而精心设计的参考书。

(6)

MachineLearning:TheArtandScienceofAlgorithmsthatMakeSenseofData

作者:PeterFlach

PDF资源:http://www.cs.put.poznan.pl/tpawlak/files/ZMIO/W02.pdf

我喜欢PeterFlach的书,尽管亚马逊网站上的一些评论说这书写得太罗嗦,而且代码量显得不足。我特别喜欢这本书中的算法分组(逻辑模型,线性模型,概率模型)章节以及这些主题的整体讲述方式。

最后,是我最推荐的一本书:

(7)Deep Learning《深度学习

作者:Goodfellow、Bengio、Corville

相关资源:https://www.deeplearningbook.org/

如果你在找一本值得逐页读完的书,就是它了!这本书既详细,又有现代感,书中内容几乎涵盖了你能想到的关于深度学习的一切知识。

补充两本书:

A First Course in Machine Learning, Second Edition (Machine Learning & Pattern Recognition) by Simon Rogers, Mark Girolami

作者:SimonRogers,MarkGirolami

我觉得这本书并不太适合初学者,但它仍然是一本好书(特别是第二版)

MachineLearning:AProbabilisticPerspective

作者:KevinMurphy

这本书中评价也很高,但我个人没有读过(因此没有收集)。

写在最后:

除了最后一本《深度学习》之外,我建议其他书不必逐页阅读,而是将其作为参考书,根据需要按相应主题阅读相应的书籍。这些书教会了我时刻保持谦逊。无论我们现在知道了多少,掌握了多少知识,都总能在阅读过程中发现,这个领域原来是如此的庞大和复杂。

这些书已经超越了时间。VladimirVapnik现年已经81岁。Duda的著作初版于1973年。我预计50年以后,这个行业里的人们仍然会阅读这些著作。就像与那些经历了时间考验的老朋友们重逢一样。多年之后,也许你会发现,在眼花缭乱的技术、模型和框架背后,数学是永恒的。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41156

    浏览量

    302624
  • 机器学习
    +关注

    关注

    67

    文章

    8565

    浏览量

    137228
  • 数据科学
    +关注

    关注

    0

    文章

    168

    浏览量

    10826

原文标题:【荐书】提升机器学习数学基础,这7本书一定要读(附pdf资源)

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    使用NORDIC AI的好处

    原始传感器数据,可显著降低功耗、延长电池寿命。[Edge AI 概述; Nordic Edge AI 技术页] 降低云依赖与时延 直接在设备做推理,很多决策可以“本地实时”完成,不必等云端响应
    发表于 01-31 23:16

    算力赋能,打造生命科学新范式

    云端算力驱动生命科学创新,实现百万样本高效分析     某生命科学研究院推出的生命科学数据分析平台,是一款基于云架构、由AI驱动的多组学在线分析平台,以
    的头像 发表于 01-12 14:01 563次阅读

    从手工到自动:焊球剪切测试的技术演进与科学原理

    现代微电子制造领域,引线键合的质量检测经历了从手工操作到自动测试的重要演进。早期,技术人员仅使用镊子等简单工具进行焊球剪切测试,这种手工方法虽然直观,但存在操作一致性差、测试精度低等明显局限。今天
    发表于 12-31 09:12

    不止于数学:实际部署是筑牢后量子安全的关键环节

    研究院(NIST)已选定CRYSTALS-Kyber、CRYSTALS-Dilithium等算法推进标准化,这些算法均建立研究充分、数学层面稳健的基础上。然而,仅有强大的算法设计还远远不够,如果部署过程存在安全隐患,密码系统仍
    的头像 发表于 11-21 15:57 542次阅读
    不止于<b class='flag-5'>数学</b>:实际部署是筑牢后量子安全的关键环节

    Channel Sounding技术

    它是蓝牙 6.0 核心规范中新增的信道探测技术,主打两台低功耗蓝牙连接设备间的高精度测距,物联网、消费电子等领域应用广泛,以下是其详细介绍: 核心工作原理 该技术以基于相位的测距
    发表于 11-13 17:00

    AES加解密算法逻辑实现及其蜂鸟E203SoC的应用介绍

    这次分享我们会简要介绍AES加解密算法的逻辑实现,以及如何将AES算法做成硬件协处理器集成蜂鸟E203 SoC。 AES算法介绍 AES算法属于对称密码算法中的分组密码,其明文/
    发表于 10-29 07:29

    利用 Banana Pi BPI-CM5 Pro(ARMSoM CM5 SoM) 加速保护科学

    损坏的风险(所有浸入水中的技术设备都是如此),这意味着数据可能会在不知不觉中丢失,而基线数据集的后续缺口可能会妨碍科学家得出具有统计意义的可靠结论。
    发表于 10-27 09:18

    用FPGA实现DDR控制模块介绍

    Random Access Memory)是DDR SDRAM的第三代产品,相较于DDR2,DDR3具有更高的运行性能与更低的电压。DDR SDRAM是SDRAM技术基础上发展改进而来的,同SDRAM相比
    发表于 10-21 08:43

    Photonis 科学图像增强器介绍

    对于寻求先进图像增强技术的增强相机制造商,Photonis 提供具有无与伦比规格的科学级图像增强管。其中包括市场领先的信噪比 (SNR)、卓越的极限分辨率和亚纳秒级门控技术。 这些科学
    的头像 发表于 09-19 09:20 513次阅读
    Photonis <b class='flag-5'>科学</b>图像增强器<b class='flag-5'>介绍</b>

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    AI被赋予了人的智能,科学家们希望没有人类的引导下,AI自主的提出科学假设,诺贝尔奖级别的假设哦。 AI驱动科学被认为是科学发现的第五个范
    发表于 09-17 11:45

    能量收集技术物联网设备的应用与解决方案

    应用的热门发展方向。本文将为您介绍能量收集技术物联网设备的应用,以及由Silicon Labs(芯科科技)与合作伙伴所推出的相关解决方案。
    的头像 发表于 08-26 10:15 3443次阅读
    能量收集<b class='flag-5'>技术</b><b class='flag-5'>在</b>物联网设备<b class='flag-5'>上</b>的应用与解决方案

    【书籍评测活动NO.64】AI芯片,从过去走向未来:《AI芯片:科技探索与AGI愿景》

    DeepSeek,大模型应用密集出现、频繁升级,这让作者意识到有必要撰写一新的AI芯片图书,以紧跟时代步伐、介绍新兴领域和最新动向。 这就是《AI芯片:前沿技术与创新未来》的姊妹篇——《AI 芯片
    发表于 07-28 13:54

    【「DeepSeek 核心技术揭秘」阅读体验】书籍介绍+第一章读后心得

    DeepSeek 提升效率和性能方面的不懈追求。 第4章关于 DeepSeek-R1 的技术剖析同样精彩纷呈。预备知识的介绍为读者理解后续内容打下了坚实的基础。对 DeepSeek-R1-Zero 的组
    发表于 07-17 11:59

    【书籍评测活动NO.62】一书读懂 DeepSeek 全家桶核心技术:DeepSeek 核心技术揭秘

    。DeepSeek-V3 的发布几乎没有预热和炒作,仅凭借其出色的效果和超低的成本迅速走红。 DeepSeek-R1 则是 DeepSeek-V3 的基础上构建的推理模型,它在后训练阶段大规模使用强化学习技术
    发表于 06-09 14:38

    电机系统节能关键技术及展望

    节约能源既是我国经济和社会发展的一项长远战略和基本国策,也是当前的紧迫任务。论文深入分析国内外电机系统节能现状和介绍先进的节能关键技术基础上,指出了现阶段我国
    发表于 04-30 00:43