Python机器学习基础教程PDF版电子书免费下载

资料大小: 16.85 MB

所需积分: 0

下载次数:

用户评论: 0条评论,查看

上传日期: 2019-03-04

上 传 者: 丑书哇哈哈他上传的所有资料

资料介绍

标签:python(834)机器学习(2200)人工智能(12915)

  本书是机器学习入门书,以 Python 语言介绍。主要内容包括 :机器学习的基本概念及其应用 ;实践中最常用的机器学习算法以及这些算法的优缺点 ;在机器学习中待处理数据的呈现方式的重要性,以及应重点关注数据的哪些方面 ;模型评估和调参的高级方法,重点讲解交叉验证和网格搜索 ;管道的概念 ;如何将前面各章的方法应用到文本数据上,还介绍了一些文本特有的处理方法。

  本书适合机器学习从业者或有志成为机器学习从业者的人阅读。

  目前,从医疗诊断和治疗到在社交网络上寻找好友,许多商业应用和研究项目都离不开机器学习。许多人以为,只有大公司的大型研究团队才能用到机器学习。在本书中,我们要向你展示,自己动手构建机器学习解决方案是多么容易的一件事,也将介绍如何将这件事做到最好。学完本书中的知识,你可以自己构建系统,研究 Twitter 用户的情感,或者对全球变暖做出预测。机器学习的应用十分广泛,如今的海量数据使得其应用范围更是远超人们的想象。

  本书是为机器学习从业者或有志成为机器学习从业者的人准备的,他们在为现实生活中的机器学习问题寻找解决方案。这是一本入门书,不需要读者具备机器学习或人工智能(artificial intelligence,AI)的相关知识。我们主要使用 Python 和 scikit-learn 库,一步一步构建一个有效的机器学习应用。我们介绍的方法适用于科学家和研究人员,也会对开发商业应用的数据科学家有所帮助。如果你对 Python 以及 NumPy 和 matplotlib 库有所了解的话,将能够更好地掌握本书的内容。

  我们刻意不将数学作为重点,而是将机器学习算法的实践作为重点。数学(尤其是概率论)是机器学习算法的基石,所以我们不会详细分析算法的细节。如果你对机器学习算法的数学部分感兴趣,我们推荐阅读 Trevor HasTIe、Robert TIbshirani 和 Jerome Friedman 合著的《统计学习基础》(Elements of StaTIsTIcal Learning,Springer 出版社)一书,可以在几位作者的网站上免费阅读这本书(http://statweb.stanford.edu/~tibs/ElemStatLearn/)。我们也不会从头讲解如何编写机器学习算法,而是将重点放在如何应用 scikit-learn 库和其他库中已经实现的海量模型。

  本书的结构大致如下。

  • 第 1 章介绍机器学习的基本概念及其应用,并给出本书会用到的基本设置。

  • 第 2 章和第 3 章介绍实践中最常用的机器学习算法,并讨论这些算法的优缺点。

  • 第 4 章介绍在机器学习中待处理数据的呈现方式的重要性,以及应重点关注数据的哪些方面。

  • 第 5 章介绍模型评估和调参的高级方法,重点讲解交叉验证和网格搜索。

  • 第 6 章解释管道的概念。管道用于串联多个模型并封装工作流。

  • 第 7 章介绍如何将前面各章讲述的方法应用到文本数据上,还介绍了一些文本特有的处理方法。

  • 第 8 章对全书进行总结,还介绍了有关更高级主题的参考资料。

  虽然第 2 章和第 3 章给出了实际算法,但对于初学者来说,并不需要理解所有这些算法。如果你想要尽快构建一个机器学习系统,我们建议你首先阅读第 1 章和第 2 章的开始部分,里面介绍了所有的核心概念。然后你可以翻到 2.5 节,里面提到了我们介绍的所有监督学习模型。从中选择最适合你需求的模型,然后翻回到对应小节阅读其详细内容。之后你可以使用第 5 章中的方法对你的模型进行评估和调参。

  机器学习(machine learning)是从数据中提取知识。它是统计学、人工智能和计算机科学交叉的研究领域,也被称为预测分析(predictive analytics)或统计学习(statistical learning)。近年来,机器学习方法已经应用到日常生活的方方面面。从自动推荐看什么电影、点什么食物、买什么商品,到个性化的在线电台和从照片中识别好友,许多现代化网站和设备的核心都是机器学习算法。当你访问像 Facebook、Amazon 或 Netflix 这样的复杂网站时,很可能网站的每一部分都包含多种机器学习模型

  除了商业应用之外,机器学习也对当前数据驱动的研究方法产生了很大影响。本书中介绍的工具均已应用在各种科学问题上,比如研究恒星、寻找遥远的行星、发现新粒子、分析 DNA 序列,以及提供个性化的癌症治疗方案。

  不过,如果想受益于机器学习算法,你的应用无需像上面那些例子那样给世界带来重大改变,数据量也用不着那么大。本章将解释机器学习如此流行的原因,并探讨机器学习可以解决哪些类型的问题。然后将向你展示如何构建第一个机器学习模型,同时介绍一些重要的概念。

用户评论

查看全部 条评论

发表评论请先 , 还没有账号?免费注册

发表评论

用户评论
技术交流、我要发言! 发表评论可获取积分! 请遵守相关规定。
上传电子资料