机器学习和数据科学必读的10本免费在线电子书和书的详细介绍

算法与数据结构 2018-07-01 11:04 次阅读

1. 《Python 数据科学手册》

机器学习和数据科学必读的10本免费在线电子书和书的详细介绍

本书介绍了在Python中处理数据所必需的核心库:特别是IPython,NumPy,Pandas,Matplotlib,Scikit-Learn和相关软件包。读这本书,你需要有Python基础,如果你没有Python基础可以先读《A Whirlwind Tour of Python》这本书是针对Python语言快速入门的书

书籍链接:https://github.com/jakevdp/PythonDataScienceHandbook

2. 《Neural Networks and Deep Learning》

机器学习和数据科学必读的10本免费在线电子书和书的详细介绍

是一本免费的在线书籍。这本书主要概述两大核心概念:

神经网络,一个编程范例,使计算机可以从观测数据中学习

深度学习,这是一套强大的神经网络学习技术

神经网络和深度学习目前为图像识别,语音识别和自然语言处理中的许多问题提供了最佳解决方案。本书将教授许多神经网络和深度学习背后的核心概念。

书籍链接:http://neuralnetworksanddeeplearning.com/

3. 《贝叶斯思维》

机器学习和数据科学必读的10本免费在线电子书和书的详细介绍

think X系列的书籍之一,大多数讲贝叶斯统计的书,都是用数学符号,以数学概念(如微积分)为基础展开的,此书则用Python代码代替数学符号,用离散数学代替连续数学。这样一来,数学里的积分变成了求和,概率分布的运算大多成了简单的循环。

书籍链接:http://greenteapress.com/wp/think-bayes/

4. 《Machine Learning & Big Data》

机器学习和数据科学必读的10本免费在线电子书和书的详细介绍

这本书目前算是一部还没完结的作品,其目的是为了让软件工程师可以在不依赖库的情况下就能轻松构建机器学习模型,从而在理论和实践中获得平衡,大多数情况下,模型背后的概念或技术都很简单或者说比较直观,但是细节和术语上就容易出问题。

另外,现有的库基本可以解决现有的问题。更多的时候它们有自己的抽象和架构来隐藏底层概念。本书的目的就是为了让基本概念更清晰。

书籍链接:http://www.kareemalkaseer.com/books/ml

5. 《Statistical Learning with Sparsity》

机器学习和数据科学必读的10本免费在线电子书和书的详细介绍

在过去的十年中,计算和信息技术出现了爆炸性增长。随着它在各种领域如医学,生物学,金融和市场营销中涌现出大量的数据。本书在一个通用的概念框架中阐述了这些领域重要的数据科学思想。

书籍链接:https://web.stanford.edu/~hastie/StatLearnSparsity/

6. 《Statistical inference for data science》

机器学习和数据科学必读的10本免费在线电子书和书的详细介绍

本书是作为数据科学专业领域的书籍,也是一部有关推论统计学的 Coursera配套书。值得一提的是,这本书有配套的Coursera课程视频,可以在YouTube上找到。

本书旨在作为推论统计学的入门书籍。目标受众是具有数学和计算机编程基础的学生,他们希望将这些技能用于数据科学或统计学。这本书是免费提供的。

书籍链接:https://leanpub.com/LittleInferenceBook

7. 《凸优化》

机器学习和数据科学必读的10本免费在线电子书和书的详细介绍

这是一本关于凸优化的书,凸优化是一类特殊的数学优化问题,它包括最小二乘法和线性规划问题。众所周知,最小二乘法和线性规划问题具有相当完善的理论,出现在各种应用中,并且这些问题可以用编程来解决。这本书主要是面向实际应用,丰富的案例是本书的特色

书籍链接:http://stanford.edu/~boyd/cvxbook/

8. 《Python 自然语言处理 》

机器学习和数据科学必读的10本免费在线电子书和书的详细介绍

这是一本关于自然语言处理的书。“自然语言”是指用于人类日常交流的语言,如英语,印地语或葡萄牙语等语言。与诸如编程语言和数学符号这样的人造语言相比,自然语言在代代相传的过程中不断发展,并且很难用明确的规则来确定。我们将在广义上采用自然语言处理(或简称NLP)来表示计算机对自然各种不同的自然语言的理解...

本书基于Python编程语言和一个自然语言工具包(NLTK)的开源库。

书籍链接:https://automatetheboringstuff.com/https://www.nltk.org/book/

9. 《Python 编程快速上手》

机器学习和数据科学必读的10本免费在线电子书和书的详细介绍

如果您曾花费数小时重命名文件或更新数百个电子表格单元格,你就能体会这些工作是多么的乏味。但是如果你可以让你的电脑帮你做这些事,那感觉就不一样了

看完这本书,你可以通过编写Python程序,可以让计算机自动完成它们,本书适合任何想要通过Python学习编程的读者,尤其适合缺乏编程基础的初学者。

书籍链接:https://automatetheboringstuff.com/

10. 《社会媒体挖掘》

机器学习和数据科学必读的10本免费在线电子书和书的详细介绍

社交媒体在过去十年的发展已经彻底改变了人们的交流方式和行业开展业务的方式。个人通过社交媒体互动,共享和内容消费并以前所未有速度产生大量的数据。

本书集成了近年来社会媒体、社会网络分析以及数据挖掘的前沿成果,为学生、从业者、研究人员和项目经理提供了一个方便的平台,以便理解社会媒体挖掘的基础知识和潜能。本书介绍了社会媒体数据的问题,并阐述了网络分析和数据挖掘的基本概念、新问题以及有效的算法。

原文标题:10本必读的机器学习和数据科学免费在线电子书

文章出处:【微信号:TheAlgorithm,微信公众号:算法与数据结构】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
分享:

评论

相关推荐

深入探讨Uber机器学习平台当前的发展趋势和目标

2017年9月Uber向大家介绍了自己的机器学习平台:Michelangelo。本文我们为大家总结了....

的头像 电子发烧友网工程师 发表于 11-19 08:47 25次 阅读
深入探讨Uber机器学习平台当前的发展趋势和目标

利用机器学习和新数据收集工具的结合,预测和定位野火

他和他的同事一直在使用GOES-15,这是一颗于2010年发射的卫星,使用过去的图像和其他州的火灾报....

的头像 新智元 发表于 11-18 09:52 373次 阅读
利用机器学习和新数据收集工具的结合,预测和定位野火

除Google、Facebook以外的公司们,该如何打造自己的机器学习团队?

机器学习研究人员喜欢做研究,而管理者则欺骗自己:研究人员正在构建有价值的IP。事实上,他们并非如此。....

的头像 新智元 发表于 11-18 09:46 320次 阅读
除Google、Facebook以外的公司们,该如何打造自己的机器学习团队?

谷歌云现任CEO Diane Greene宣布自己即将离职

今年2月,Pichai向分析师表示,整个云计算业务(包括电子邮件、文字处理、电子表格以及公共云基础设....

的头像 新智元 发表于 11-18 09:34 264次 阅读
谷歌云现任CEO Diane Greene宣布自己即将离职

在Python中创建API的具体操作

Jupyter Notebook非常适合处理有关Python、R和markdown的东西。但一旦涉及....

的头像 论智 发表于 11-18 08:58 202次 阅读
在Python中创建API的具体操作

机器学习框架Tensorflow 2.0的这些新设计你了解多少

几天前,Tensorflow刚度过自己的3岁生日,作为当前最受欢迎的机器学习框架,Tensorflo....

的头像 论智 发表于 11-17 11:33 563次 阅读
机器学习框架Tensorflow 2.0的这些新设计你了解多少

2017年中国人工智能发展和研究趋势报告

2017年中国人工智能发展和研究趋势报告

的头像 WPR 发表于 11-17 11:14 398次 阅读
2017年中国人工智能发展和研究趋势报告

123个Python渗透测试工具你了解多少黑客资源

今天的文章来源于dloss/python-pentest-tools,本文中列举了123个Pytho....

的头像 马哥Linux运维 发表于 11-17 11:10 317次 阅读
123个Python渗透测试工具你了解多少黑客资源

机器学习的下一个杀手级应用是什么

机器学习的研究正进行的如火如荼,各种新方法层出不穷。尽管这样,还有一个问题摆在面前,研究这些算法对于....

的头像 人工智能 发表于 11-17 09:34 166次 阅读
机器学习的下一个杀手级应用是什么

机器学习处理数据为什么把连续性特征离散化

在学习机器学习中,看过挺多案例,看到很多人在处理数据的时候,经常把连续性特征离散化。为此挺好奇,为什....

的头像 Imagination Tech 发表于 11-17 09:31 170次 阅读
机器学习处理数据为什么把连续性特征离散化

集合论:现代数学的共同基础

先说说分析(Analysis)吧,它是从微积分(Caculus)发展起来的——这也是有些微积分教材名....

的头像 悟空智能科技 发表于 11-16 17:21 292次 阅读
集合论:现代数学的共同基础

如何使用贝叶斯判别准则进行机械设备泄露区域的全自动检测

大型机械设备安装过程复杂、繁琐,要求密闭的区域常常出现泄漏,传统检测泄漏的方法效率低,成本高,针对这....

发表于 11-16 17:17 21次 阅读
如何使用贝叶斯判别准则进行机械设备泄露区域的全自动检测

盘点2018年人工智能发展的8个预测方向

人工智能非常复杂,而且发展速度很快。任何人都不可能对其未来几年的发展方向做出准确的预测。但就人工智能....

的头像 中山市物联网协会 发表于 11-16 17:06 900次 阅读
盘点2018年人工智能发展的8个预测方向

利用AI提高性能和降低功耗及重塑芯片的设计

随着架构师开始利用 AI 提高性能和降低功耗,并为未来芯片的开发、制造和更新奠定基础,人工智能也开始....

的头像 机器人博览 发表于 11-16 16:46 421次 阅读
利用AI提高性能和降低功耗及重塑芯片的设计

Cadence推出通过硅验证的长距离7nm 112G SerDes IP

移动数据消费的升级,人工智能、机器学习的应用以及5G通信的发展都依赖于不断增加的带宽,对现有的云数据....

的头像 Cadence楷登 发表于 11-16 16:39 291次 阅读
Cadence推出通过硅验证的长距离7nm 112G SerDes IP

python3如何取出重复3次的字符串保存为3列

本文档的主要内容详细介绍的是python3如何取出重复3次的字符串保存为3列详细资料免费下载C语言资....

发表于 11-16 16:17 21次 阅读
python3如何取出重复3次的字符串保存为3列

机器学习中应用数学应该要注意的几点注记

本章讨论的主题是我觉得在应用机器学习(和其他地方)中经常假设的,但是很少详细解释。这项工作是针对学生....

发表于 11-16 16:17 43次 阅读
机器学习中应用数学应该要注意的几点注记

如何使用序贯线性贝叶斯的RFID标签数量估计算法提高效率

为解决现有标签数量估计算法中估计精度与复杂度之间的矛盾,在分析比较现有算法的基础上,提出一种基于序贯....

发表于 11-16 15:37 23次 阅读
如何使用序贯线性贝叶斯的RFID标签数量估计算法提高效率

如何利用大数据和人工智能技术来为数亿的求职者和招聘者提供高效服务

用户在领英上传个人简历,平台会推荐适合求职者的工作职位,但首先,领英需要了解你的背景,从哪个学校毕业....

的头像 电子发烧友网工程师 发表于 11-16 11:07 232次 阅读
如何利用大数据和人工智能技术来为数亿的求职者和招聘者提供高效服务

如何利用大数据和人工智能技术来为数亿的求职者和招聘者提供高效服务

用户在领英上传个人简历,平台会推荐适合求职者的工作职位,但首先,领英需要了解你的背景,从哪个学校毕业....

的头像 电子发烧友网工程师 发表于 11-16 11:07 430次 阅读
如何利用大数据和人工智能技术来为数亿的求职者和招聘者提供高效服务

李飞飞和李佳的相继离职,给谷歌中国AI中心的发展蒙上了一层阴影

其实,李飞飞和李佳师徒一直对 AI + 医疗情有独钟。此前李佳在接受 The Hindu 采访时曾表....

的头像 电子发烧友网工程师 发表于 11-16 10:59 542次 阅读
李飞飞和李佳的相继离职,给谷歌中国AI中心的发展蒙上了一层阴影

Python你为何这么厉害,这么嚣张?

在中国,Python相关职位的需求量依然集中在三大经济圈,特别是在北京、上海、深圳这几个城市。从行业....

的头像 电子发烧友网工程师 发表于 11-16 10:54 311次 阅读
Python你为何这么厉害,这么嚣张?

Kaggle大师访谈:他是怎么驰骋机器学习竞赛的

我喜欢当背包客和攀岩。如果你早晨也去旧金山的Mission Cliffs室内攀岩馆攀岩,下次见面时我....

的头像 论智 发表于 11-16 09:17 328次 阅读
Kaggle大师访谈:他是怎么驰骋机器学习竞赛的

笨办法学python,python语言入门

想学习python的小白可以看看哦,很经典的书籍,书名就是标题哦...

发表于 11-15 23:53 36次 阅读
笨办法学python,python语言入门

VMAF的最新应用进展,以及VMAF正在做的改进工作

在FFmpeg社区的帮助下,我们将VMAF模型打包到一个名为libvmaf的C代码库中。该库提供了一....

的头像 LiveVideoStack 发表于 11-15 17:06 399次 阅读
VMAF的最新应用进展,以及VMAF正在做的改进工作

Python编码风格不可不知 没准要靠它吃饭

Python会将圆括号,中括号和花括号中的行隐式的连接起来,你可以利用这个特点.如果需要,你可以在表....

的头像 嵌入式资讯精选 发表于 11-15 16:28 240次 阅读
Python编码风格不可不知 没准要靠它吃饭

如何使用Word2vec模型进行古诗词个性化推荐的应用

古诗词是中华优秀传统文化上璀璨的明珠,两千年来,我国优秀诗人辈出,其诗作若满天繁星,内容丰富影响深远....

发表于 11-15 16:15 27次 阅读
如何使用Word2vec模型进行古诗词个性化推荐的应用

机器学习教程之使用matlab研究机器学习的资料概述

机器学习教计算机执行人和动物与生俱来的活动:从经验中学习。机器学习算法使用计算方法直接从数据中“学习....

发表于 11-15 15:35 95次 阅读
机器学习教程之使用matlab研究机器学习的资料概述

机器学习入门资料之机器学习的详细资料介绍

机器学习是计算机科学的一个子领域,根据Arthur Samuel在1959年提出的,它赋予“计算机在....

发表于 11-15 15:35 49次 阅读
机器学习入门资料之机器学习的详细资料介绍

机器学习入门教程之机器学习资料合集免费下载包括了资料和复习题

机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论....

发表于 11-15 15:35 36次 阅读
机器学习入门教程之机器学习资料合集免费下载包括了资料和复习题

谷歌云AI主管安德鲁•摩尔:与美国政府和军队合作不会停止

内基•梅隆大学有一个项目,设计了一个70英尺高的机器人,用来捡起巨大的混凝土板,并迅速建造防洪堤。这....

的头像 人工智能学家 发表于 11-15 15:00 517次 阅读
谷歌云AI主管安德鲁•摩尔:与美国政府和军队合作不会停止

NetApp亦取代HPE成为本轮Gartner通用驱动器阵列报告中的最强供应商

作为西部数据公司旗下的新力量,Tegile目前处于挑战者区间当中,这显然是因为Gartner公司认为....

的头像 存储界 发表于 11-15 14:46 194次 阅读
NetApp亦取代HPE成为本轮Gartner通用驱动器阵列报告中的最强供应商

怎么用Python玩GTA5?跟着教程玩!

好了,第一步,我们如何实现读取屏幕画面?我一直在想可以做,但还真没想过怎么做。所以,Google!我....

的头像 马哥Linux运维 发表于 11-15 12:55 302次 阅读
怎么用Python玩GTA5?跟着教程玩!

探讨可用性对人工智能技术的影响力

安德鲁·摩尔是谷歌云AI业务的新主管,这个部门致力于提供机器学习工具和技术在普通企业中的可用性和实用....

的头像 摄像头观察 发表于 11-14 15:55 500次 阅读
探讨可用性对人工智能技术的影响力

中国超美、日成全球AI专利申请第一,自然语言处理受全球热捧

本文摘选自中国专利保护协会报告,对人工智能技术在世界范围内和在我国的专利申请数据进行了深入分析,旨在....

发表于 11-14 14:13 347次 阅读
中国超美、日成全球AI专利申请第一,自然语言处理受全球热捧

机器学习的关键点是什么 数据量比算法还重要

相关性并不意味着因果关系这一点被频繁提起,以至于都不值得再批评。但是,我们讨论的某类模型可能只学习相....

发表于 11-14 10:19 60次 阅读
机器学习的关键点是什么 数据量比算法还重要

值得研究的四大机器学习策略分析

机器学习有四种广受认可的形式:监督式、无监督式、半监督式和强化式。在研究文献中,这些形式得到了深入的....

发表于 11-14 10:17 42次 阅读
值得研究的四大机器学习策略分析

大数据需要用到什么编程语言

R经常被称为是“统计人员为统计人员开发的一种语言”。如果你需要深奥的统计模型用于计算,可能会在CRA....

发表于 11-14 09:44 113次 阅读
大数据需要用到什么编程语言

根据数据科学家最常使用的四种编程语言推荐相应的IDE

PyCharm包括很多工具,集成的调试器和测试运行器,性能调试工具,内置终端,集成主要版本控制系统(....

的头像 论智 发表于 11-14 09:01 236次 阅读
根据数据科学家最常使用的四种编程语言推荐相应的IDE

机器学习技术如何解决5G承载网运营难题

5G商用时间越来越近,留给运营商建设5G承载网的时间已经不多了。根据预测,5G时代普通用户的每个月数....

发表于 11-13 16:53 96次 阅读
机器学习技术如何解决5G承载网运营难题

使用机器学习的方法来管理自动、半自动和有人类驾驶车辆共享道路的交通

要想建立一个公平的具有可比性的框架,首先要解决怎么比对的问题:“除非我们处理同样的问题,否则很难比较....

的头像 将门创投 发表于 11-13 09:38 290次 阅读
使用机器学习的方法来管理自动、半自动和有人类驾驶车辆共享道路的交通

街机游戏《街头霸王 3》中进行模拟来训练改进强化学习算法的工具包

实际上该工具包与模拟器本身不需要太多的交互,只需要查找和内部状态相关联的内存地址,同时用所选取的环境....

的头像 电子发烧友网工程师 发表于 11-13 09:30 206次 阅读
街机游戏《街头霸王 3》中进行模拟来训练改进强化学习算法的工具包

AI画作被佳士得拍卖无疑是一座里程碑,但外界对此有什么看法呢?

对抗网络的基本概念是非常强大的,如今各种生成式对抗网络(GAN)是机器学习的基石。它们为 AI 艺术....

的头像 电子发烧友网工程师 发表于 11-13 09:26 439次 阅读
AI画作被佳士得拍卖无疑是一座里程碑,但外界对此有什么看法呢?

开源工具就是你数据科学入门时所需的全部内容

如你所见,它返回一个列表,每个数字预测训练集中每个记录的武器。我们之所以看到的是数字而不是武器名称,....

的头像 电子发烧友网工程师 发表于 11-12 14:15 191次 阅读
开源工具就是你数据科学入门时所需的全部内容

AI会不会像Android和iOS一样,五年后归于平淡?转型AI真的有必要吗?

工业界未来需要什么样的机器学习人才?老生常谈,能将模型应用于专业领域的人,也就是跨领域让机器学习落地....

的头像 电子发烧友网 发表于 11-12 11:10 371次 阅读
AI会不会像Android和iOS一样,五年后归于平淡?转型AI真的有必要吗?

半路“出家”如何逆袭科班程序员?

能混到腾讯面试,我也很意外,居然没有被刷简历刷掉。我没有通过腾讯的社招平台投简历,而是在 V2EX ....

的头像 电子发烧友网 发表于 11-12 11:06 628次 阅读
半路“出家”如何逆袭科班程序员?

使用最新固件2.40的DMM 34410A无法读取统计结果

使用最新固件版本2.40的DMM 34410A无法读取统计结果使用python我发送流命令:已发送:'SYST:PRES'已发送:'* RST...

发表于 11-08 10:22 33次 阅读
使用最新固件2.40的DMM 34410A无法读取统计结果

人工智能机器学习程序可分析患者肺癌肿瘤影像

美国纽约大学医学院研究者报告的一种新的美国纽约大学医学院研究者报告的一种新的人工智能/机器学习程序可分析患者肺癌肿瘤影像...

发表于 11-08 06:45 135次 阅读
人工智能机器学习程序可分析患者肺癌肿瘤影像

分享一个官网下载下来的labview/enthought python integration toolkit

分享一个官网上用ftp一个一个下载下来的labview/enthought python integration toolkit 对于不能从官网下载或者无法联网的童鞋...

发表于 11-08 01:06 85次 阅读
分享一个官网下载下来的labview/enthought python integration toolkit

学习传感器的五大技巧

    传感器的数量在整个地球表面和人们生活周遭空间激增,提供世界各种数据讯息。这些价格亲民的传感器是物联网(IoT...

发表于 11-07 16:06 73次 阅读
学习传感器的五大技巧

关于KiCad电子开发应用的Wayne Stambaugh访谈

在我担任Digi-Key数字设计工具项目经理期间,我有机会与我们的许多供应商和开发人员进行互动。 最近,我有机会采访了Motion ...

发表于 11-01 15:50 155次 阅读
关于KiCad电子开发应用的Wayne Stambaugh访谈

patyon爬虫技术PDF课件分享

patyon爬虫技术PDF课件

发表于 10-31 16:08 110次 阅读
patyon爬虫技术PDF课件分享

从D435获得完整的点云但数据集不完整

使用Python代码,我们从D435捕获中获得点云,但它过滤掉了一些点(可能是那些具有NaN值的点)并导致数据集不完整。 1280x7...

发表于 10-30 11:27 85次 阅读
从D435获得完整的点云但数据集不完整

PNA-N5222A使用Python进行Power Sweep

你有一个示例Python代码来控制PNA(如N522A)在固定频率(比如5 GHz)的FET放大器DUT上进行功率扫描(比如Pin = ...

发表于 10-29 15:50 49次 阅读
PNA-N5222A使用Python进行Power Sweep

VisaIOError:VI_ERROR_CONN_LOST连接丢失

嗨,我们正在用Python编写一个代码来控制DS0X-3024A自动进行电源轨噪声测量,并在USB中保存快照。 主要功能:设置通道参...

发表于 10-25 11:13 61次 阅读
VisaIOError:VI_ERROR_CONN_LOST连接丢失