【四旋翼飞行器】76小时吃透四轴算法!史上最强软硬结合实战项目,👉戳此立抢👈

为什么Jupyter Notebook会比其他工具更受欢迎?

论智 2018-05-31 09:27 次阅读

对于机器学习和数据科学的入门者来说,“有什么好用的IDE/环境/工具?”是他们提出的最常见的问题之一。这确实也是个不怎么好回答的问题,因为它没有具体选项——从面向特定语言的IDE(如R Studio、PyCharm)到Sublime Text、Atom等编辑器——它们都很优秀,所以如果你有选择恐惧症,你最好读读论智的这篇文章,从Jupyter Notebook开始学起。

如果每个数据科学家都应该使用或必须使用一种工具,毫无疑问,它就是Jupyter Notebook(曾用名iPython Notebook)。Jupyter Notebook是一个交互式笔记本,它功能强大,支持40多种编程语言,可共享,并提供在同一环境中构建可视化应用的服务。

数据科学家可以在上面创建和共享自己的文档,从实现代码到全面报告,Jupyter Notebook大大简化了开发者的工作流程,帮助他们实现更高的生产力和更简单的多人协作。也正是因为如此,它一直以来都是数据科学家们最喜欢的工具之一。

本文将全面介绍笔记本的安装、操作方法,并深入探讨它的特性和优势。当你读完全文后,我们希望你能找到用Jupyter Notebook帮助自己实现机器学习项目的灵感。

1. 什么是Jupyter Notebook?

Jupyter Notebook是一个开源的Web应用程序,旨在方便开发者创建和共享代码文档。

它提供了一个环境,用户可以在里面写代码、运行代码、查看结果,并在其中可视化数据。鉴于这些优点,Jupyter Notebook成了数据科学家眼里的一款人见人爱的工具,它能帮助他们便捷地执行各种端到端任务,如数据清洗、统计建模、构建/训练机器学习模型等。

而对于初学者,Jupyter Notebook也独具魅力。它的一个特色是允许把代码写入独立的cell中,然后单独执行。这样做意味着用户可以在测试项目时单独测试特定代码块,无需从头开始执行代码。虽然其他的IDE环境(如RStudio)也提供了这种功能,但就个人使用情况来看,Jupyter Notebook的单元结构是设计的最好的。

这个笔记本的优势还体现在灵活性和交互性上。Jupyter Notebook支持的编程语言数量高达40余种,除了最基础的Python,它还允许用户在上面运行R语言和SQL等语言。由于它比IDE平台更具交互性,用户也更乐于在各种教程中用它展示代码。

2. 如何安装Jupyter Notebook?

Jupyter Notebook原来也叫iPython Notebook,顾名思义,它和Python关系紧密。如果要在PC上安装笔记本,首先你要确保自己已经安装了Python(2.7/3.3或更高),这是必备条件。

Anaconda

官方在文档中强烈建议新用户用Anaconda打包安装Python和Anaconda——所谓懒人方法,小白必备。其实除了提到的两个工具,Anaconda还包含数据科学和机器学习中经常需要用到的各种软件包,只需下载、解压、安装,所有工具就都一步到位了。

下载地址:https://jupyter.readthedocs.io/en/latest/install.html

pip

如果你很欣赏自己,或者因为某些因素就是不想用Anaconda,你也可以用pip。当然首先,你得确保自己的机器上有pip的最新版本。

#Linux和OSX

pip install -U pip setuptools

#Windows

python -m pip install -U pip setuptools

然后,安装Jupyter Notebook:

#Python2用户看这里

pip install jupyter

#Python3用户不要跑

pip3 install jupyter

如果还是有疑问,请看官方文档(英)、官方文档翻译(中)。

3. 入门

安装完成后,如果要运行Jupyter Notebook,你只需在控制台输入以下命令:

jupyter notebook

你会看到笔记本打开了你的默认浏览器,网址为http:// localhost:8888/tree。

一般情况下,当你输入命令行后,控制台会出现一行“The Jupyter Notebook is running at……”,如果浏览器因为某些原因无法打开,你就需要复制这个URL,手动打开相应网址。

当笔记本打开后,它的顶部有Files、Running和Clusters三个选项。其中Files中列出了所有文件,Running显示了你已经打开的终端和笔记本,Clusters则是IPython parallel提供的。

如果你想新建一个笔记本,单击面板右侧的“New”,它会跳出4个选项:

Python 3

Text File

Folder

Terminal

选择Text File后,你会得到一个空白的页面。它相当于一个文本编辑器(类似于Ubuntu上的应用程序),你可以在上面输入任何字母、单词和数字,所以选择好编程语言后,你是可以在上面写脚本的。此外,它还提供查找和替换文件中的单词的功能。

选择Folder后,你其实是在编辑文件夹列表。你可以创建一个新文件夹,把所需文档放进里面,或者修改它的名称、直接把它删除。

而Terminal的工作方式和Mac、Linux计算机上的Terminal一样,都是在Web浏览器中创建终端支持。只需在终端输入Python,一个Python脚本就写好了。

由于本文重点介绍的是笔记本,下面我们会重点展示新建“Python 3”后的结果:

导入最常见的Python库来启动笔记本,如pandas和numpy。在代码上方的菜单中,那些图标依次表示添加、编辑、剪切、向上移动cell、向下移动cell、运行代码、停止运行和撤销。

这个下拉的列表提供了四个选项:

Code:这个不言自明,就是你写代码的地方;

Markdown:非常常见的轻量级标记语言,用来为代码添加注释和结论;

Raw NBConvert:一个命令行工具,可以把你的笔记本转换成另一种格式,如HTML;

Heading:添加标题,使你的文档看起来更干净整洁,它现在已经变成Markdown里的一个语法,用两个#表示。

4. Jupyter Notebook的魔术命令

作为iPython的继承者,开发人员已经在Jupyter Notebook中加入预定义的魔术命令(magic function)。这是一种增加便捷性和互动性的工具,如果要查看命令列表,你可以输入(注:通常不需要“%”):

%lsmagic

当看到那一串函数列表时,也许你能从中认出几张老面孔,如%clear、%autosave、%debug和%mkdir。只要你以前写过代码,这些函数就几乎是不可避免的。

在Jupyter Notebook中,魔术命令有两种运行方式,一是Line-wise,而是Cell-wise。顾名思义,Line-wise就是当你想执行一个命令行的时候需要用到的,而Cell-wise面向的就不单单是一行了,它作用的是整个cell的代码块。

为了区分两种运行方式,如果是Line-wise,所有命令必须以%字符打头;如果是Cell-wise,则用%%。

Line-wise:

%time a = range(10)

Cell-wise:

%%timeit a = range (10)

min(a)

以上只是两个最简单的示例,你可以试着自己运行这些命令,看看其中有什么区别。

5. 不仅限于Python

之前也提到了,Jupyter Notebook的成功离不开它的灵活性,虽然Python在数据科学和机器学习中都占局主导地位,但对于数据分析任务,其他语言也有各种各样的特色和优势,比如R语言的'ggplot2'软件包就非常好用。在这一点上,Jupyter Notebook的态度是开放的。

如果想在Jupyter Notebook中启用R,你需要先去GitHub上下载'IRKernel'(R的专用kernel),然后按以下8个步骤依次执行(附图解地址):

步骤一:用Anaconda安装Jupyter Notebook;

步骤二:完成下载后,打开Anaconda命令提示符;

步骤三:输入ipython notebook新建ipython笔记本

步骤四:用conda update ipython-notebook这个命令行更新笔记本;

步骤五:输入conda install -c r ipython-notebook r-irkernel安装IRkernel;

步骤六:用R.exe打开R;

步骤七:输入install.packages(c('rzmq','repr','IRkernel','IRdisplay'), repos = 'http://irkernel.github.io/', type = 'source')安装必要软件包;

步骤八:输入IRkernel::installspec()后再输入quit(),完成操作。

如果是Julia用户,你也可以在Jupyter Notebook中“畅所欲言”。考虑到篇幅因素,有需要的读者请前往www.analyticsvidhya.com/blog/2017/10/comprehensive-tutorial-learn-data-science-julia-from-scratch/查看图文攻略。

和R语言一样,JavaScript用户也需要去Github先下载‘IJavascript’ kernel:github.com/n-riesco/ijavascript。文档里已经明确写出了安装kernel所需的步骤,但要注意的是,记得先装Node.js和npm,这是大前提!

6. Jupyter Notebook的交互式控制面板

在添加小部件前,你需要先导入小部件包:

from ipywidgets import widgets

小部件的基本类型是典型的基于输入和按钮的文本输入。你可以参考下面这幅动图,了解交互式小部件的外观:

来源:Dominodatalab

7. 快捷键

既然Jupyter Notebook的主打优势是便捷,那它自然少不了方便操作的快捷键。事实上,当你想运行任意代码块时,只需按下Ctrl + Enter就可以了。

下面是本文挑选的一些实用快捷键,有需要的读者可以视情况逐个阅读+尝试,如果今后你会经常用到Jupyter Notebook,那不会这些组合键的你就几乎已经是条咸鱼了。

Jupyter Notebook提供了两种不同的键盘输入模式——Command和Edit。其中Command模式是将键盘和计算机命令绑定在一起,这时单元框线是灰色的(左侧蓝色粗线)。Edit模式允许你将文本(或代码)键入活动单元,这时单元框线是绿色的。

用Esc和Enter分别在Command和Edit模式之间跳转。

更多快捷键介绍(中文):blog.csdn.net/lawme/article/details/51034543

8. 有用的扩展

添加扩展是提高Jupyter Notebook效率的一种非常有效的方式,那么安装和使用扩展哪家强?这里我们推荐Nbextensions。

先是安装(pip):

pip install jupyter_contrib_nbextensions

安装关联的JavaScript和CSS文件:

jupyter contrib nbextension install --user

完成此操作后,你会在Jupyter Notebook主页顶部看到一个'Nbextensions'选项卡。

如果要启用一个扩展,只需点击来激活。下面是4个比较有用的扩展。

Code prettify:它可以让你的代码更美观。

Printview:生成预览,新增的按钮叫jupyter nbconvert。

Scratchpad:生成一个实验环境(副本)跑代码,不会对笔记本代码造成影响。

Table of Contents (2):抓取所有标题,并显示在浮动窗口中。

此外,小编也曾经写过一篇《Top 5:五大最实用的Jupyter Notebook扩展插件》,介绍了另外5种好用的扩展,有兴趣的读者可以一起看一看。

9. 保存和共享你的笔记本

这是Jupyter Notebook中最重要和最棒的功能之一。有过写博客经历的读者也许知道这种痛,当你一腔热血想把自己的成果分享给别人时,可能代码格式还没转完你就放弃了。大多数笔记本都采用json格式,它不是很适合共享,也不利于在博客中发布不同的单元块。

但Jupyter Notebook不一样,点击进入“file”后,你会看到一个“Download as”:

看到这7个选项后你就很开心了,其中最常用的是.ipynb文件。你也可以用nbconvert选项手动将笔记本转换为不同的格式,如HTML和PDF。

此外,你还可以使用jupyterhub,它允许你在其服务器上托管笔记本并与多个用户共享。许多顶尖的研究项目都把这作为协作方式。

10. JupyterLab

JupyterLab是今年2月推出的一个工具,从某种程度上来说,它是Jupyter Notebook的一个发展——拥有同样的组件,但允许更灵活和更强大的项目工作方式。换句话说,它的用户体验更好。

JupyterLab的特色是允许用户在一个窗口内安排笔记本、终端、文本文件和输出的工作区。你可以把窗口拖到你想要的位置,也可以通过实时预览编辑常用文件格式,如Markdown、CSV和JSON,实时查看项目进展。

11. 实践和技巧

虽然自己钻研很有趣,但无论是学习还是工作,大部分时候你是在一个团队中工作的。在这种情况下,你要规范自己的操作和实践,确保笔记本中的代码和注释都是正确的,方便其他人阅读、理解。以下是一些实践指标,仅供参考:

对每个程序员来说最重要的事:要好好注释!

确保你保存了代码文档。

形成一套命名体系,并在实践中落到实处,方便自己和他人理解。

在刚开始的时候导入所需的库,并在旁边注释导入目的。

确保代码行距合适,你也不想别人因为看不懂你的循环和函数疯掉,对吧?

当代码越来越多时,隐藏不重要代码,确保干净整洁。

此外,当你需要把成果演示给别人看时(是的你又要做该死的PPT了),你是可以偷懒直接在Jupyter Notebook里做演示的。

找到“View”,点开其中的“Cell Toolbar”,然后是“Slideshow”。每个代码块都在右侧显示一个名为“Slide Type”的下拉选项:

具体效果如何,请自己尝试。

结语

写到这里,本文也就已经差不多结束了,虽然在一篇文章内塞进这么多内容可能会影响阅读体验,但我们还是真诚地希望新手能从中找到一些有用的东西。

原文标题:数据科学和机器学习,Jupyter Notebook入门指南

文章出处:【微信号:jqr_AI,微信公众号:论智】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
分享:

评论

相关推荐

Chronolife推出可预知心脏病的特制背心

根据美国疾控中心(CDC)发布的数据,该国有超过570万成年人患有充血性心力衰竭(CHF)疾病。 相....
的头像 MEMS 发表于 01-17 18:01 244次 阅读
Chronolife推出可预知心脏病的特制背心

如何使用机器学习方法进行乳腺癌的辅助诊断

本文利用核主成分分析法对乳腺癌的影响因子进行特征提取,以获取的主成分作为支持向量机的特征向量建立支持....
发表于 01-17 16:58 10次 阅读
如何使用机器学习方法进行乳腺癌的辅助诊断

通用人工智能面临的挑战,人工智能和算法偏见

如今大多数的人工智能系统都不具备很好的扩展能力。AlphaZero、AlphaGo、OpenAI F....
的头像 人工智能学家 发表于 01-17 16:53 145次 阅读
通用人工智能面临的挑战,人工智能和算法偏见

人工智能在供应链管理中的应用

机器学习在有大数据的情况下学习效果最好。这些系统学习的速度就越快。在很多情况下,供应链应用程序将需要....
的头像 AI人工智能D1net 发表于 01-17 15:04 141次 阅读
人工智能在供应链管理中的应用

“互联网+医学影像”AI助推实现医疗资源均衡化

NGC容器旨在提供一个软件平台,该平台基于最小的操作系统要求、安装在服务器或工作站上Docker和驱....
的头像 英伟达NVIDIA企业解决方案 发表于 01-17 13:47 128次 阅读
“互联网+医学影像”AI助推实现医疗资源均衡化

全年开源项目的盘点和总结

如果你们这些.NET 开发者们想要学一点机器学习知识来补充现有的技能,你会怎么做?现在就有一个完美的....
的头像 人工智能 发表于 01-17 11:18 157次 阅读
全年开源项目的盘点和总结

机器学习对于解决无人驾驶的问题非常重要

1月10日,在青岛举行的2019国家智能产业峰会智能驾驶平行论坛上,孙振平研究员结合国内外机器学习相....
发表于 01-17 11:09 32次 阅读
机器学习对于解决无人驾驶的问题非常重要

我就是这样入门「机器学习」的

随着近几年计算机领域的不断发展,云服务与并行计算促进了计算力的提升,互联网的发展提供了海量的数据,这....
的头像 人工智能头条 发表于 01-17 11:08 329次 阅读
我就是这样入门「机器学习」的

机器学习如何运作 下一步是什么

今天的机器学习是以统计学为基础的,那么人工智能=统计学吗?
的头像 联动原素 发表于 01-17 10:36 211次 阅读
机器学习如何运作 下一步是什么

从数据科学从业者的角度退一步看一下人工智能的一些关键领域的发展

想知道对于ULMFiT的最佳部分以及即将看到的后续框架吗?事实上你不需要从头开始训练模型!研究人员在....
的头像 传感器技术 发表于 01-17 09:37 224次 阅读
从数据科学从业者的角度退一步看一下人工智能的一些关键领域的发展

探析常见的几种最优化方法

最优化方法是一种数学方法,它是研究在给定约束之下如何寻求某些因素(的量),以使某一(或某些)指标达到....
的头像 人工智能爱好者社区 发表于 01-17 09:25 152次 阅读
探析常见的几种最优化方法

如何在Raspberry Pi 3上构建机器学习应用程序

希望评估机器学习方法的开发人员发现了越来越多的专业硬件和开发平台,这些平台通常针对特定类别的机器学习....
的头像 电子设计 发表于 01-17 08:24 147次 阅读
如何在Raspberry Pi 3上构建机器学习应用程序

2018年的联络中心:嵌入式支持B2B应用程序

Jamison将机器人比作交互式语音应答(IVR)系统。"我们已经使用IVR 30年或更长时间了,我....
的头像 CTI论坛 发表于 01-16 17:25 340次 阅读
2018年的联络中心:嵌入式支持B2B应用程序

大牛预测2019人工智能发展趋势

在AlphaGo等吸引大众眼球的事件推动下,AI仍然是技术的热点之一,图像识别等一些成熟的人工智能应....
的头像 人工智能 发表于 01-16 17:08 484次 阅读
大牛预测2019人工智能发展趋势

嵌入式工程师到底有没有前途应该如何规划就业之路

嵌入式一直冠以高门槛的名号,相较于软件开发逊色的起步薪资也被网友调侃“饿肚子”。热情投入嵌入式的人比....
发表于 01-16 16:53 46次 阅读
嵌入式工程师到底有没有前途应该如何规划就业之路

近十年人工智能21个子领域高引学者

在推荐系统领域(Recommender System),高引学者排名前三的学者依次是:纽约大学教授A....
的头像 电子发烧友网工程师 发表于 01-16 11:34 335次 阅读
近十年人工智能21个子领域高引学者

TensorFlow 2.0马上要来了,还不速来了解下新架构?

TensorFlow始终为生产提供了直接部署方式。无论是部署在服务器、边缘设备还是Web上,Tens....
的头像 新智元 发表于 01-16 08:45 177次 阅读
TensorFlow 2.0马上要来了,还不速来了解下新架构?

数据科学能力是否能够靠培训课程培养?

探索数据,尝试不同的特征工程和构建模型的方法是一项持久战。花费大量时间在这上面也可能会让你在Kagg....
的头像 电子发烧友网工程师 发表于 01-15 16:23 301次 阅读
数据科学能力是否能够靠培训课程培养?

无人配送产品今年的目标:适应不同场景,处理异常流程

回到上述一个关键问题,就是场景,现在美团外卖日订单量高达 2400 万单,“可能占到全世界外卖市场的....
的头像 电子发烧友网工程师 发表于 01-15 16:02 467次 阅读
无人配送产品今年的目标:适应不同场景,处理异常流程

Cornami构建了一个革命性的脉动阵列架构

Cornami构建了一个可以根据需要构建任何尺寸,任何形状的收缩阵列的架构。
的头像 ssdfans 发表于 01-15 16:01 213次 阅读
Cornami构建了一个革命性的脉动阵列架构

机器学习算法基本概念及选用指南

本文对机器学习的一些基本概念给出了简要的介绍,并对不同任务中使用不同类型的机器学习算法给出一点建议。
的头像 Imagination Tech 发表于 01-15 15:55 168次 阅读
机器学习算法基本概念及选用指南

剖析一下现代高科技企业尤其是互联网公司如何设置一个成功的研究院

我们先来说说为什么「比较成熟的产品」适合搭配研究院。成熟的产品,已经有了比较成熟的数据链条(Data....
的头像 电子发烧友网工程师 发表于 01-15 10:08 383次 阅读
剖析一下现代高科技企业尤其是互联网公司如何设置一个成功的研究院

腾讯鹅漫U品如何基于LSTM模型进行中文文本情感分析?

我们基于 40 多万条真实的鹅漫用户评论数据建立了语料库,为了让正面和负面的学习样本尽可能均衡,我们....
的头像 电子发烧友网工程师 发表于 01-15 09:58 304次 阅读
腾讯鹅漫U品如何基于LSTM模型进行中文文本情感分析?

Nature Medicine连发9篇论文聚焦人工智能在医学领域的应用

大数据已成为医学创新无处不在的观察词。特别是机器学习技术和人工智能的快速发展已经将医疗实践从资源分配....
的头像 新智元 发表于 01-15 09:15 443次 阅读
Nature Medicine连发9篇论文聚焦人工智能在医学领域的应用

IDC:2018年中国智能家居出货预计1.5亿台 同比增长35.9%

回顾2018年智能家居市场,爆款产品争相涌现,如智能音箱,智能灯泡,智能插座等。《IDC中国智能家居....
发表于 01-15 08:43 161次 阅读
IDC:2018年中国智能家居出货预计1.5亿台 同比增长35.9%

一些关于机器学习工具在学习过程中所犯错误的问题

咨询公司Cambridge Consultants的专家级机器学习工程师Sally Epstein说....
的头像 嵌入式资讯精选 发表于 01-14 14:56 211次 阅读
一些关于机器学习工具在学习过程中所犯错误的问题

机器学习算法概念介绍及选用建议

在从事数据科学工作的时候,经常会遇到为具体问题选择最合适算法的问题。虽然有很多有关机器学习算法的文章....
的头像 通信信号处理研究所 发表于 01-14 13:49 558次 阅读
机器学习算法概念介绍及选用建议

从CES 2019看人工智能的下个风口

近几年来人们对人工智能和机器学习的热度不断上升,本次CES展会的11个场馆均从不同方面展示了AI的各....
的头像 人工智能 发表于 01-14 10:34 410次 阅读
从CES 2019看人工智能的下个风口

美国14项关键技术出口管制,征求意见结束

支持者认为,在美国之外,现在一些技术已经开始迅速发展,比如中国的科学家正在开发基因工程技术,对双胞胎....
的头像 新智元 发表于 01-14 09:06 465次 阅读
美国14项关键技术出口管制,征求意见结束

拥抱机器学习 数码化企业未来可期

随著过去10年数码化和大数据的兴起,企业正在实施机器学习策略,并雇用更多资料科学家。然而单单作用资料....
发表于 01-13 11:22 41次 阅读
拥抱机器学习 数码化企业未来可期

随着人们对人工智能的热度不断上升 AI+逐渐成为全球关注的热点

2019年的美国消费电子展(CES)在1月8日开幕,超过18万名人齐聚拉斯维加斯参加,全球科技再次进....
发表于 01-13 08:51 151次 阅读
随着人们对人工智能的热度不断上升 AI+逐渐成为全球关注的热点

什么是机器学习?机器学习是如何工作的呢?

为了更清楚地理解机器学习的过程,我们将以开发能够识别手写数字的机器为具体例子来考虑模式识别的问题。这....
的头像 IEEE电气电子工程师学会 发表于 01-12 10:05 283次 阅读
什么是机器学习?机器学习是如何工作的呢?

通过机器学习和深度学习的手段,成功的从老鼠的“吱吱”声中解读出20多种不同的含义

最近研究人员们通过机器学习和深度学习的手段,成功的从老鼠的“吱吱”声中解读出20多种不同的含义,包括....
的头像 将门创投 发表于 01-12 09:48 292次 阅读
通过机器学习和深度学习的手段,成功的从老鼠的“吱吱”声中解读出20多种不同的含义

2018年国际顶尖学术会议上发表的机器学习和NLP相关论文的数据统计

先来看看2012-2018年间统计收录的会议上的会议论文。大多数机器学习会议上发表的论文数量都呈现持....
的头像 新智元 发表于 01-12 09:42 423次 阅读
2018年国际顶尖学术会议上发表的机器学习和NLP相关论文的数据统计

10本让你成为机器学习领域的专家的好书!

机器学习原理:预测数据分析向我们展示了基于关系和自定义算法的分析和数据选择过程。这包括能从其他相关资....
的头像 Imagination Tech 发表于 01-11 16:01 460次 阅读
10本让你成为机器学习领域的专家的好书!

北大语言计算与机器学习研究组推出一套全新中文分词工具包pkuseg

多领域分词。不同于以往的通用中文分词工具,此工具包同时致力于为不同领域的数据提供个性化的预训练模型。....
的头像 中国人工智能学会 发表于 01-11 15:55 441次 阅读
北大语言计算与机器学习研究组推出一套全新中文分词工具包pkuseg

这就是芬兰:先让全国1%的人学起AI!

芬兰经济部负责人兼赫尔辛基 AI 计划的主要设计者 Ilona Lundström 称,赫尔辛基的下....
的头像 电子发烧友网工程师 发表于 01-11 09:29 344次 阅读
这就是芬兰:先让全国1%的人学起AI!

机器学习竞争幕后其实是对于数据新颖度和广泛度的竞争

希望借助AI一臂之力的企业需要寻求外部数据源,甚至这样的数据甚至可能需要他们自己创建。
的头像 中国人工智能学会 发表于 01-10 15:50 467次 阅读
机器学习竞争幕后其实是对于数据新颖度和广泛度的竞争

Zane想要建立在了解医生如何工作的基础之上的更好的科技

Zane决定通过邀请各个公司的开发人员来了解自己的工作方式来弥补专业知识上的差距。目前,这需要他们观....
的头像 电子发烧友网工程师 发表于 01-10 15:10 377次 阅读
Zane想要建立在了解医生如何工作的基础之上的更好的科技

如何创造可信任的机器学习模型?先要理解不确定性

来源:机器之心编译 作者:Eric Jang 不确定性是机器学习领域内一个重要的研究主题,Eric ....
发表于 01-10 10:42 103次 阅读
如何创造可信任的机器学习模型?先要理解不确定性

AI学术大佬被挖光?企业可能会把AI行业挖断了根

根据笔者的统计,在目前该学院从事机器人技术、机器学习和自然语言处理的11名终身教职员工中,有8名正在....
的头像 新智元 发表于 01-10 08:49 386次 阅读
AI学术大佬被挖光?企业可能会把AI行业挖断了根

Topbots总结了2018年里10篇最为重要的AI研究论文

研究人员们发现,对于对抗性样本的防御,目前主要使用的是梯度模糊方法,但这种方法并不能带来真正的安全,....
的头像 人工智能 发表于 01-09 17:00 356次 阅读
Topbots总结了2018年里10篇最为重要的AI研究论文

工业物联网在工业制造中呈现的主要问题和趋势

根据IHS Markit最新数据,全球联网自动化设备的联网数量在2017年已经达到950亿个,其在2....
发表于 01-08 15:18 278次 阅读
工业物联网在工业制造中呈现的主要问题和趋势

GPU如何加速人工智能或机器学习的计算速度

计算就是计算,数学上都是一样的,1+1用什么算都是2,CPU算神经网络也是可以的,算出来的神经网络放....
的头像 Imagination Tech 发表于 01-08 15:01 398次 阅读
GPU如何加速人工智能或机器学习的计算速度

数据已逐渐成为了机器学习竞争中最关键的区分点

尽管机器学习有时会突然发现某些从未有人意识到的事物从而使所有人都大吃一惊,但它并不能够持续稳定提供这....
的头像 电子发烧友网工程师 发表于 01-08 11:49 450次 阅读
数据已逐渐成为了机器学习竞争中最关键的区分点

在机器学习领域引入了一种新的隐写术,称为“训练集伪装

在研究人员设想的场景中,名为Eve的第三个智能体扮演数据检验者的角色,监视Alice和Bob之间的通....
的头像 新智元 发表于 01-08 08:50 311次 阅读
在机器学习领域引入了一种新的隐写术,称为“训练集伪装

芬兰希望在人工智能的实际应用方面占据一席之地,成为世界领先国家

在不需要任何编码技能的情况下,本课程传授初学者人工智能的基础知识,而不是培训新一代的尖端开发人员。相....
的头像 人工智能学家 发表于 01-07 15:37 837次 阅读
芬兰希望在人工智能的实际应用方面占据一席之地,成为世界领先国家

为什么说2019年将是物联网关键的一年

IDC估计,物联网支出在2017——2022年期间的复合年增长率将达到13.6%,导致2022年总支....
发表于 01-07 14:25 443次 阅读
为什么说2019年将是物联网关键的一年

机器学习实验中图像增强的库imgaug详解

Py之imgaug:Python库之imgaug简介、安装、使用方法之详细攻略...
发表于 12-28 14:30 190次 阅读
机器学习实验中图像增强的库imgaug详解

大数据hadoop入门之hadoop家族产品详解

大数据这个词也许几年前你听着还会觉得陌生,但我相信你现在听到hadoop这个词的时候你应该都会觉得“熟悉”!越来越发现身边从...
发表于 12-26 15:02 318次 阅读
大数据hadoop入门之hadoop家族产品详解

ML之预测:采用机器学习预测小组赛、十六比赛、四决赛、半决赛、决赛以及世界杯总冠军的各个队伍

ML之预测:玩转2018世界杯—采用机器学习预测小组赛、十六比赛、四决赛、半决赛、决赛以及世界杯总冠军的各个队伍...
发表于 12-24 11:51 93次 阅读
ML之预测:采用机器学习预测小组赛、十六比赛、四决赛、半决赛、决赛以及世界杯总冠军的各个队伍

Pytorch模型训练实用PDF教程【中文】

本教程以实际应用、工程开发为目的,着重介绍模型训练过程中遇到的实际问题和方法。在机器学习模型开发中,主要涉及三大部分,分...
发表于 12-21 09:18 157次 阅读
Pytorch模型训练实用PDF教程【中文】

ML之ECS:利用ECS的PAI进行傻瓜式操作机器学习的算法

ML之ECS:利用ECS的PAI进行傻瓜式操作机器学习的算法...
发表于 12-20 10:42 71次 阅读
ML之ECS:利用ECS的PAI进行傻瓜式操作机器学习的算法

清洗误标注的开发集和测试集样本

在进行误差分析时,你可能会注意到一些开发集的样本被误标注(mislabeled )了。此处的“误标注”指的是图像在使用算法处理前,已...
发表于 12-19 09:48 133次 阅读
清洗误标注的开发集和测试集样本

在误差分析时并行评估多个想法

对于改进猫检测器,你的团队有一些想法 • 修正算法将狗误分类为猫的问题。 • 修正算法将大型猫科动物(比如狮子、黑豹等等,下...
发表于 12-19 09:43 128次 阅读
在误差分析时并行评估多个想法

误差分析:根据开发集样本评估想法

在使用猫咪 app 时,你注意到它将一些狗的图片误分类为猫了,因为有些狗的样子的确很像猫。 团队中有人建议,加入第三方软件来...
发表于 12-18 09:16 134次 阅读
误差分析:根据开发集样本评估想法

快速构建并迭代你的第一个系统

当你想要构建一个新的垃圾邮件过滤系统时,团队可能会有各式各样不同的想法: • 收集海量的垃圾邮件作为训练集。例如,设置一个...
发表于 12-18 09:11 207次 阅读
快速构建并迭代你的第一个系统

建立开发集和测试集(总结)

• 被选择作为开发集和测试集的数据,应当与你未来计划获取并对其进行良好处理的数据有着相同的分布,而不一定和训练集的数据分布...
发表于 12-14 10:56 157次 阅读
建立开发集和测试集(总结)