侵权投诉

深度学习框架只为GPU? 答案在这里

模拟对话 2018-03-14 18:29 次阅读

目前大多数的机器学习是在处理器上完成的,大多数机器学习软件会针对GPU进行更多的优化,甚至有人认为学习加速必须在GPU上才能完成,但事实上无论是运行机器学习的处理器还是优化的深度学习框架,都不单只针对GPU,代号为“Skylake”的英特尔至强SP处理器就证明了这一点。

机器学习软件在英特尔至强SP系列白金版上的一系列基准测试性能表现与在GPU上非常相近,了解了底层架构之后,我们可以看到,在性能如此接近的情况下,使用GPU加速器更像是在购买一种“奢侈品”,用户在GPU以外还有很多其他的选择。毫无疑问,在用户只需要机器学习的情况下,“加速器”在性能和能耗方面更有优势,大多数人需要的不只是一台“智能的用于机器学习的服务器”,那就让我们来重点看一下英特尔至强SP 白金级处理器为什么是最佳的选择:

CPU优化深度学习框架和函数库

英特尔在基于GPU优化的框架中增加了CPU优化深度学习框架, 打破了深度学习框架偏重于GPU而忽视了CPU的行业现状,解决了目前这些框架缺乏CPU优化的实际问题。

TensorFlow由谷歌开发,是一个领先的深度学习和机器学习框架,有面向Linux的处理器优化

-  Caffe是图片识别领域最受欢迎的应用之一,英特尔提供的优化可以在CPU运行时提高Caffe的性能

-  Torch是当下流行的深度学习框架,需要在优化的CPU上应用,可以通过英特尔软件优化(比如英特尔至强可扩展处理器)提高Torch在CPU上的性能

-  Theano是一个开源的Python库,很受机器学习程序员的欢迎,它可以帮助程序员高效地定义、优化和评估涉及多维阵列的数学表达式

-  Neon是一个基于Python的深度学习框架,目的是在现代深度神经网络上实现易用性和可扩展性,并致力于在所有硬件上实现性能的最大化

-  MXNet是一个开源的深度学习框架

-  Python及其函数库是机器学习应用里最受欢迎的基础组成,Python加速版过去几年里得到了广泛应用,并且可以直接下载或通过Conda、yum、apt-get或Docker images下载

-  BigDL是一个面向Apache Spark的分布式深度学习函数库。通过BigDL用户可以把自己的深度学习应用当作标准Apache Spark程序来编写,直接在现有Apache Spark或Hadoop集群上运行。在Torch基础上开发的BigDL可以为深度学习提供综合性支持:包括数值计算(通过Tensor)和高级神经网络;此外用户还可以利用BigDL把提前训练的Caffe或Torch模型载入Spark程序。英特尔曾声称在一个单节点至强处理器上(例如与GPU相比),BigDL中的处理速度比原始开源Caffe、Torch或TensorFlow要高一个数量级

-  英特尔MKL-DNN是一个开源的、性能强化的函数库,用于加速在CPU上的深度学习框架

-  英特尔数据分析加速库(DAAL)是一个包含了被优化的算法构建模块的开源函数库,针对大数据问题最相关的数据分析阶段。这个函数库适用于当下流行的数据平台,包括Hadoop、Spark、R和Matlab

结果证明了一切,无论是TensorFlow、Caffe,还是Torch、Theano,这些深度学习框架都针对英特尔数学核心函数库(Intel MKL)和英特尔高级矢量扩展指令集(Intel AVX)进行了优化。通过CPU优化,TensorFlow和Caffe基准测试中的CPU性能分别提高了72倍和82倍。

机器学习加速器

科技与行业的发展都是瞬息万变的,机器学习的加速器也会从GPU转向FPGAASIC等等,除非我们永远只需要一台只能用于机器学习的服务器,只要在一台服务器上想实现可以支持各种的工作负载,英特尔至强可扩展处理器无疑是最佳的解决方案。加速器的选择正在变得多元化,这是整个行业的发展趋势,多核CPU(英特尔至强融核处理器,特别是“Knights Mill”版)和FPGA(英特尔至强处理器,包含Intel/Altera FPGA)都可以提供更灵活的选择、卓越的性价比和高能效。基于英特尔至强融核处理器训练或学习一个AlexNet图片分类系统的速度,是使用NVIDIA GPU的类似配置系统的2.3倍;英特尔至强融核处理器的性价比最高可以是GPU解决方案的9倍,每瓦性能高达8倍,英特尔Nervana将推出更多专为人工智能开发的产品。英特尔至强SP系列处理器为机器学习提供了卓越的性能,同时相比其他解决方案也为我们带来了更多的功能与选择,让我们在产品与行业的发展中都可以拥有更多可能。

收藏 人收藏
分享:

评论

相关推荐

2020 人工智能卓越创新奖,请为Xilinx打call

赛灵思: FPGA、可编程 SoC,以及 ACAP 自适应计算加速的发明者,“致力于打造灵活应变,万....
的头像 人间烟火123 发表于 05-27 11:38 86次 阅读
2020 人工智能卓越创新奖,请为Xilinx打call

8月 2020宝安产业发展博览会(”宝博会“)来了

2020年第5届宝安产业发展博览会(简称宝博会)将于8月6-8日在深圳国际会展中心(宝安区)隆重举办....
的头像 科技新思路 发表于 05-27 10:39 78次 阅读
8月 2020宝安产业发展博览会(”宝博会“)来了

Teledyne进一步增强数据转换器,为加速FPGA发展

为响应可编程逻辑技术的不断发展,Teledyne e2v进一步增强了其数据转换器产品组合以及支持它们....
发表于 05-27 10:05 12次 阅读
Teledyne进一步增强数据转换器,为加速FPGA发展

Xilinx全新Virtex UltraScale+ FPGA问市,生而为速

VU23P 具备一系列卓越特性,它在 Virtex UltraScale 产品组合中实现了最高的查找....
发表于 05-27 08:57 58次 阅读
Xilinx全新Virtex UltraScale+ FPGA问市,生而为速

TMS320C6657挂网口如何与Spartan-6挂网口实时通信?

现状是: 1.信号处理板的架构是FPGA+DSP,DSP上挂网口,与电脑可正常通信 2.数据处理板的架构是FPGA挂网口,与电...
发表于 05-27 08:43 89次 阅读
TMS320C6657挂网口如何与Spartan-6挂网口实时通信?

生而为速,Xilinx专为联网和存储加速优化推出全新 Virtex UltraScale+ VU23P FPGA

VU23P 具备一系列卓越特性,它在 Virtex UltraScale 产品组合中实现了最高的查找....
发表于 05-26 15:34 156次 阅读
生而为速,Xilinx专为联网和存储加速优化推出全新 Virtex UltraScale+ VU23P FPGA

人工智能是新基建中最重要的投资发展领域之一

在全国政协委员刘伟看来,政府工作报告中关于“新型基础设施”的阐述让他备受鼓舞。“政府工作报告中提出‘....
发表于 05-26 15:14 47次 阅读
人工智能是新基建中最重要的投资发展领域之一

机器学习基石笔记

3)机器学习基石笔记 Lecture3:Types of Learning
发表于 05-26 14:53 14次 阅读
机器学习基石笔记

人工智能如何增强工业4.0

随着AI从现实生活变成现实世界,成为世界变化技术的前沿,迫切需要系统开发和实施AI,以了解其对下一代....
发表于 05-26 11:05 182次 阅读
人工智能如何增强工业4.0

莱迪思Nexus技术平台,重新定义低功耗小尺寸FPGA

物联网AI、嵌入式视觉、硬件安全、5G通信、工业和汽车自动化等新兴应用正在重新定义开发人员设计网络边....
发表于 05-26 10:34 90次 阅读
莱迪思Nexus技术平台,重新定义低功耗小尺寸FPGA

Vicor 1200A ChiP-set将赋能高效嵌入式处理器

Vicor (NASDAQ:VICR)推出面向直接由 48V 供电的高性能 GPU、CPU 和 AS....
发表于 05-26 10:09 64次 阅读
Vicor 1200A ChiP-set将赋能高效嵌入式处理器

新的人工智能诊断程序可以预测是否感染新冠肺炎

英美科学家携手开发出一种人工智能(AI)诊断工具,可以根据症状预测某人是否可能感染新冠肺炎,相关研究....
发表于 05-26 09:28 226次 阅读
新的人工智能诊断程序可以预测是否感染新冠肺炎

iMPACT添加设备错误是怎么回事

您好,我是FPGA的初学者。 我有elbertV2板,我想通过USB从计算机接收输入数据。 我按照指南尝试用iMPACT程序制作...
发表于 05-26 08:58 57次 阅读
iMPACT添加设备错误是怎么回事

5G技术对数据中心的运营到底有什么影响

如果有人询问5G技术对数据中心的运营有什么影响,那么就像询问如何抵御自然灾害一样。其答案是取决于具体....
发表于 05-26 08:00 24次 阅读
5G技术对数据中心的运营到底有什么影响

华为FPGA设计高级技巧Xilinx篇资料免费下载

本文从FPGA器件结构角度出发 以速度和面积为主题 描述在FPGA设计过程中应当注意的问题和可以采用....
发表于 05-26 08:00 25次 阅读
华为FPGA设计高级技巧Xilinx篇资料免费下载

北京科技大学的人工智能视频教程免费下载

本文档的主要内容详细介绍的是北京科技大学的人工智能视频教程免费下载。
发表于 05-25 16:21 27次 阅读
北京科技大学的人工智能视频教程免费下载

EMIFA的读写建立、选通和保持的参数确定的依据是什么?

将FPGA挂载到EMIFA的CS2上,我想问一下,EMIFA的读写建立、选通和保持的参数确定的依据是什么???。是根据手册...
发表于 05-25 16:18 23次 阅读
EMIFA的读写建立、选通和保持的参数确定的依据是什么?

基于FPGA的按键扫描程序

发表于 05-25 15:59 143次 阅读
基于FPGA的按键扫描程序

百度正式宣布Graphcore加入百度飞桨硬件生态圈

百度飞桨是中国首个开源开放、功能完备的产业级深度学习平台,目前累计开发者数量超过190 万,服务企业....
发表于 05-25 14:32 45次 阅读
百度正式宣布Graphcore加入百度飞桨硬件生态圈

系统verilog代码能用于spartan6 FPGA吗

大家好, 我们不能将系统verilog代码用于spartan 6 FPGA吗? 因为Xilinx ISE 14.x不支持.sv文件,而vivado将支持7系列...
发表于 05-25 14:01 29次 阅读
系统verilog代码能用于spartan6 FPGA吗

人工智能的龙头品牌有哪些

21世纪是一个智能时代,在我们的家居生活里面是离不开水龙头的,虽然水龙头很小看起来也不起眼,但是少了....
发表于 05-25 11:14 102次 阅读
人工智能的龙头品牌有哪些

人工智能电视有什么优势

 从这个概念来看,人工智能电视具有语言识别、图像识别、自然语言处理和专家系统等,相比普通智能电视,人....
发表于 05-25 11:13 62次 阅读
人工智能电视有什么优势

物联网和人工智能这对组合的应用盘点

工智能可以协同控制房屋温度。无论您想要什么温度,都可以通过智能设备来控制(智能设备内置人工智能控制的....
发表于 05-25 11:12 92次 阅读
物联网和人工智能这对组合的应用盘点

延迟和指令呈现百度人工智能交互设计院的最新研究

有屏智能设备的多维对话:延迟和指令呈现  百度人工智能交互设计院最新研究...
发表于 05-25 09:46 22次 阅读
延迟和指令呈现百度人工智能交互设计院的最新研究

吴恩达机器学习笔记分享

【吴恩达机器学习笔记】第八章:正则化
发表于 05-25 08:49 9次 阅读
吴恩达机器学习笔记分享

Altera公司的FPGA选择示意图资料免费下载

本文档的主要内容详细介绍的是Altera公司的FPGA选择示意图资料免费下载。
发表于 05-25 08:00 18次 阅读
Altera公司的FPGA选择示意图资料免费下载

给fpga输入一个模拟量的方波

请问给fpga输入一个方波,高电压为2.7V,低电压为0V,直接用input输入进来却一直是高电平。刚学fpga,希望能有大神解答一下,是...
发表于 05-24 14:10 111次 阅读
给fpga输入一个模拟量的方波

功率分析仪的测量通道如何扩展

什么是功率分析仪?它有什么作用?随着新能源汽车的快速发展,汽车工业现场的测试需求也越来越高,往往需要....
的头像 Wildesbeast 发表于 05-24 10:39 635次 阅读
功率分析仪的测量通道如何扩展

请问如何提高数据采集系统的精度

我是一枚在荷兰电子信息工程专业留学生,我的同学外国同学正在做一项实习设计,他想请教一些问题。 设计内容:提高数据采集系统...
发表于 05-24 06:25 109次 阅读
请问如何提高数据采集系统的精度

AI机器人助攻 BMW自动化工厂再升级

BMW日前宣布,将采用NVIDIA的Isaac机器人平台,透过搭载人工智能(AI)运算和视觉化技术的....
发表于 05-23 10:16 89次 阅读
AI机器人助攻 BMW自动化工厂再升级

Teledyne的数据转换平台可与Xilinx的FPGA器件完美相融

为了辅助Xilinx热门产品20nm Kintex UltraScale KU060 FPGA,Te....
发表于 05-23 10:15 110次 阅读
Teledyne的数据转换平台可与Xilinx的FPGA器件完美相融

在嵌入式视觉设计中使用FPGA,它将带来什么优势

过去几年里,嵌入式视觉应用大量涌现,包括从相对简单的智能视觉门铃到执行随机拾取和放置操作的复杂的工业....
发表于 05-23 09:57 393次 阅读
在嵌入式视觉设计中使用FPGA,它将带来什么优势

NVIDIA 公布2021财年Q1财报:收入达30.8亿美元,较去年同期增长39%

截至2020年4月26日的第一季度收入达30.8亿美元,较去年同期的22.2亿美元增长39%,较上一....
的头像 人间烟火123 发表于 05-23 09:15 1109次 阅读
NVIDIA 公布2021财年Q1财报:收入达30.8亿美元,较去年同期增长39%

人工智能技术在生物识别中的应用

人工智能技术的发展,针对数字社会人与人之间、人与机器之间如何建立“信任”关系,提供了一个很好的技术解....
发表于 05-22 11:23 110次 阅读
人工智能技术在生物识别中的应用

人工智能有望推动智能经济的发展

从中央密集部署,到地方积极响应;从企业主动投资,到资本市场热捧……2020年新基建站上时代风口。今年....
发表于 05-22 11:20 115次 阅读
人工智能有望推动智能经济的发展

可重构架构技术的快速发展,未来将应用于太空

如今,技术的进步使得低轨飞行越来越容易商用化。赛灵思太空产品系统架构师Minal Sawant表示,....
发表于 05-22 10:35 154次 阅读
可重构架构技术的快速发展,未来将应用于太空

AI工具发现了三种可用于预测COVID-19重症的迹象

尽管大多数新冠病毒感染案例停留在在轻度或中度,但有些人直至恢复都没能表现出 COVID-19 的任何....
发表于 05-22 09:29 382次 阅读
AI工具发现了三种可用于预测COVID-19重症的迹象

发力新基建 华为为新基建打造强大引擎

在中国,每天有350万工人在生产线上靠目视来检测产品质量。通过运用5G、云和人工智能,产品质量的检测....
的头像 inr999 发表于 05-21 18:10 926次 阅读
发力新基建 华为为新基建打造强大引擎

利用机器学习来分析与特定药物的患者结果信息

选择治疗多种类型癌症的一线化疗药物通常是由标准治疗方案所决定的,但如果在治疗过程中第一种药物失败了,....
发表于 05-21 15:58 29次 阅读
利用机器学习来分析与特定药物的患者结果信息

怎么能让机器学习像孩子一样学习语言

孩子们通过观察周围的环境,倾听周围的人,以及把所看到和听到的联系起来来学习语言。除此之外,这有助于孩....
发表于 05-21 15:56 28次 阅读
怎么能让机器学习像孩子一样学习语言

机器学习可以帮助农民提高产量

优化种子选择、减少肥料使用和检测农作物疾病早期迹象的机器学习软件正在彻底改变农业。现农业大部分处在自....
发表于 05-21 15:54 32次 阅读
机器学习可以帮助农民提高产量

AI专家为较小城市构建COVID-19预测模型

在机器学习,数据挖掘和模式识别方面具有专业知识的Malik Magdon-Ismail博士专门为纽约....
的头像 倩倩 发表于 05-21 11:01 326次 阅读
AI专家为较小城市构建COVID-19预测模型

behold.ai的基于AI的胸部X射线解决方案已获得CE认证

 “这对于公司以及我们的质量领导者团队,人工智能工程师和临床医生团队来说都是一个伟大的成果,他们多年....
的头像 倩倩 发表于 05-21 10:52 357次 阅读
behold.ai的基于AI的胸部X射线解决方案已获得CE认证

使用计算建模和机器学习方法来预测心脏“从原子到心律”的电毒性

“我们希望模型框架可以扩展到对药物发现,对各种化合物和靶标进行药物安全性筛查以及在各种监管过程中产生....
的头像 倩倩 发表于 05-21 10:49 270次 阅读
使用计算建模和机器学习方法来预测心脏“从原子到心律”的电毒性

研究人员已经使用机器学习来开发血液测试

这个由来自哈佛医学院,克利夫兰诊所,梅奥诊所等众多研究人员的研究人员组成的多机构团队对来自3,052....
的头像 倩倩 发表于 05-21 10:17 189次 阅读
研究人员已经使用机器学习来开发血液测试

微软与心血管健康公司Prevencio签署了一项新协议

Prevencio的HART测试涵盖了多种心血管疾病,包括阻塞性冠状动脉疾病,心脏病,中风,外周动脉....
的头像 倩倩 发表于 05-21 10:15 355次 阅读
微软与心血管健康公司Prevencio签署了一项新协议

生物公司利用机器学习找到冠状病毒的治疗方法

AbCellera使用机器学习来找到抗体疗法,并在二月份从诊断为COVID-19的患者那里获得了血液....
的头像 倩倩 发表于 05-21 10:12 191次 阅读
生物公司利用机器学习找到冠状病毒的治疗方法

Google已经推出了17种语言的免费培训课程

 新的培训课程由JournalismAI与VRT新闻和Google新闻倡议(GNI)合作制作。他们意....
的头像 倩倩 发表于 05-21 10:08 311次 阅读
Google已经推出了17种语言的免费培训课程

波士顿儿童医院开发了一个在线资源HealthMap

波士顿儿童医院首席创新官约翰·布朗斯坦(John Brownstein)在彭博市场上讨论了该技术。他....
的头像 倩倩 发表于 05-21 10:06 261次 阅读
波士顿儿童医院开发了一个在线资源HealthMap

开发可以识别Covid-19新型疗法的机器学习方法

就像硅谷一样神秘,计算机科学与工程专业的学生通常希望立志加入Facebook或Tesla这类公司时会....
的头像 倩倩 发表于 05-21 10:00 309次 阅读
开发可以识别Covid-19新型疗法的机器学习方法

人工智能可以缩短医院的等待时间

在我们的最新研究中,我们使用了机器学习(或人工智能(AI))来帮助医生和护士确定哪些患者已准备好出院....
的头像 倩倩 发表于 05-21 09:58 318次 阅读
人工智能可以缩短医院的等待时间

一种使用机器学习来发现其他尚未开发的具有治疗价值的非活性成分的方法

该研究的资深作者,机械工程学系助理教授,布莱根妇女医院的肠胃病学家Giovanni Traverso....
的头像 倩倩 发表于 05-21 09:56 169次 阅读
一种使用机器学习来发现其他尚未开发的具有治疗价值的非活性成分的方法

定制化服务器到底是什么

顾名思义,定制化服务器是基于传统服务器的基础,根据不同业务的实际需求进行研发、设计、生产的新型服务器....
发表于 05-21 08:00 56次 阅读
定制化服务器到底是什么

人人都能懂的机器学习算法原理教程免费下载

算法公式挺费神,机器学习太伤人。任何一个刚入门机器学习的人都会被复杂的公式和晦涩难懂的术语吓到。但其....
发表于 05-21 08:00 43次 阅读
人人都能懂的机器学习算法原理教程免费下载

摄像机再定位中深度学习的不确定性建模

我们提出了一个鲁棒的实时单目六自由度视觉重定位系统。利用贝叶斯卷积神经网络对单RGB图像的6自由度摄....
发表于 05-21 08:00 40次 阅读
摄像机再定位中深度学习的不确定性建模

TMP411 ±1°C Programmable Remote/Local Digital Out Temperature Sensor

TMP411设备是一个带有内置本地温度传感器的远程温度传感器监视器。远程温度传感器,二极管连接的晶体管通常是低成本,NPN或PNP型晶体管或二极管,是微控制器,微处理器或FPGA的组成部分。 远程精度为±1 °C适用于多个设备制造商,无需校准。双线串行接口接受SMBus写字节,读字节,发送字节和接收字节命令,以设置报警阈值和读取温度数据。 TMP411器件中包含的功能包括:串联电阻取消,可编程非理想因子,可编程分辨率,可编程阈值限制,用户定义的偏移寄存器,用于最大精度,最小和最大温度监视器,宽远程温度测量范围(高达150°C),二极管故障检测和温度警报功能。 TMP411器件采用VSSOP-8和SOIC-8封装。 特性 ±1°C远程二极管传感器 ±1°C本地温度传感器 可编程非理想因素 串联电阻取消 警报功能 系统校准的偏移寄存器 与ADT7461和ADM1032兼容的引脚和寄存器 可编程分辨率:9至12位 可编程阈值限...
发表于 09-19 16:35 170次 阅读
TMP411 ±1°C Programmable Remote/Local Digital Out Temperature Sensor

TMP468 具有引脚可编程的总线地址的高精度远程和本地温度传感器

TMP468器件是一款使用双线制SMBus或I 2 C兼容接口的多区域高精度低功耗温度传感器。除了本地温度外,还可以同时监控多达八个连接远程二极管的温度区域。聚合系统中的温度测量可通过缩小保护频带提升性能,并且可以降低电路板复杂程度。典型用例为监测服务器和电信设备等复杂系统中不同处理器(如MCU,GPU和FPGA)的温度。该器件将诸如串联电阻抵消,可编程非理想性因子,可编程偏移和可编程温度限值等高级特性完美结合,提供了一套精度和抗扰度更高且稳健耐用的温度监控解决方案。 八个远程通道(以及本地通道)均可独立编程,设定两个在测量位置的相应温度超出对应值时触发的阈值。此外,还可通过可编程迟滞设置避免阈值持续切换。 TMP468器件可提供高测量精度(0.75°C)和测量分辨率(0.0 625°C)。该器件还支持低电压轨(1.7V至3.6V)和通用双线制接口,采用高空间利用率的小型封装(3mm×3mm或1.6mm×1.6mm),可在计算系统中轻松集成。远程结支持-55°C至+ 150°C的温度范围。 特性 8通道远程二极管温度传感器精度:±0.75&...
发表于 09-18 16:05 114次 阅读
TMP468 具有引脚可编程的总线地址的高精度远程和本地温度传感器