0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

深度学习框架只为GPU? 答案在这里

模拟对话 2018-03-14 18:29 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

目前大多数的机器学习是在处理器上完成的,大多数机器学习软件会针对GPU进行更多的优化,甚至有人认为学习加速必须在GPU上才能完成,但事实上无论是运行机器学习的处理器还是优化的深度学习框架,都不单只针对GPU,代号为“Skylake”的英特尔至强SP处理器就证明了这一点。

机器学习软件在英特尔至强SP系列白金版上的一系列基准测试性能表现与在GPU上非常相近,了解了底层架构之后,我们可以看到,在性能如此接近的情况下,使用GPU加速器更像是在购买一种“奢侈品”,用户在GPU以外还有很多其他的选择。毫无疑问,在用户只需要机器学习的情况下,“加速器”在性能和能耗方面更有优势,大多数人需要的不只是一台“智能的用于机器学习的服务器”,那就让我们来重点看一下英特尔至强SP 白金级处理器为什么是最佳的选择:

CPU优化深度学习框架和函数库

英特尔在基于GPU优化的框架中增加了CPU优化深度学习框架, 打破了深度学习框架偏重于GPU而忽视了CPU的行业现状,解决了目前这些框架缺乏CPU优化的实际问题。

- TensorFlow由谷歌开发,是一个领先的深度学习和机器学习框架,有面向Linux的处理器优化

- Caffe是图片识别领域最受欢迎的应用之一,英特尔提供的优化可以在CPU运行时提高Caffe的性能

- Torch是当下流行的深度学习框架,需要在优化的CPU上应用,可以通过英特尔软件优化(比如英特尔至强可扩展处理器)提高Torch在CPU上的性能

- Theano是一个开源的Python库,很受机器学习程序员的欢迎,它可以帮助程序员高效地定义、优化和评估涉及多维阵列的数学表达式

- Neon是一个基于Python的深度学习框架,目的是在现代深度神经网络上实现易用性和可扩展性,并致力于在所有硬件上实现性能的最大化

- MXNet是一个开源的深度学习框架

- Python及其函数库是机器学习应用里最受欢迎的基础组成,Python加速版过去几年里得到了广泛应用,并且可以直接下载或通过Conda、yum、apt-get或Docker images下载

- BigDL是一个面向Apache Spark的分布式深度学习函数库。通过BigDL用户可以把自己的深度学习应用当作标准Apache Spark程序来编写,直接在现有Apache Spark或Hadoop集群上运行。在Torch基础上开发的BigDL可以为深度学习提供综合性支持:包括数值计算(通过Tensor)和高级神经网络;此外用户还可以利用BigDL把提前训练的Caffe或Torch模型载入Spark程序。英特尔曾声称在一个单节点至强处理器上(例如与GPU相比),BigDL中的处理速度比原始开源Caffe、Torch或TensorFlow要高一个数量级

- 英特尔MKL-DNN是一个开源的、性能强化的函数库,用于加速在CPU上的深度学习框架

- 英特尔数据分析加速库(DAAL)是一个包含了被优化的算法构建模块的开源函数库,针对大数据问题最相关的数据分析阶段。这个函数库适用于当下流行的数据平台,包括Hadoop、Spark、R和Matlab

结果证明了一切,无论是TensorFlow、Caffe,还是Torch、Theano,这些深度学习框架都针对英特尔数学核心函数库(Intel MKL)和英特尔高级矢量扩展指令集(Intel AVX)进行了优化。通过CPU优化,TensorFlow和Caffe基准测试中的CPU性能分别提高了72倍和82倍。

机器学习加速器

科技与行业的发展都是瞬息万变的,机器学习的加速器也会从GPU转向FPGAASIC等等,除非我们永远只需要一台只能用于机器学习的服务器,只要在一台服务器上想实现可以支持各种的工作负载,英特尔至强可扩展处理器无疑是最佳的解决方案。加速器的选择正在变得多元化,这是整个行业的发展趋势,多核CPU(英特尔至强融核处理器,特别是“Knights Mill”版)和FPGA(英特尔至强处理器,包含Intel/Altera FPGA)都可以提供更灵活的选择、卓越的性价比和高能效。基于英特尔至强融核处理器训练或学习一个AlexNet图片分类系统的速度,是使用NVIDIA GPU的类似配置系统的2.3倍;英特尔至强融核处理器的性价比最高可以是GPU解决方案的9倍,每瓦性能高达8倍,英特尔Nervana将推出更多专为人工智能开发的产品。英特尔至强SP系列处理器为机器学习提供了卓越的性能,同时相比其他解决方案也为我们带来了更多的功能与选择,让我们在产品与行业的发展中都可以拥有更多可能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1655

    文章

    22282

    浏览量

    630111
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134433
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261425
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136220
  • 深度学习
    +关注

    关注

    73

    文章

    5590

    浏览量

    123892
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战课(11大系列课程,共5000+分钟)

    GPU加速训练(可选) 双轨教学:传统视觉算法+深度学习方案全覆盖 轻量化部署:8.6M超轻OCR模型,适合嵌入式设备集成 无监督学习:无需缺陷样本即可训练高精度检测模型 持续更新:
    发表于 12-04 09:28

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战可(11大系列课程,共5000+分钟)

    领域主流开发环境,LabVIEW与深度学习的集成一直是行业痛点。课程提供独家开发的labview调用框架,实现从模型训练(Python)到部署(LabVIEW)的无缝衔接,已成功应用于DIP、AOI
    发表于 12-03 13:50

    国产传感器产业发展破局点或在这里

        “十四五”期间中国传感器产业发展中存在的最严峻问题,“十五五”传感器产业政策破局方向或在这里!     进入10月份,踏入2025年的第四季度,2025年是我国经济发展中的“节点”年
    的头像 发表于 10-29 18:13 689次阅读
    国产传感器产业发展破局点或<b class='flag-5'>在这里</b>

    变压器输入和输出电压该怎么选?答案在这里

    变压器作为一种电力设备,输入和输出电压的选用对于确保设备正常运行和安全至关重要。以下是选择输入和输出电压时,需要考虑的因素:
    的头像 发表于 07-04 14:49 987次阅读

    GPU架构深度解析

    GPU架构深度解析从图形处理到通用计算的进化之路图形处理单元(GPU),作为现代计算机中不可或缺的一部分,已经从最初的图形渲染专用处理器,发展成为强大的并行计算引擎,广泛应用于人工智能、科学计算
    的头像 发表于 05-30 10:36 1238次阅读
    <b class='flag-5'>GPU</b>架构<b class='flag-5'>深度</b>解析

    ARM Mali GPU 深度解读

    ARM Mali GPU 深度解读 ARM Mali 是 Arm 公司面向移动设备、嵌入式系统和基础设施市场设计的图形处理器(GPU)IP 核,凭借其异构计算架构、能效优化和生态协同,成为全球移动
    的头像 发表于 05-29 10:12 2969次阅读

    为何 MCX 插头会呈现大小不同?答案在这里

    同时,设备制造商在产品设计阶段,会根据整体结构和接口规划,审慎选择合适大小的 MCX 插头。这一决策不仅关乎插头与内部组件的适配,还影响着设备的外部接口兼容性和可扩展性,确保产品在复杂的电子生态系统中能够无缝对接、协同工作。
    的头像 发表于 04-11 08:40 432次阅读
    为何 MCX 插头会呈现大小不同?<b class='flag-5'>答案</b><b class='flag-5'>在这里</b>

    百度飞桨框架3.0正式版发布

    大模型训练成本高?推理效率低?硬件适配难? 4月1日,百度发布 飞桨框架3.0正式版 !五大特性专为大模型设计。 作为大模型时代的Infra“基础设施”,深度学习框架的重要性愈发凸显,
    的头像 发表于 04-02 19:03 1040次阅读
    百度飞桨<b class='flag-5'>框架</b>3.0正式版发布

    嵌入式AI技术之深度学习:数据样本预处理过程中使用合适的特征变换对深度学习的意义

      作者:苏勇Andrew 使用神经网络实现机器学习,网络的每个层都将对输入的数据做一次抽象,多层神经网络构成深度学习框架,可以深度理解数
    的头像 发表于 04-02 18:21 1278次阅读

    腾讯会议免费40分钟不够用?你要的秘诀在这里

    影响效率。更令人担忧的是,未来免费时长可能进一步缩短。那么,有没有一种经济实惠又功能强大的解决方案呢?答案在这里:结合树莓派和3CXPBX,你就能打造一个无时间限制
    的头像 发表于 03-25 09:24 1611次阅读
    腾讯会议免费40分钟不够用?你要的秘诀<b class='flag-5'>在这里</b>!

    军事应用中深度学习的挑战与机遇

    人工智能尤其是深度学习技术的最新进展,加速了不同应用领域的创新与发展。深度学习技术的发展深刻影响了军事发展趋势,导致战争形式和模式发生重大变化。本文将概述
    的头像 发表于 02-14 11:15 818次阅读

    买云数据库要购买服务器吗?答案在这里

    云数据库通常无需用户购买服务器,由提供商负责底层硬件维护。用户可通过Web界面或API配置和管理数据库,根据需求选择合适的类型、规格和策略。在特殊情况下,如性能或安全需求无法满足,用户可能需自建数据库并购买服务器。以下是UU云小编对云数据库要购买服务器吗相关问题的详细解答:
    的头像 发表于 01-17 09:55 530次阅读

    美国高防云服务器真的好用吗?答案在这里

    美国高防云服务器在性能、安全性和可扩展性上具有优势,适合需要高速网络连接、强大安全防护和灵活资源的用户。选择时需考虑提供商的服务质量、技术支持、数据隐私和合规性等因素。虽然存在地理距离和时差挑战,但对于追求这些特性的用户而言,美国高防云服务器仍是一个值得考虑的选择。
    的头像 发表于 12-25 10:31 486次阅读

    Triton编译器在机器学习中的应用

    多种深度学习框架,如TensorFlow、PyTorch、ONNX等,使得开发者能够轻松地将不同框架下训练的模型部署到GPU上。 2. Tr
    的头像 发表于 12-24 18:13 1622次阅读

    深度学习工作负载中GPU与LPU的主要差异

    ,一个新的竞争力量——LPU(Language Processing Unit,语言处理单元)已悄然登场,LPU专注于解决自然语言处理(NLP)任务中的顺序性问题,是构建AI应用不可或缺的一环。 本文旨在探讨深度学习工作负载中GPU
    的头像 发表于 12-09 11:01 3907次阅读
    <b class='flag-5'>深度</b><b class='flag-5'>学习</b>工作负载中<b class='flag-5'>GPU</b>与LPU的主要差异