0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

TensorFlow为新旧Mac特供新版本,GPU速度最高提升7倍

工程师邓生 来源:机器之心 作者:机器之心 2020-11-19 17:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

苹果「一呼百应」的号召力在机器学习领域似乎也不例外。新版 Mac 推出还不到两周,谷歌就把专为 Mac 优化的 TensorFlow 版本做好了,训练速度最高提升到原来的 7 倍。

对于开发者工程师、科研工作者来说,Mac 一直是非常受欢迎的平台,也有人用 Mac 训练神经网络,但训练速度一直是一个令人头疼的问题。

上周,苹果发布了搭载 Arm 架构 M1 芯片的三款新 Mac,于是就有人想问:用它们训练神经网络能快一点吗?

今天,主流机器学习框架 TensorFlow 发文表示:我们专门做了一版为 Mac 用户优化的 TensorFlow 2.4 框架,M1 版 Mac 和英特尔版 Mac 都能用。这一举动有望大幅降低模型训练和部署的门槛。

此前,在 Mac 上,TensorFlow 仅支持将 CPU 用于训练,但新的 tensorflow_macos 分支利用苹果的 ML Compute,能让 GPU 也被利用起来。苹果在博客中介绍说:「我们使用了更高级别的优化方法,比如熔合层,选择合适的设备类型,将图作为原语编译、执行并由 CPU 上的 BNNS 和 GPU 上的 Metal Performance Shader 加速。」

ML Compute 是苹果公司今年推出的新框架,可用于在 Mac 上进行 TensorFlow 模型的训练。现在,无论新的 M1 版 Mac 还是旧的英特尔版 Mac,其 CPU 和 GPU 都能用来加快训练速度。

M1 芯片包含新的 8 核 CPU 和最多 8 核的 GPU,并针对 Mac 的机器学习训练任务进行了优化。下面两张图表分别展示了针对 Mac 优化后的 TensorFlow 2.4 在不同模型训练中的性能提升:

上图展示了使用 ML Compute 分别在搭载 M1 和英特尔芯片的 13 英寸 MacBook Pro 上进行机器学习训练的情况。柱形的高度代表单批次的训练时长。可以看出,优化后的 Mac 版 TensorFlow 2.4 的训练速度得到了明显提升。在换成 M1 版的新 MacBook Pro 之后,提升就更为明显了,训练速度最高提升了 7 倍。

同样使用 ML Compute,在搭载英特尔芯片的 2019 Mac Pro 上进行常见模型的训练,性能提升也相当明显。

TensorFlow 官方表示,用户不需要对现有的 TensorFlow 脚本做任何更改,就可以使用 ML Compute 作为 TensorFlow 和 TensorFlow 插件的后端。

Mac 版 TensorFlow 2.4 的详细入门指南可以参见:https://github.com/apple/tensorflow_macos

M1 版 Mac 对机器学习用户的影响

苹果曾在发布会上介绍说,M1 芯片将苹果的神经网络引擎引入了 Mac,实现了 15 倍的机器学习任务加速。该神经网络引擎有 16 个核心,每秒运算速度可达 11 万亿次。除此之外,配置了 ML 加速器的 CPU 和强大 GPU(称霸集显,媲美部分独显)也使得整个 M1 芯片的机器学习能力得到巨大提升。

图源:https://medium.com/disruptive-nerd/how-is-the-apple-m1-going-to-affect-machine-learning-2d9da1beef86

性能的提升毋庸置疑,但软件兼容也是一个很大的问题。在 M1 版 Mac 发布之后,不少开发者都在问:我的 VS Code/Docker/Juypter Notebook…… 还能在新 Mac 上用吗?

VSCode:最快月底就能做出来

在苹果发布会之后不久,微软 VS Code 团队就发文表示,「VS Code 将支持 ARM 版 Mac,11 月底可能推出首个预览版。」

Mac/ARM64 试验版地址 https://code.visualstudio.com/insiders/#osx

此外,微软还宣布将发布一款新的通用版 Mac Office 2019,支持新版苹果处理器

Docker:在安排,但还没准备好

在 11 月 16 日的一篇博客中,Docker 的开发者表示,他们还没有准备好让 Docker 在 M1 版 Mac 上运行,在这之前还需要做很多准备。

Docker 表示,「我们 Docker 的目标是在新的 Mac 上提供与今天在 Docker Desktop for Mac 上同样出色的体验,并使这种过渡尽可能地无缝。」「为我们的客户打造合适的体验意味着在我们推送一个版本之前,要把不少事情做好。虽然苹果已经发布了 Rosetta 2 转译器,以帮助将应用程序转移到新的 M1 芯片上,但这并不能让我们与 Docker Desktop 一路同行。」

至于 Juypter Notebook 等软件,目前还没有官方消息放出。不过,随着苹果不断将生态打通,正在有越来越多的软件开发商表示将开发适配 M1 版 Mac 的新产品。

参考链接:

https://machinelearning.apple.com/updates/ml-compute-training-on-mac

https://medium.com/disruptive-nerd/how-is-the-apple-m1-going-to-affect-machine-learning-2d9da1beef86

https://www.docker.com/blog/apple-silicon-m1-chips-and-docker/

责任编辑:PSY

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134437
  • Mac
    Mac
    +关注

    关注

    0

    文章

    1125

    浏览量

    54860
  • tensorflow
    +关注

    关注

    13

    文章

    331

    浏览量

    61843
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    如何使用新版本J-Flash编程CW32 MCU

    1、从Segger公司官网下载安装最新版本JLink驱动,比如V7.96a,安装目录下没有JLinkDevices.xml文件。 2、在C:Users<用户名>
    发表于 11-12 07:24

    【直播预告】RT-Trace 全新版本发布|ITM输出 MemoryWatch 功能首发实测! | 问学直播

    RT-Trace迎来又一次重要更新!本次新版本带来了两项备受期待的功能——ITM输出与MemoryWatch内存监控,让调试可视化更高效、问题定位更精准。帮助开发者快速上手新特性
    的头像 发表于 10-14 11:57 347次阅读
    【直播预告】RT-Trace 全<b class='flag-5'>新版本</b>发布|ITM输出  MemoryWatch 功能首发实测! | 问学直播

    戴尔数据保护软件迎来全新版本

    无缝运行的异常检测,一站式监控多达150个系统,额外的MFA多重身份验证Dell PowerProtect Data Manager19.19全新版本现已到来!
    的头像 发表于 06-27 13:55 692次阅读

    普华基础软件开源汽车操作系统新版本代码上线

    近日,第二十一届上海国际汽车工业展览会现场,开源车用操作系统新版本代码上线仪式在中国电科展台成功召开。全球首个开源智能驾驶操作系统微内核龘EasyAda V2.1和首个规模化、量产级安全车控操作系统
    的头像 发表于 04-30 09:17 789次阅读

    普华基础软件开源车用操作系统迎来全新版本

    近日,普华基础软件开源车用操作系统媒体发布会在上海中国汽车会客厅召开——全球首个开源智能驾驶操作系统微内核龘EasyAda、开源安全车控操作系统小满EasyXMen全新版本正式发布。现场,普华基础软件开源项目技术团队专家就开源项目新版本技术亮点、新增功能及社区治理与运营等
    的头像 发表于 04-25 16:18 795次阅读

    SOA架构开发小助手PAVELINK.SOA-Converter 2.1.2新版本发布

    提升汽车SOA架构设计开发效率,优化用户体验,我们对PAVELINK.SOA-Converter进行了全新升级。本次2.1.2新版本升级,聚焦于提升软件性能、扩展功能特性及增强用户交
    的头像 发表于 04-09 10:37 1249次阅读
    SOA架构开发小助手PAVELINK.SOA-Converter 2.1.2<b class='flag-5'>新版本</b>发布

    AG32 SDK 更新版本1.7.0:加入dsp例程和Slave SPI例程

    新版本Version 1.7.0 1、加入dsp例程 加入dsp例程以及 DSP软件库 。 2、加入Slave SPI例程 加入用逻辑实现的Slave SPI例程spi/slave_spi ,提供
    发表于 03-17 10:04

    keil不同版本,有的文件在新版本上报错怎么办?要装两个版本一起用?

    有的文件在新版本上报错怎么办?要装两个版本一起用?
    发表于 03-10 07:05

    新版本 IDE 的启动速度变快了?原来是在背后做了这些!

    IDEA 需要加载和同步项目、执行索引编制以及完成许多其他小任务才能启用所有实用功能。在这篇博文中,我们将介绍在新版本 IntelliJ IDEA 中提高性能而采取的
    的头像 发表于 02-12 15:58 692次阅读
    <b class='flag-5'>新版本</b> IDE 的启动<b class='flag-5'>速度</b>变快了?原来是在背后做了这些!

    GUI Guider v1.9.0全新版本上线

    新年伊始,GUI Guider也迎来了全新版本!这一次,我们带来了多项重磅更新,旨在为你提供更强大、更便捷的开发体验。无论你是工业控制、智能家居,还是消费电子领域的开发者,这些更新都将为你的项目注入新的活力!
    的头像 发表于 02-07 10:43 4499次阅读

    GPU-Z迎来2.62 版本的更新发布

    显卡性能评估和系统优化提供有力的数据支持。除了 RTX 5090 和 RTX 5080,新版本还增加了对 GeForce RTX 50 系列其
    的头像 发表于 02-05 15:33 1080次阅读

    新版本 IDE 的启动速度变快了?原来是在背后做了这些!

    新版本 IntelliJ IDEA 中提高性能而采取的措施,这些措施缩短了代码可交互时间并使 IDE 从启动开始就具有更高的响应速度
    的头像 发表于 01-24 13:49 754次阅读
    <b class='flag-5'>新版本</b> IDE 的启动<b class='flag-5'>速度</b>变快了?原来是在背后做了这些!

    高通推出Qualcomm Aware平台最新版本

    在CES 2025上,高通技术公司宣布推出Qualcomm Aware平台的最新版本,这一基于云的服务平台支持企业物流、零售、能源、智能家居和机器人等行业的智能网联终端增加可观测性、监测和定位功能
    的头像 发表于 01-07 10:36 1306次阅读

    EMMC存储速度如何提升

    ,通过修改设备树文件或相关配置来启用8线模式,可以提高eMMC的传输速度。 升级硬件 : 如果条件允许,可以考虑更换为更高版本的eMMC芯片,因为新版本通常具有更快的读写速度。 二、软
    的头像 发表于 12-25 09:31 3002次阅读

    索尼发布空间现实显示播放器新版本

    索尼于2024年12月发布适用于空间现实显示屏ELF-SR1和ELF-SR2的空间现实显示播放器新版本
    的头像 发表于 12-24 15:19 945次阅读