0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

PyTorch 1.8发布,支持AMD ROCm

深度学习自然语言处理 来源:量子位 作者:梦晨 2021-03-08 10:50 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

1.8版本中,官方终于加入了对AMD ROCm的支持,可以方便的在原生环境下运行,不用去配置Docker了。

△AMD ROCm只支持Linux操作系统

1.8版本集合了自2020年10月1.7发布以来的超过3000次GitHub提交。 此外,本次更新还有诸多亮点:

优化代码,更新编译器

Python内函数转换

增强分布式训练

新的移动端教程与演示

新的性能检测工具

相关的库TorchCSPRNG, TorchVision, TorchText和TorchAudio也会随之更新。 要注意的是,自1.6起,Pytorch新特性将分为Stable、Beta、Prototype三种版本。其中Prototype不会包含到稳定发行版中,需要从Nightly版本自行编译。

Python to Python函数转换

新增的Beta特性torch.fx可以实现Python到Python的函数转换,可以方便的加入任何工作流程。

新的API,向NumPy学习!

1.7版本中增加的Beta特性torch.fft已成为正式特性。实现了与Numpy中的np.fft类似的快速傅立叶变换,还增加了硬件加速支持与自动求导,以更好的支持科学计算。 还增加了Beta版NumPy风格的线性代数模块torch.linalg,支持Cholesky分解、行列式、特征值等功能。

增强分布式训练

增加了稳定的异步错误与超时处理,增加NCCL的可靠性。 增加了Beta版的流水线并行功能*(Pipeline Parallelism)*,可将数据拆解成更小的块以提高并行计算效率。

△Pipeline Parallelism使用4个GPU时的工作示意图

增加Beta版的DDP通讯钩子,用于控制如何在workers之间同步梯度。 另外还有一些Prototype版的分布式训练新特性。ZeroRedundancyOptimizer:用于减少所有参与进程的内存占用。Process Group NCCL Send/Recv:让用户可在Python而不是C++上进行集合运算。CUDA-support in RPC using TensorPipe:增加对N卡多卡运算的效率。Remote Module:让用户像操作本地模块一样操作远程模块。

移动端新教程

随本次更新发布了图像分割模型DeepLabV3在安卓和IOS上的详细教程。 以及图像分割、目标检测、神经机器翻译等在安卓和IOS上的演示程序,方便大家更快上手。

另外还有PyTorch Mobile Lite Interpreter解释器,可以减少运行时文件的大小。

原文标题:PyTorch 1.8来了!正式支持AMD GPU,炼丹不必NVIDIA

文章出处:【微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5647

    浏览量

    138997
  • python
    +关注

    关注

    57

    文章

    4856

    浏览量

    89547
  • pytorch
    +关注

    关注

    2

    文章

    813

    浏览量

    14679

原文标题:PyTorch 1.8来了!正式支持AMD GPU,炼丹不必NVIDIA

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    ROCm部署PP-StructureV3到AMD GPU上

    作者:AVNET 李鑫杰 我们在上一篇文章中介绍了ROCm+PP-OCRv5,为实现在AMD计算平台上完成复杂文档的端到端智能解析,本文基于ROCm软件栈,提供一套完整的PP-StructureV3
    的头像 发表于 11-13 16:56 5197次阅读
    用<b class='flag-5'>ROCm</b>部署PP-StructureV3到<b class='flag-5'>AMD</b> GPU上

    AMD Vitis AI 5.1测试版发布

    AMD Vitis AI 5.1全新发布——新增了对 AMD Versal AI Edge 系列神经网络处理单元 (NPU) 的支持。Vitis AI 包含优化的 NPU IP、模型编
    的头像 发表于 10-31 12:46 481次阅读

    全新升级 | 匠芯创AiUIBuilder V2.0.0发布

    近日,匠芯创自主研发的GUI开发工具AiUIBuilderV2.0.0发布。作为一款基于LVGL的UI设计工具,AiUIBuilder致力于通过拖拽式操作,加速基于匠芯创嵌入式平台的图形应用开发
    的头像 发表于 10-29 10:03 580次阅读
    全新升级 | 匠芯创AiUIBuilder V2.0.0<b class='flag-5'>发布</b>

    G2发布最新报告,Splashtop 荣膺多区域领导者,IT 远程解决方案获全球认可

    近日,全球权威软件评测平台G2发布了2025年秋季报告,Splashtop在端点管理、补丁管理、远程支持和远程桌面类别中表现亮眼,荣获多项荣誉。凭借在欧洲、中东和非洲(EMEA)、欧洲、英国和加
    的头像 发表于 10-20 17:02 1002次阅读
    G2<b class='flag-5'>发布</b>最新报告,Splashtop 荣膺多区域领导者,IT 远程解决方案获全球认可

    技嘉2025发布会:“从心出发 我们的主张”,迈向AI新纪元

    体验优化,全方位展现技嘉在主板、整机、软件工具等领域的技术沉淀与产品实力,为全球硬件爱好者呈现一场 “始于需求,忠于体验” 的科技盛宴。 在技嘉新品发布会上,行业巨头与意见领袖齐聚一堂。英伟达、英特尔和AMD代表共同出席,同时邀
    的头像 发表于 09-19 10:07 389次阅读
    技嘉2025<b class='flag-5'>发布</b>会:“从心出发 我们的主张”,迈向AI新纪元

    ROCm 6.2.4 成功移植至 SG2044: 大模型部署速率飙升,RISC-V + AI 新纪元!代码已经开源,一起来试试!

    AMD7900xtxonSOPHGOSG2044PCLT团队倾注心血,精心完成了将ROCm软件栈适配到SG2044独特架构的复杂工作。这包括:内核级适配:确保ROCm驱动程序和底层组件能够与SG
    的头像 发表于 07-14 17:04 1007次阅读
    <b class='flag-5'>ROCm</b> 6.2.4 成功移植至 SG2044: 大模型部署速率飙升,RISC-V + AI 新纪元!代码已经开源,一起来试试!

    请问CYUSB232开发板 是否支持1.8V Uart输入?

    请问CYUSB232开发板 是否支持1.8V Uart输入
    发表于 05-30 06:51

    重磅更新 | 先楫半导体HPM_APPS v1.9.0发布

    重磅更新 | 先楫半导体HPM_APPS v1.9.0发布
    的头像 发表于 05-13 11:29 1336次阅读
    重磅更新 | 先楫半导体HPM_APPS v1.9.0<b class='flag-5'>发布</b>

    摩尔线程发布Torch-MUSA v2.0.0版本 支持原生FP8和PyTorch 2.5.0

    近日,摩尔线程正式发布Torch-MUSA v2.0.0版本,这是其面向PyTorch深度学习框架的MUSA扩展库的重要升级。新版本基于MUSA Compute Capability 3.1计算架构
    的头像 发表于 05-11 16:41 1262次阅读

    先楫半导体HPM_SDK v1.7.0发布!这些更新你值得关注!

    先楫半导体HPM_SDK v1.7.0发布!这些更新你值得关注!
    的头像 发表于 02-08 13:42 1035次阅读
    先楫半导体HPM_SDK v1.7.0<b class='flag-5'>发布</b>!这些更新你值得关注!

    技嘉CES 2025发布B800系列主板,AI重塑游戏性能

    全球知名电脑品牌技嘉科技在CES 2025上隆重发布了新一代Intel® B860和AMD B850系列主板,为PC玩家带来前所未有的游戏体验。 此次发布的B800系列主板,采用了全新的AI技术
    的头像 发表于 01-14 13:41 966次阅读

    利用Arm Kleidi技术实现PyTorch优化

    PyTorch 是一个广泛应用的开源机器学习 (ML) 库。近年来,Arm 与合作伙伴通力协作,持续改进 PyTorch 的推理性能。本文将详细介绍如何利用 Arm Kleidi 技术提升 Arm
    的头像 发表于 12-23 09:19 1611次阅读
    利用Arm Kleidi技术实现<b class='flag-5'>PyTorch</b>优化

    AMD Alveo媒体加速产品组合SDK 1.2.1发布

    我们很高兴地宣布AMD Alveo 媒体加速产品组合( AMA )SDK 1.2.1 版本发布,从而进一步扩展 AMD Alveo MA35D 媒体加速卡功能。
    的头像 发表于 12-18 16:01 1030次阅读

    AMD发布Ryzen Master软件2.14.1.3286版本

    AMD最近发布了Ryzen Master软件的2.14.1.3286版本,该版本在内存超频和CPU参数调整方面进行了显著改进。其中最引人注目的新功能是支持即时动态超频的AMD EXPO
    的头像 发表于 12-13 16:14 1720次阅读

    ADS4449的spi信号支持1.8v电平吗?

    ADS4449的数据手册中是这样描述的:“All digital inputs support 1.8-V logic levels. SPI supports 3.3-V logic levels”;问下ADS4449的spi信号支持
    发表于 12-09 06:04