0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

PyTorch 1.8正式官宣发布还支持AMD GPU!

新机器视觉 来源:量子位(QbitAI) 作者:梦晨 2021-03-12 11:06 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

导读

Pytorch1.8来啦!1.8版本中,官方终于加入了对AMD ROCm的支持,可以方便的在原生环境下运行,不用去配置Docker了。 1.8版本中,官方终于加入了对AMD ROCm的支持,可以方便的在原生环境下运行,不用去配置Docker了。

AMD ROCm只支持Linux操作系统

1.8版本集合了自2020年10月1.7发布以来的超过3000次GitHub提交。此外,本次更新还有诸多亮点:

优化代码,更新编译器

Python内函数转换

增强分布式训练

新的移动端教程与演示

新的性能检测工具

相关的库TorchCSPRNG, TorchVision, TorchText和TorchAudio也会随之更新。要注意的是,自1.6起,Pytorch新特性将分为Stable、Beta、Prototype三种版本。其中Prototype不会包含到稳定发行版中,需要从Nightly版本自行编译。

Python to Python函数转换

新增的Beta特性torch.fx可以实现Python到Python的函数转换,可以方便的加入任何工作流程。新的API,向NumPy学习!

1.7版本中增加的Beta特性torch.fft已成为正式特性。实现了与Numpy中的np.fft类似的快速傅立叶变换,还增加了硬件加速支持与自动求导,以更好的支持科学计算。还增加了Beta版NumPy风格的线性代数模块torch.linalg,支持Cholesky分解、行列式、特征值等功能。

增强分布式训练

增加了稳定的异步错误与超时处理,增加NCCL的可靠性。增加了Beta版的流水线并行功能*(Pipeline Parallelism)*,可将数据拆解成更小的块以提高并行计算效率。

Pipeline Parallelism使用4个GPU时的工作示意图

增加Beta版的DDP通讯钩子,用于控制如何在workers之间同步梯度。

另外还有一些Prototype版的分布式训练新特性。

ZeroRedundancyOptimizer:用于减少所有参与进程的内存占用。

Process Group NCCL Send/Recv:让用户可在Python而不是C++上进行集合运算。

CUDA-support in RPC using TensorPipe:增加对N卡多卡运算的效率。

Remote Module:让用户像操作本地模块一样操作远程模块。

移动端新教程

随本次更新发布了图像分割模型DeepLabV3在安卓和IOS上的详细教程。以及图像分割、目标检测、神经机器翻译等在安卓和IOS上的演示程序,方便大家更快上手。 另外还有PyTorch Mobile Lite Interpreter解释器,可以减少运行时文件的大小。

性能检测工具

增加Beta版的Benchmark utils,用户可以进行精确的性能测试。以及Prototype版的FX Graph Mode Quantization,实现了量化过程的自动化。更多新版本详情,见下方链接。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134449
  • NVIDIA技术
    +关注

    关注

    0

    文章

    17

    浏览量

    6547
  • python
    +关注

    关注

    57

    文章

    4857

    浏览量

    89572
  • pytorch
    +关注

    关注

    2

    文章

    813

    浏览量

    14696

原文标题:PyTorch 1.8来了!正式支持AMD GPU,炼丹不必NVIDIA

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AMD Vitis AI 5.1测试版发布

    AMD Vitis AI 5.1全新发布——新增了对 AMD Versal AI Edge 系列神经网络处理单元 (NPU) 的支持。Vitis AI 包含优化的 NPU IP、模型编
    的头像 发表于 10-31 12:46 489次阅读

    今日看点:长鑫存储宣发布LPDDR5X,苹果自研 5G 芯片 C2 曝光

      长鑫存储宣发布LPDDR5X 据长鑫存储官方网站信息更新,长鑫存储已正式推出LPDDR5X产品,最高速率达到10667Mbps。据网产品信息介绍,“LPDDR5/5X 是第五代超低功耗双倍
    发表于 10-30 09:53 830次阅读

    光峰科技发布两款水下激光雷达产品

    9月10日,光峰科技在第26届中国国际光电博览会(CIOE)现场举行水下激光雷达发布会,正式宣发布两款水下激光雷达产品——远眸D10、远眸T1,将覆盖消费级和专业级水下机器人市场。
    的头像 发表于 09-10 16:40 755次阅读

    Imagination GPU 全面支持 Vulkan 1.4 和 Android 16

    Imagination最新发布的驱动(DDK25.1RTM2)支持最新版本Android操作系统,同时增强了OpenCL扩展集及Android平台上Vulkan1.4支持。Vulkan
    的头像 发表于 08-14 11:18 1840次阅读
    Imagination <b class='flag-5'>GPU</b> 全面<b class='flag-5'>支持</b> Vulkan 1.4 和 Android 16

    aicube的n卡gpu索引该如何添加?

    请问有人知道aicube怎样才能读取n卡的gpu索引呢,我已经安装了cuda和cudnn,在全局的py里添加了torch,能够调用gpu,当还是只能看到默认的gpu0,显示不了gpu1
    发表于 07-25 08:18

    摩尔线程发布Torch-MUSA v2.0.0版本 支持原生FP8和PyTorch 2.5.0

    支持原生FP8数据类型,支持PyTorch 2.5.0 ,并通过多项针对MUSA计算平台的性能优化,进一步提升了对AI模型和大规模数据处理的支持能力。 FP8原生
    的头像 发表于 05-11 16:41 1264次阅读

    专访AMD王启尚 从RDNA 4到FSR 4,AMD GPU技术创新引领行业新发展

    在近日于珠海举办的AMD新一代Radeon RX 9070系列显卡发布会后,AMD GPU技术与工程研发副总裁王启尚接受了我们的专访。在本次交谈中,他详细分享了RDNA 4架构的设计理
    的头像 发表于 03-06 11:19 694次阅读
    专访<b class='flag-5'>AMD</b>王启尚 从RDNA 4到FSR 4,<b class='flag-5'>AMD</b> <b class='flag-5'>GPU</b>技术创新引领行业新发展

    操作指南:pytorch云服务器怎么设置?

    设置PyTorch云服务器需选择云平台,创建合适的GPU实例,安装操作系统、Python及Anaconda,创建虚拟环境,根据CUDA版本安装PyTorch,配置环境变量,最后验证安装。过程中需考虑
    的头像 发表于 02-08 10:33 605次阅读

    AMD将DeepSeek-V3模型集成至Instinct MI300X GPU

    AMD近日宣布了一项重要进展,成功将全新的DeepSeek-V3模型集成到其Instinct MI300X GPU上。这一举措标志着AMD在AI推理优化方面迈出了重要一步。 据了解
    的头像 发表于 02-06 09:41 813次阅读

    GPU-Z迎来2.62 版本的更新发布

    近日,GPU-Z 迎来了 2.62 版本的更新发布。此次更新,主要是为了适配英伟达最新推出的 RTX 50 系列显卡,为用户提供更全面、准确的硬件信息。 在新发布的 2.62 版本中,GPU
    的头像 发表于 02-05 15:33 1083次阅读

    AMD集成DeepSeek-V3模型至Instinct MI300X GPU

    AMD近日宣布了一项重要的技术进展,即将全新的DeepSeek-V3模型成功集成到其旗舰级GPU产品——Instinct MI300X上。这一举措标志着AMD在人工智能推理领域迈出了坚实的一步
    的头像 发表于 02-05 13:58 779次阅读

    利用Arm Kleidi技术实现PyTorch优化

    PyTorch 是一个广泛应用的开源机器学习 (ML) 库。近年来,Arm 与合作伙伴通力协作,持续改进 PyTorch 的推理性能。本文将详细介绍如何利用 Arm Kleidi 技术提升 Arm
    的头像 发表于 12-23 09:19 1617次阅读
    利用Arm Kleidi技术实现<b class='flag-5'>PyTorch</b>优化

    《CST Studio Suite 2024 GPU加速计算指南》

    的各个方面,包括硬件支持、操作系统支持、许可证、GPU计算的启用、NVIDIA和AMD GPU的详细信息以及相关的使用指南和故障排除等内容。
    发表于 12-16 14:25

    AMD发布Ryzen Master软件2.14.1.3286版本

    AMD最近发布了Ryzen Master软件的2.14.1.3286版本,该版本在内存超频和CPU参数调整方面进行了显著改进。其中最引人注目的新功能是支持即时动态超频的AMD EXPO
    的头像 发表于 12-13 16:14 1724次阅读

    ADS4449的spi信号支持1.8v电平吗?

    ADS4449的数据手册中是这样描述的:“All digital inputs support 1.8-V logic levels. SPI supports 3.3-V logic levels”;问下ADS4449的spi信号支持
    发表于 12-09 06:04