0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

PyTorch 1.8正式官宣发布还支持AMD GPU!

新机器视觉 来源:量子位(QbitAI) 作者:梦晨 2021-03-12 11:06 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

导读

Pytorch1.8来啦!1.8版本中,官方终于加入了对AMD ROCm的支持,可以方便的在原生环境下运行,不用去配置Docker了。 1.8版本中,官方终于加入了对AMD ROCm的支持,可以方便的在原生环境下运行,不用去配置Docker了。

AMD ROCm只支持Linux操作系统

1.8版本集合了自2020年10月1.7发布以来的超过3000次GitHub提交。此外,本次更新还有诸多亮点:

优化代码,更新编译器

Python内函数转换

增强分布式训练

新的移动端教程与演示

新的性能检测工具

相关的库TorchCSPRNG, TorchVision, TorchText和TorchAudio也会随之更新。要注意的是,自1.6起,Pytorch新特性将分为Stable、Beta、Prototype三种版本。其中Prototype不会包含到稳定发行版中,需要从Nightly版本自行编译。

Python to Python函数转换

新增的Beta特性torch.fx可以实现Python到Python的函数转换,可以方便的加入任何工作流程。新的API,向NumPy学习!

1.7版本中增加的Beta特性torch.fft已成为正式特性。实现了与Numpy中的np.fft类似的快速傅立叶变换,还增加了硬件加速支持与自动求导,以更好的支持科学计算。还增加了Beta版NumPy风格的线性代数模块torch.linalg,支持Cholesky分解、行列式、特征值等功能。

增强分布式训练

增加了稳定的异步错误与超时处理,增加NCCL的可靠性。增加了Beta版的流水线并行功能*(Pipeline Parallelism)*,可将数据拆解成更小的块以提高并行计算效率。

Pipeline Parallelism使用4个GPU时的工作示意图

增加Beta版的DDP通讯钩子,用于控制如何在workers之间同步梯度。

另外还有一些Prototype版的分布式训练新特性。

ZeroRedundancyOptimizer:用于减少所有参与进程的内存占用。

Process Group NCCL Send/Recv:让用户可在Python而不是C++上进行集合运算。

CUDA-support in RPC using TensorPipe:增加对N卡多卡运算的效率。

Remote Module:让用户像操作本地模块一样操作远程模块。

移动端新教程

随本次更新发布了图像分割模型DeepLabV3在安卓和IOS上的详细教程。以及图像分割、目标检测、神经机器翻译等在安卓和IOS上的演示程序,方便大家更快上手。 另外还有PyTorch Mobile Lite Interpreter解释器,可以减少运行时文件的大小。

性能检测工具

增加Beta版的Benchmark utils,用户可以进行精确的性能测试。以及Prototype版的FX Graph Mode Quantization,实现了量化过程的自动化。更多新版本详情,见下方链接。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5271

    浏览量

    136059
  • NVIDIA技术
    +关注

    关注

    0

    文章

    17

    浏览量

    6581
  • python
    +关注

    关注

    58

    文章

    4884

    浏览量

    90300
  • pytorch
    +关注

    关注

    2

    文章

    813

    浏览量

    14921

原文标题:PyTorch 1.8来了!正式支持AMD GPU,炼丹不必NVIDIA

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    如何在 VisionFive v2 上使用外部 GPU

    如果旧的 amd gpu 在 VisionFive V2 上运行,我想使用带有开源 amd 驱动程序的 amd gpu。我需要什么以及如何将
    发表于 03-13 06:38

    PyTorch 中RuntimeError分析

    ://download.pytorch.org/whl/cu118 方案3:使用替代上采样模式 如果你的任务允许,可以将 mode=\'nearest\' 替换为其他已支持 BFloat16 的模式,例如 mode
    发表于 03-06 06:02

    Pytorch 与 Visionfive2 兼容吗?

    Pytorch 与 Visionfive2 兼容吗? $ pip3 install torch torchvision torchaudio --index-url https
    发表于 02-06 08:28

    解析ISL62776:AMD CPU/GPU核心电源的理想之选

    解析ISL62776:AMD CPU/GPU核心电源的理想之选 在如今的电子设备中,CPU和GPU的性能不断提升,对电源管理的要求也越来越高。ISL62776作为一款专为AMD CPU
    的头像 发表于 02-04 16:30 395次阅读

    今日看点:消息称 AMD、高通考虑导入 SOCAMM 内存;曦望发布新一代推理GPU芯片启望S3

    曦望发布新一代推理GPU芯片启望S3 近日,浙江杭州GPU创企曦望(Sunrise)发布新一代推理GPU芯片启望S3,并推出面向大模型推理的
    发表于 01-28 11:09 1318次阅读

    AMD Power Design Manager 2025.2版本现已发布

    AMD Power Design Manager 2025.2 版本现已发布,并正式支持第二代 AMD Versal AI Edge 系列器件和第二代 Prime 系列器件。
    的头像 发表于 12-24 11:08 785次阅读

    全新AMD Vitis统一软件平台2025.2版本发布

    AMD Vitis统一软件平台 2025.2 版现已推出,此版本为使用 AMD Versal AI Engine 的高性能 DSP 应用提供了更出色的设计环境,增强了仿真功能以加快复杂设计。
    的头像 发表于 12-12 15:06 850次阅读

    AMD Vivado Design Suite 2025.2版本现已发布

    AMD Vivado Design Suite 2025.2 版本现已发布,新增对 AMD Versal 自适应 SoC 的设计支持,包含新器件支持
    的头像 发表于 12-09 15:11 1312次阅读

    AMD Vitis AI 5.1测试版发布

    AMD Vitis AI 5.1全新发布——新增了对 AMD Versal AI Edge 系列神经网络处理单元 (NPU) 的支持。Vitis AI 包含优化的 NPU IP、模型编
    的头像 发表于 10-31 12:46 984次阅读

    今日看点:长鑫存储宣发布LPDDR5X,苹果自研 5G 芯片 C2 曝光

      长鑫存储宣发布LPDDR5X 据长鑫存储官方网站信息更新,长鑫存储已正式推出LPDDR5X产品,最高速率达到10667Mbps。据网产品信息介绍,“LPDDR5/5X 是第五代超低功耗双倍
    发表于 10-30 09:53 1181次阅读

    光峰科技发布两款水下激光雷达产品

    9月10日,光峰科技在第26届中国国际光电博览会(CIOE)现场举行水下激光雷达发布会,正式宣发布两款水下激光雷达产品——远眸D10、远眸T1,将覆盖消费级和专业级水下机器人市场。
    的头像 发表于 09-10 16:40 1132次阅读

    Imagination GPU 全面支持 Vulkan 1.4 和 Android 16

    Imagination最新发布的驱动(DDK25.1RTM2)支持最新版本Android操作系统,同时增强了OpenCL扩展集及Android平台上Vulkan1.4支持。Vulkan
    的头像 发表于 08-14 11:18 2457次阅读
    Imagination <b class='flag-5'>GPU</b> 全面<b class='flag-5'>支持</b> Vulkan 1.4 和 Android 16

    aicube的n卡gpu索引该如何添加?

    请问有人知道aicube怎样才能读取n卡的gpu索引呢,我已经安装了cuda和cudnn,在全局的py里添加了torch,能够调用gpu,当还是只能看到默认的gpu0,显示不了gpu1
    发表于 07-25 08:18

    摩尔线程发布Torch-MUSA v2.0.0版本 支持原生FP8和PyTorch 2.5.0

    支持原生FP8数据类型,支持PyTorch 2.5.0 ,并通过多项针对MUSA计算平台的性能优化,进一步提升了对AI模型和大规模数据处理的支持能力。 FP8原生
    的头像 发表于 05-11 16:41 1869次阅读

    摩尔线程GPU率先支持Qwen3全系列模型

    近日,阿里云正式发布Qwen3系列的8款开源混合推理模型。摩尔线程团队在模型发布当天,率先完成了Qwen3全系列模型在全功能GPU上的高效支持。这一成果充分展现了MUSA架构及全功能
    的头像 发表于 05-07 15:24 1130次阅读