PyTorch 1.6即将原生支持自动混合精度训练-电子发烧友网

PyTorch 1.6 nightly增加了一个子模块amp，支持自动混合精度训练。值得期待。来看看性能如何，相比Nvidia Apex 有哪些优势？

A developer-friendly guide to mixed precision training with PyTorch

https://spell.run/blog/mixed-precision-training-with-pytorch-Xuk7YBEAACAASJam

即将在 PyTorch 1.6上发布的 torch.cuda.amp 混合精度训练模块实现了它的承诺，只需增加几行新代码就可以提高大型模型训练50-60% 的速度。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

模块

模块

+关注

关注
7

文章
2849

浏览量
53443
代码

代码

+关注

关注
30

文章
4976

浏览量
74386
pytorch

pytorch

+关注

关注
2

文章
813

浏览量
14923

原文标题：训练提速60%！只需5行代码，PyTorch 1.6即将原生支持自动混合精度训练

文章出处：【微信号：cas-ciomp，微信公众号：中科院长春光机所】欢迎添加关注！文章转载请注明出处。

收藏人收藏

扫一扫，分享给好友

复制链接分享

加入交流群

扫码添加小助手

加入工程师交流群

发布评论请先登录

PyTorch 中RuntimeError分析

原生实现。这是一个已知的 PyTorch 限制，常见于 Stable Diffusion、ComfyUI 等使用 interpolate(..., mode=\'nearest\') 的模型中

发表于 03-06 06:02

基于NVIDIA GPU加速端点使用千问3.5 VLM开发原生多模态智能体

阿里巴巴推出了全新开源千问3.5 系列，专为构建原生多模态智能体而设计。该系列的首个模型是一款总参数为 397B、具备推理能力的原生视觉语言模型 (VLM)，基于由混合专家模型 (MoE) 和门控

发表于 03-04 16:37 •1133次阅读

进迭时空 Upstream | K3 获得 Linux 7.0 内核原生支持

款符合RVA23规范的RISC-V量产芯片，成功获得Linux内核主线原生支持。01.战略先行：对标一流，确立“Pre-siliconUpstream”目标早在K

发表于 02-27 18:10 •1.2w次阅读

进迭时空 Upstream | K3 获得 Linux 7.0 内核<b class='flag-5'>原生</b><b class='flag-5'>支持</b>

Pytorch 与 Visionfive2 兼容吗？

Pytorch 与 Visionfive2 兼容吗？ $ pip3 install torch torchvision torchaudio --index-url https

发表于 02-06 08:28

摩尔线程发布SimuMax v1.1：从仿真工具升级为全栈工作流平台，助力大模型训练提效

的仿真与调优提供系统化支持。本次更新聚焦三大核心创新：用户友好的可视化配置界面、智能并行策略搜索，以及融合计算与通信效率建模的System-Config生成流水线。新版本同时提升了对主流训练框架Megatron-LM的兼容性，并增强了对

发表于 01-09 09:17 •354次阅读

摩尔线程发布SimuMax v1.1：从仿真工具升级为全栈工作流平台，助力大模型<b class='flag-5'>训练</b>提效

自动驾驶大模型的训练数据有什么具体要求？

[首发于智驾最前沿微信公众号]想训练出一个可以落地的自动驾驶大模型，不是简单地给其提供几张图片，几条规则就可以的，而是需要非常多的多样的、真实的驾驶数据，从而可以让大模型真正理解道路、交通参与者

发表于 12-26 09:32 •365次阅读

<b class='flag-5'>自动</b>驾驶大模型的<b class='flag-5'>训练</b>数据有什么具体要求？

电能质量在线监测装置支持校准证书自动上传吗？

现代高精度电能质量在线监测装置（0.2 级 / 0.5 级 A 类）普遍支持校准证书自动上传功能，但需配合专用远程校准管理平台和网络通信模块使用。基础型装置（1 级 / 2 级）通常仅支持

发表于 12-12 15:27 •362次阅读

如何训练好自动驾驶端到端模型？

[首发于智驾最前沿微信公众号]最近有位小伙伴在后台留言提问：端到端算法是怎样训练的？是模仿学习、强化学习和离线强化学习这三类吗？其实端到端（end-to-end）算法在自动驾驶、智能体决策系统里

发表于 12-08 16:31 •1608次阅读

测温精度±0.1℃，无需进行校准的数字模拟混合信号温度传感芯片

数字模拟混合信号温度传感芯片的工作原理基于半导体PN结温度特性与带隙电压的物理关系，通过CMOS工艺实现高精度温度测量。

发表于 09-19 09:54 •878次阅读

圣邦微电子即将量产高精度磁编码器VCE2765

今天为大家介绍圣邦微电子即将量产的高精度磁编码器 VCE2765。这是一款专门针对离轴安装应用设计的编码器芯片，集自校准、高精度、强抗干扰能力于一身，基于 AMR 技术的创新产品将为严苛环境下的角度检测带来全新的、更可靠的解决方

发表于 07-31 17:19 •1672次阅读

环旭电子即将推出新一代1.6T光模组产品

全球领先的电子设计与制造服务供货商USI环旭电子宣布，即将推出新一代1.6T光模组产品，锁定高速运算与AI数据中心应用，协助客户提升数据中心网络拓扑效能，应对AI模型规模扩展所带来的庞大数据传输需求。

发表于 07-30 10:45 •2508次阅读

【Sipeed MaixCAM Pro开发板试用体验】 + 04 + 机器学习YOLO体验

方式数据集的标注也有2种方式，分别为手动标注和自动标注2种，如果你拍摄的数据集不是静态或者变化幅度较大，我的建议是不要使用自动标注，会产生很大的误差。数据集的训练界面操作简单明了，我认为非常适合

发表于 07-24 21:35

请问CYBT-343026-01是否支持AVRCP 1.6？

CYBT-343026-01 是否支持 Modustoolbox 中的 AVRCP 1.6 封面艺术功能？还是你有最新的表格来支持不同设备的功能，例如 20706A2、20719B2、20819、20820、20829？

发表于 07-03 06:05

飞腾软件支持平台即将正式上线AI智能大脑

遇到棘手的技术问题却无人解答？搜索文档耗时长？飞腾软件支持平台即将正式上线AI智能大脑，让技术难题实现“秒回应”！

发表于 06-13 11:37 •1218次阅读

摩尔线程发布Torch-MUSA v2.0.0版本支持原生FP8和PyTorch 2.5.0

，支持原生FP8数据类型，支持PyTorch 2.5.0 ，并通过多项针对MUSA计算平台的性能优化，进一步提升了对AI模型和大规模数据处理的支持

发表于 05-11 16:41 •1877次阅读

搜索历史

PyTorch 1.6即将原生支持自动混合精度训练

评论