0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

PyTorch 1.0:一个框架实现AI从研究到生产的全过程

DPVg_AI_era 来源:未知 作者:李倩 2018-05-04 10:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

今天,Facebook正式公布PyTorch 1.0,这个新的框架将PyTorch 0.4与Caffe2合并,并整合ONNX格式,让开发者可以无缝地将AI模型从研究转到生产,而无需处理迁移。

今天,Facebook正式公布PyTorch 1.0,这是将基于Python的PyTorch与Caffe2合并的一个新版本的框架,让开发者可以无缝地将AI模型从研究转到生产,而无需处理迁移。

“现在,你只需要使用PyTorch 1.0,就可以在一个框架中无缝地进行从研究到生产的全部过程,而不需要为训练/研究和生产分别选择框架。”Facebook发言人在F8大会上说。

Facebook去年与微软合作推出开放神经网络交换(ONNX)格式,这是一个用于表示深度学习模型的标准,旨在使不同框架之间的移动更加简单。现在,Facebook已经将ONNX整合到PyTorch 1.0中,使模型能够与其他框架进行互操作,并且开发人员可以“混合搭配”。

Facebook还表示,将统一PyTorch 0.4和Caffe2的代码库,以创建一个统一的框架,支持多种功能,包括高效的图形模式执行、分析、移动部署等。

PyTorch 1.0将在未来几个月内发布,据悉,微软计划在Azure中支持该框架,亚马逊也将在其云产品中支持PyTorch 1.0。

PyTorch官方博客介绍了PyTorch 1.0的更多细节:

生产性:在PyTorch 1.0中,你的代码可以继续按原样运行,我们没有对现有的API做任何大更改。如果你不需要优化或导出模型,则不必使用这些新功能,也不会有任何缺点。此外,可以逐步使用traced或@script模块/函数。

JIT编译器:使用torch.jit编译器将模型导出到非Python环境,并提高其性能。对于不包含循环和if语句的网络,trace是非侵入式的,并且足够稳健,可以处理各种编码风格;对于主要使用控制流的模型(如RNN),我们的解决方案是脚本模式(@script)。

优化和导出:Caffe2 / ONNX中模型的python-free表示

后端:我们正在替换(或重构)后端ATen库,以整合来自Caffe2的功能和优化。

Timeline:我们的目标是在今年夏天推出PyTorch 1.0。

PyTorch 1.0:一个框架实现AI从研究到生产的全过程

AI的开发从研究到生产的过程,涉及多个步骤和工具,这使得测试新方法、部署它们,以及迭代以提高准确性和性能都非常耗时而且复杂。为了帮助加速和优化这个过程,我们推出PyTorch 1.0。

PyTorch 1.0采用了Caffe2和ONNX的模块化、面向生产的功能,并将它们与PyTorch现有的灵活的、侧重于研究的设计结合起来,为各种AI项目提供从研究原型到生产部署的快速、无缝的路径。

使用PyTorch 1.0,AI开发人员可以通过在命令式执行模式和声明式执行模式之间无缝切换的混合前端进行快速实验和性能优化。PyTorch 1.0中的技术已经为Facebook的许多产品和服务提供支持,包括每天执行60亿次的文本翻译。

PyTorch 1.0将在未来几个月内推出,并将包含一系列工具、库、预训练的模型和各个开发阶段的数据集,使社区能够大规模地快速创建和部署新的AI创新。

从研究到生产的路径

PyTorch的命令式前端通过其灵活且高效的编程模型实现了更快速的原型设计和实验。PyTorch的第一个版本是在一年前推出的,它的快速、高效和支持动态图等先进AI模型的能力使其迅速成为广受AI研究人员欢迎的重要开发工具。PyTorch的下载量已经超过110万次,是ArXiv上个月引用量第二大的深度学习框架。例如,加州大学伯克利分校的计算机科学家将PyTorch的动态图功能用于他们的CycleGAN image-to-image转换的工作。

CycleGAN的PyTorch实现

尽管当前版本的PyTorch为AI的研究和开发提供了很大的灵活性,但由于它与Python的紧密结合,在生产规模上的性能有时是一个挑战。我们经常需要将研究代码(训练脚本或训练模型 )翻译成Caffe2的图形模式表示,以便在生产规模上运行。Caffe2的基于图形的执行程序允许开发者利用先进的优化方式,例如图形转换、高效的内存重用以及紧密的硬件接口集成。

Caffe2项目是两年前推出的,目的是使我们的生产AI工具标准化,现在它已经在Facebook服务器和世界范围超过10亿部手机上运行神经网络,跨越8代iPhone和6代Android CPU架构。今天,Caffe2每天在各种大小模型提供超过200万亿次的预测,并优化生产性能。

从PyTorch迁移到Caffe2以进行生产,以前这是一个手动的过程,耗时多且容易出错。为了解决这个问题,我们与主要的硬件和软件公司合作创建了ONNX(开放式神经网络交换),这是一种表示深度学习模式的开放式格式。借助ONNX,开发人员可以在不同框架之间共享模型,例如,导出使用PyTorch构建的模型并将其导入Caffe2。

我们已经使用这些工具(PyTorch,Caffe2和ONNX)来构建和部署Translate,这个工具现在可以对Facebook上48种最常用语言的进行翻译。在VR方面,这些工具对于将Oculus的新研究部署到生产中至关重要。

但是,尽管这三种不同工具的组合是有效的,但仍然存在手工步骤复杂、耗费时间长等问题。因此,仅仅是将这些工具组合还无法像我们期待的那样无缝地将AI的研究创新带入生产过程。

在一个框架中统一研究和生产的能力

PyTorch 1.0将即时模式和图形执行模式融合在一起,为生产的研究和性能优化提供了灵活性。更具体地说,PyTorch 1.0不是强制开发者重写整个代码以实现优化或从Python迁移,而是提供了一个混合的前端,使开发者能够在用于原型制作的即时模式和用于生产的图形执行模式之间无缝地共享大部分代码。

此外,ONNX本身被加入到PyTorch 1.0中作为一种模型输出格式,这使得PyTorch 1.0中的模型可与其他AI框架进行互操作。ONNX还可用作加速运行时间或硬件特定库的集成接口。这使得开发人员可以完全自由地混合和匹配最佳的AI框架和工具,而无需采用资源密集型的定制工程。Facebook将支持ONNX的新特征和功能,ONNX仍然是一种强大的开放格式,同时也是使用PyTorch 1.0进行开发的重要组成部分。

构建一个端到端的深度学习系统

除了PyTorch 1.0之外,Facebook还开源了多个AI工具,包括Translate——一个PyTorch语言库,用于快速、灵活的神经机器翻译;以及下一代ELF——一个综合的AI推理应用游戏平台。开发人员还可以利用Glow这样机器学习编译器,可以加速不同硬件平台上的框架性能;还可以使用Tensor Comprehensions这种自动生成高级数学运算的高效GPU代码的工具。Facebook也开源了其他库,如Detectron,支持对象检测研究,涵盖了边界框和对象实例分割输出。

Facebook推出一个AI开发者网站,列举了所有这些开源工具:

facebook.ai/developers

在接下来的几个月中,我们将重构并统一Caffe2和PyTorch 0.4框架的代码库。最终将形成一个统一的框架,支持高效的图形模式执行,包括profiling,移动部署,广泛的vendor集成等。与ONNX等其他开放式AI计划一样,我们也与其他公司和社区合作,为更多开发者提供这些加速研究的生产能力。首先,微软计划在他们的Azure云和开发者产品中支持PyTorch 1.0,包括Azure机器学习服务和数据科学虚拟机;Amazon Web Services目前支持最新版本的PyTorch,针对P3 GPU实例进行了优化,并计划在其云产品发布后不久支持 PyTorch 1.0,其中包括其深度学习AMI(Amazon Machine Image)。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38133

    浏览量

    296723
  • Facebook
    +关注

    关注

    3

    文章

    1432

    浏览量

    58356
  • 深度学习
    +关注

    关注

    73

    文章

    5591

    浏览量

    123912
  • pytorch
    +关注

    关注

    2

    文章

    813

    浏览量

    14704

原文标题:PyTorch 1.0 正式公开,Caffe2并入PyTorch实现AI研究和生产一条龙

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    和关联性 AI驱动科学:研究和模拟人类思维和认识过程。 本章节作者为我们讲解了第五范式,介绍了科学发现的般方法和流程等。、科学发现的5
    发表于 09-17 11:45

    SOLIDWORKS PDM Professional安装部署指南:服务器客户端的详细步骤

    份详尽的SOLIDWORKS PDM Professional安装指南,面向IT管理员,涵盖SQL Server配置、服务器安装到客户端设置的全过程,确保您高效、正确地完成PDM系统部署
    的头像 发表于 09-11 17:37 1004次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+可期之变:AI硬件AI湿件

    ,又分为真菌计算和基于DNA的计算。 图4 基本的真菌计算机结构 在用化学和生物方法实现AI功能的过程中,要经历5阶段,见图5所示。 图5 以化学和生物方法
    发表于 09-06 19:12

    【「AI芯片:科技探索与AGI愿景」阅读体验】+内容总览

    章 具身智能芯片 第9章 AI芯片AGI芯片 图2 各章重点及逻辑框架 该书可供AI和芯片领域的各层次人群阅读,无论是学习者还是
    发表于 09-05 15:10

    安科瑞温湿度控制器与玻璃机械的协同效应:生产保障设备维护

    在玻璃制造和加工的全过程中,每片合格玻璃的产出都离不开工艺参数的精准把控与设备的稳定运行。环境温湿度作为容易被忽视的关键因素,却像
    的头像 发表于 08-14 12:55 377次阅读
    安科瑞温湿度控制器与玻璃机械的协同效应:<b class='flag-5'>从</b><b class='flag-5'>生产</b>保障<b class='flag-5'>到</b>设备维护

    【书籍评测活动NO.64】AI芯片,过去走向未来:《AI芯片:科技探索与AGI愿景》

    到AGI,起来探索AI芯片 本书创新视角出发,系统梳理了AI芯片的前沿技术与未来方向,串联起算法
    发表于 07-28 13:54

    Nordic收购 Neuton.AI 关于产品技术的分析

    Nordic Semiconductor 于 2025 年收购了 Neuton.AI,这是家专注于超小型机器学习(TinyML)解决方案的公司。 Neuton 开发了种独特的神经网络框架
    发表于 06-28 14:18

    HarmonyOS NEXT意图框架习惯推荐场景说明

    意图。 本文以“音乐播放”意图为例,详细讲解意图接入与开发全过程。 二、音乐播放开发 以“音乐播放”为例,意图注册、意图共享以及意图调用三大块介绍意图运行的开发过程。如果应用支持播放功能并且需要
    发表于 06-18 15:06

    AI Agent 应用与项目实战》阅读心得2——客服机器人、AutoGen框架 、生成式代理

    及时处理。 第5章的斯坦福AI小镇项目对生成式代理技术做出了开创性的探索。该项目的核心是将LLM与计算交互代理相结合,构建了具有记忆、反思、规划能力的智能体系统。在技术实现层面,记
    发表于 02-25 21:59

    如何利用MES系统进行产能分析呢?

    利用MES系统进行产能分析是涉及数据收集、处理、分析和结果呈现的全过程。对生产过程加以监控,充分利用MES数据采集分析,实现监控
    的头像 发表于 02-21 12:10 768次阅读
    如何利用MES系统进行产能分析呢?

    AI Agent 应用与项目实战》第1-2章阅读心得——理解Agent框架与Coze平台的应用

    的同时提供强大算力支持,实现无缝协同。 这些趋势交织发展,将推动AI Agent工具属性向伙伴属性转变,开启人机协作新纪元。希望AI Agent能够帮助各行各业越来越多的朋友解放
    发表于 02-19 16:35

    AI在芯片上的应用:革新设计与功能

    AI在芯片上的应用正在深刻改变着芯片设计、制造和应用的全过程。未来,随着AI技术的不断进步和应用场景的不断拓展,AI芯片将成为推动科技发展的重要力量。
    的头像 发表于 02-17 16:09 1282次阅读

    AI开发框架集成介绍

    随着AI应用的广泛深入,单框架往往难以满足多样化的需求,因此,AI开发框架的集成成为了提升开发效率、促进技术创新的关键路径。以下,是对
    的头像 发表于 01-07 15:58 936次阅读

    进迭时空 K1 系列 8 核 64 位 RISC - V AI CPU 芯片介绍

    - 2 - 7b 的所有 AI 算法,指令集和算子库全开放。遵循通用 CPU 程序的开发方式,编程框架覆盖 AI 开发
    发表于 01-06 17:37

    利用Arm Kleidi技术实现PyTorch优化

    PyTorch广泛应用的开源机器学习 (ML) 库。近年来,Arm 与合作伙伴通力协作,持续改进 PyTorch 的推理性能。本文将详细介绍如何利用 Arm Kleidi 技术
    的头像 发表于 12-23 09:19 1623次阅读
    利用Arm Kleidi技术<b class='flag-5'>实现</b><b class='flag-5'>PyTorch</b>优化