0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

云端机器学习平台PAI最新的创新实践

NVIDIA英伟达 来源:NVIDIA英伟达 作者:NVIDIA英伟达 2022-06-09 09:52 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在今年 3 月的 GTC 2022 大会上,阿里云带来了推理优化/部署、深度学习编译器、大模型部署、训练优化等主题的内容,分享云端机器学习平台 PAI (Machine Learning Platform for AI) 最新的创新实践,并已在【阿里灵杰】知乎号陆续发布三篇演讲内容深度回顾。同时阿里云也分享了其设计研发的高性能云手游解决方案——弹性云手机

专家带你解读,免费学习不间断

阿里云的精彩分享均已在 NVIDIA On-Demand 上线。

云端 Triton 生产实践

NVIDIA Triton 推理服务器是一款功能全面、可扩展且功能强大的推理解决方案,在边缘设备和云上皆可部署。在云上将 Triton 部署到生产环境中时,应考虑效率、可扩展性以及与 Triton 自身外的云上基础设施的集成。本演讲将介绍阿里云中通过 PAI-EAS 提供 Triton 作为云服务的关键见解:

1) 一键部署 Triton 集群

2) 根据请求吞吐量扩展 Triton 集群

3) 与 OSS(对象存储服务)原生集成

4) Triton 和 GPU 共享调度。

通过 PAI-Blade 更易用、更可靠地使用 TensorRT

TensorRT 是由 NVIDIA 推出的业界领先的推理加速器,在深度学习推理场景应用广泛,但是通过 TensorRT 来优化深度学习模型仍有一定门槛。首先,通过 TensorRT 解析模型时会遇到转换失败或表现不理想的情况。其次,从零开始搭建网络比较耗时且难以扩展。此外,在生产环境里增加新的推理框架需要严谨的评估。本次演讲将介绍如何通过一站式 AI 加速器 PAI-Blade 解决上述问题。PAI-Blade 能够实现 TensorRT 后端上的自动圈图和自动化运行。同时还可以与 TensorRT Plugin 协同工作,以实现更好的性能。目前 PAI-Blade 提供对 TensorFlow 和 PyTorch 的产品化支持。

PaiSparse:面向深度学习的稀疏加速库

随着超大语言模型的流行, 如何部署超大模型正在成为迫切需要解决的问题。非结构化剪枝可以将模型规模缩小 99%,让超大语言模型在单卡上部署成为可能。然而超大模型稀疏后会呈现不同的非零分布,而这些分布会直接影响硬件的计算量并影响最终的执行时间。同时与传统的 HPC 任务不同的是,基于训练后的稀疏矩阵分布的 tuning 在深度学习推理中是可以进行的。因此我们提出一个面向深度学习的稀疏加速库:PaiSparse,可以自动生成更高效的稀疏算子。实验表明,与 cuSparse 相比, PaiSparse 可以提速 1.5~5 倍。

PTXC:使用 XLA 编译器通过云 GPU 扩展 PyTorch 训练

在工业界实践中,模型训练和部署的效率、规模和适配性关系到最终的应用效果。为满足 PyTorch eager-first 的 GPU 编译流程, Lazy Tensor 架构被提出来。通过采用实践验证过的产品化 XLA 编译器和分布式引擎, PTXC 能在阿里云 GPU 集群中以基于编译优化的方式一键快速搭建易用、弹性且高效的 PyTorch 模型训练系统。

阿里云基于 AI 编译器的通用透明性能解决方案

本次演讲将从云服务厂商的视角,分享在云端和机器学习平台上大规模部署 AI 编译器的实战经验。我们将详细介绍近期刚刚开源的动态 shape 深度学习编译器 BladeDISC,包括它的背景和主要特性,具体设计架构和实现细节,动态 shape 语义下的性能优化经验,未来计划以及在 NVIDIA 设备上的应用等。

未来游戏趋势:通过阿里云弹性云手机解决方案打造云游戏

基于 NVIDIA GPU 及原生的 ARM 平台,阿里云设计研发了高性能的云手游解决方案——弹性云手机,可实现虚拟化渲染及显存隔离,在确保隔离的情况下充分发挥 GPU 性能。此外,弹性云手机无缝对接阿里巴巴云游戏流媒体平台,该平台兼容多种流媒体协议,并具备完整的“渲染-编码-串流”云手游架构。

原文标题:NVIDIA On-Demand 观看阿里云机器学习平台 PAI 的精彩演讲

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5696

    浏览量

    110119
  • 机器学习
    +关注

    关注

    67

    文章

    8565

    浏览量

    137228
  • 阿里云
    +关注

    关注

    3

    文章

    1046

    浏览量

    45872

原文标题:NVIDIA On-Demand 观看阿里云机器学习平台 PAI 的精彩演讲

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    壁仞科技全面入驻国家教育开源平台启悟学习社区

    科技已在启悟学习社区上线壁仞科技系列公开课、壁仞科技&智海人工智能学习实训平台、人工智能挑战任务,为全国高校师生提供集学习实践、共创于一体
    的头像 发表于 04-07 15:52 313次阅读

    北京人形机器创新中心中试验证平台正式启动

    1月29日,北京人形机器创新中心迎来一个重要里程碑——中试验证平台正式启动,并在现场下线了第1000台客户定制化样机。
    的头像 发表于 02-02 17:06 1328次阅读

    主线科技入选“人工智能+”创新应用实践案例

    日前,由新华网主办的“人工智能+”创新应用案例征集评选结果揭晓,主线科技“基于 AI 技术力的自动驾驶卡车在智慧物流的创新应用”案例凭借技术创新性与行业示范价值,成功入选创新应用
    的头像 发表于 01-12 09:23 525次阅读

    飞谱电子入选2025年度江苏省博士后创新实践基地

    近日,江苏省人力资源和社会保障厅公示2025年度新设江苏省博士后创新实践基地名单,无锡飞谱电子信息技术有限公司凭借深厚的技术积淀与强劲的创新能力成功入选,为企业科研创新再添重量级
    的头像 发表于 01-07 17:47 1220次阅读

    万里红荣获数智化实践典型案例“创新突破”称号

    近日,由中关村科创智慧军工产业技术创新战略联盟组织开展的数智化实践典型案例征集评选结果正式公布。万里红《智能辅助定密系统在国防工业领域数字化保密管理中的创新应用》荣获数智化实践典型案例
    的头像 发表于 01-06 11:26 716次阅读

    山东移动携手华为荣获NetworkX 2025电信领域最具创新AI实践

    在全球瞩目的Network X年度颁奖典礼上,山东移动与华为联合打造的“智能网络变更管理平台”凭借其创新的仿真技术与业务实践的深度融合,成功斩获“电信领域最具创新AI
    的头像 发表于 10-21 09:50 907次阅读

    具身智能家务机器人黑客松报名通道已开启

    全球首创的家务机器人开发者黑客松,将聚焦家务机器人领域,围绕 NVIDIA 的 AI 与机器人技术与 Hugging Face 的 LeRobot 开源平台,为开发者提供技术支撑与
    的头像 发表于 09-04 11:29 1390次阅读

    左蓝微电子获批设立常州市博士后创新实践基地

    近日,左蓝微电子获批设立常州市博士后创新实践基地。这标志着公司在科研创新、人才培养和产学研融合发展方面迈上了新台阶。此次获批博士后创新实践
    的头像 发表于 09-03 17:43 1054次阅读

    “科创新势力重庆行”圆满落幕,启明云端诠释技术-产品-场景新质生产力转化

    前沿的技术融合与场景化设计,以差异化创新吸引政企代表、行业伙伴及媒体关注,展现了企业在新质生产力领域的实践成果。多元创新获多方瞩目展会上,启明云端的三款产品吸引了
    的头像 发表于 07-21 18:02 970次阅读
    “科<b class='flag-5'>创新</b>势力重庆行”圆满落幕,启明<b class='flag-5'>云端</b>诠释技术-产品-场景新质生产力转化

    FPGA在机器学习中的具体应用

    随着机器学习和人工智能技术的迅猛发展,传统的中央处理单元(CPU)和图形处理单元(GPU)已经无法满足高效处理大规模数据和复杂模型的需求。FPGA(现场可编程门阵列)作为一种灵活且高效的硬件加速平台
    的头像 发表于 07-16 15:34 3098次阅读

    盘点#机器人开发平台

    Athena机器人****开发平台思岚推出Athena机器人开发平台,有望主导机器人开发平台未来
    发表于 05-13 15:02

    电力电子教学新范式:EasyGo半实物仿真平台赋能高校创新实践

    现状,EasyGo半实物仿真平台将技术创新与教学场景深度融合,通过硬件轻量化、功能模块化与教学场景化的创新设计,为高校教学提供创新解决方案,精准匹配高校课程需求,通过技术革新
    的头像 发表于 05-12 18:07 1346次阅读
    电力电子教学新范式:EasyGo半实物仿真<b class='flag-5'>平台</b>赋能高校<b class='flag-5'>创新</b><b class='flag-5'>实践</b>

    云端到终端:RAKsmart服务器构筑AI云平台智慧城市全栈解决方案

    传统服务器方案常面临算力分散、运维复杂、能效比低等问题,导致AI算法难以高效落地。而RAKsmart服务器凭借其技术创新与全栈服务能力,正在为AI云平台智慧城市提供从云端算力到终端应用的完整解决方案。
    的头像 发表于 05-09 09:47 763次阅读

    【「# ROS 2智能机器人开发实践」阅读体验】视觉实现的基础算法的应用

    : 一、机器人视觉:从理论到实践 第7章详细介绍了ROS2在机器视觉领域的应用,涵盖了相机标定、OpenCV集成、视觉巡线、二维码识别以及深度学习目标检测等内容。通过
    发表于 05-03 19:41

    【「# ROS 2智能机器人开发实践」阅读体验】机器人入门的引路书

    阅读方法: 像读大学的教材的方式跳读这本书 (面对完全不懂的领域,一行行看效率太慢了) 先把想读的点作为目标,去不同的章跳跃的去找 把一个个熟悉的点串成完整的成果 再加上项目实践 为了达成创新
    发表于 04-30 01:05