0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

WAVE SUMMIT+2022 大会回顾,NVIDIA 极致性能赋能飞桨落地千行百业

NVIDIA英伟达企业解决方案 来源:未知 2022-12-13 20:05 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

11 月 30 日,由深度学习技术及应用国家工程研究中心主办、百度飞桨承办的 WAVE SUMMIT+ 2022 深度学习开发者峰会圆满落幕。

本次峰会上,百度 AI 技术生态总经理马艳军发布了飞桨开源框架 2.4 版本,并携手 NVIDIA 等 12 家生态伙伴发布了飞桨生态发行版,为开发者提供更好的软硬一体化体验。

作为飞桨的深度合作伙伴,NVIDIA 也出席了这场盛大的线上峰会。NVIDIA 亚太区资深产品负责人 Adam Zheng 还带来了以“NVIDIA 全新一代产品,极致性能赋能飞桨落地千行百业”为主题的分享。以下为内容概要。

NVIDIA 推出 Hopper 架构

掀起新一代加速计算浪潮

NVIDIA 作为计算加速行业的领导者,正在通过全栈创新推动高性能计算的发展。从芯片和系统,到它们运行的算法和应用程序,NVIDIA 平台将 AI 带入了全球最大的行业,提供包括推荐系统、AR、VR自动驾驶汽车等解决方案,并加速科学研究。

e21c3cac-7adb-11ed-8abf-dac502259ad0.png

今年春季 GTC 大会上,NVIDIA 发布了 Hopper 全新一代 GPU 架构,提供了六项突破性创新(如上图):

一、世界上最先进的芯片。由 800 亿个晶体管构建而成,这些晶体管采用了专为 NVIDIA 加速计算需求设计的尖端的 TSMC 4N 工艺,因而能够显著提升 AI、HPC、显存带宽、互连和通信的速度,并能够实现近 5TB/s 的外部互联带宽。此外,该款芯片也是首款支持 PCIe 5.0 的 GPU,也是首款采用 HBM3 的 GPU,可实现 3TB/s 的显存带宽。20 个芯片便可承载相当于全球互联网的流量,使其能够帮助客户推出先进的推荐系统以及实时运行数据推理的大型语言模型。

二、新的 Transformer 引擎——Transformer 现在已成为自然语言处理的标准模型方案,也是深度学习模型领域最重要的模型之一。新的 Transformer 引擎,可以将这些网络的速度提升至上一代的六倍,而不会损失精度。

三、第二代安全多实例 GPU —— MIG 技术支持将单个 GPU 分为七个更小且完全隔离的实例,以处理不同类型的作业。与上一代产品相比,在云环境中 Hopper 架构通过为每个 GPU 实例提供安全的多租户配置。

四、机密计算——全球首款具有机密计算功能的加速器,可保护 AI 模型和正在处理的客户数据。客户还可以将机密计算应用于医疗健康和金融服务等隐私敏感型行业的学习,也可以应用于共享云基础设施。

五、第 4 代 NVIDIA NVLink——为加速大型 AI 模型,NVLink 结合全新的外接 NVLink Switch,可将 NVLink 扩展为服务器间的互联网络。相比上一代 HDR Quantum InfiniBand,实现 9 倍的速度提升,并可连接多达 256 个 GPU。

六、DPX 指令——新的 DPX 指令可加速动态规划,适用于包括路径优化和基因组学在内的一系列算法,与 CPU 和上一代 GPU 相比,其速度提升分别可达 40 倍和 7 倍。

AI 开发只有顶尖的芯片是不够的,还需要软硬全栈和广阔的生态。NVIDIA 提供端到端的 AI 软件套件,覆盖数据准备、训练、推理优化到大规模部署等多个环节,以强大的资源调度和管理能力助力客户加速 AI 开发与部署。

NVIDIA 在加速计算领域的沉淀,以及其全新一代产品,为赋能飞桨生态奠定了基础。

NVIDIA 携手百度飞桨

加速 535 万开发者的 AI 进程

百度飞桨是中国首个自主研发、功能丰富、开源开放的产业级深度学习平台。近年来,飞桨的技术实力深受广大硬件厂商认可,合作日趋紧密,软硬一体协同发展,生态共创硕果累累。

NVIDIA 非常重视中国市场,特别关注中国的生态伙伴,而当前飞桨拥有 535 万的开发者。过去的几年中,NVIDIA 与飞桨一直保持着深度全面的合作关系。双方一起做了大量的开发与优化工作。

e241995c-7adb-11ed-8abf-dac502259ad0.png

今年我们将飞桨列为 NVIDIA 全球前三的深度学习框架合作伙伴,在中国设立了专门的工程团队支持,赋能飞桨。关于 NVIDIA 与飞桨的合作,由于篇幅原因,我们仅从硬件适配的角度,沿用上图的四个阶段做一个简要的介绍。在数据处理方面,帮助飞桨集成 DALI;大规模训练,支持各类数据格式,ASP、CUDA 等算子函数 API;优化推理方面,开发了 Paddle-TRT,Deep Learning Examples;在规模部署方面,集成了 NCCL,开发了 Triton PaddlePaddle Backend。

刚才这些适配仅仅是让飞桨的开发者拥有高性能的推理训练成为可能,但是这些离行业开发者还很远,门槛还很高,难度还很大。为此,NVIDIA 将刚刚这些集成和优化的工作整合到三大产品线中:

  • NVIDIA NGC PaddlePaddle Container——NGC 飞桨容器,致力为开发者提供了一个最佳的飞桨开发环境,包含最新的 NVIDIA 工具包版本(CUDA, DALI 等)。

  • NVIDIA Deep Learning Examples——飞桨深度学习模型示例,让开发者能够快速使用一系列拥有极致性能的经典模型 ,例如 ResNet 50、BERT 等。

  • NVIDIA DLI (Deep Learning Institute)——飞桨共建课程。为了能更好地提高推训性能并简化代码,NVIDIA 深度学习培训中心(DLI)也准备了系列免费课程,以及由 NVIDIA 与飞桨联名的 DLI 课程证书,赋能开发者并给于权威认可。

在这三大举措中,NGC 飞桨容器最为引人注目。

飞桨和 NVIDIA 团队从与开发者用户的持续交流中,收集到了一些使用上的痛点需求。比如,在提供 NGC 飞桨容器前,飞桨用户如果希望使用 NVIDIA 最新软件栈进行开发、训练、部署,需要做大量的手动配置工作,这对不少用户而言是一个巨大的工程挑战。

针对这些需求,NVIDIA 与百度飞桨联合开发了 NGC 飞桨容器,将最新的飞桨与最新的 NVIDIA 的软件栈进行了无缝的集成与性能优化,最大程度地释放飞桨框架在 NVIDIA 最新硬件上的计算能力。这样,用户不仅可以快速开启 AI 应用,专注于创新和应用本身,还能够在 AI 训练和推理任务上获得飞桨 + NVIDIA 带来的飞速体验。

NGC 飞桨容器具有以下优点:

  • 以月为单位升级更新,每月底发布全新版本,无需注册即可下载,支持多 GPU 和多节点系统。

  • 适配最新版本的 NVIDIA 软件栈(例如最新版本 CUDA),更多功能,更高性能。

  • 安全可靠。扫描漏洞和加密,适合在工作站、服务器、云上运行并经过测试。满足 NVIDIA NGC 开发及验证规范,质量管理。

  • 专为企业和高性能计算设计,支持 Docker。

  • 适配各种硬件环境:裸机、虚拟机、K8S、X86、ARM、Power、云、本地、边缘等。

  • 应用广泛。适合各种工作内容、工作场景、各行业的应用。

  • 性能优化。我们将其进行优化,并且具有很好的可扩展性。

为了让飞桨开发者用上基于 NVIDIA 最新的高性能硬件和软件栈,我们借用 NVIDIA NGC 完善的开发体系、质量管理、测试流程、文档规范、安全扫描等,开发了基于 NVIDIA GPU 平台最好的飞桨开发环境。

NGC 飞桨容器现已上线飞桨官网,开发者可以通过飞桨官网快速获取(如下图)。

e26cd720-7adb-11ed-8abf-dac502259ad0.png

下面,我们介绍一下 NVIDIA Deep Learning Examples,这是 NVIDIA 优化的工业级模型库,目标是让基于 NVIDIA GPU 的开发者复现极致精度和高性能的模型。NVIDIA Deep Learning Examples 中包括针对不同行业的模型,包括机器人、数字孪生、金融等等。

今年我们发布了 NVIDIA Deep Learning Examples PaddlePaddle ResNet50,只需要在 GitHub 中打开 NVIDIA Deep Learning Examples Repo,找到主页中的 PaddlePaddle Classification ResNet50 文件就可以得到它,里面有非常丰富的文档和信息。NVIDIA 基于各类网卡、A10、A30,基于各类拓扑结构,单机单卡、单机多卡等,都做了大量测试,并分享了详细的 Benchmark 供开发者参考(如下图)。

e29da350-7adb-11ed-8abf-dac502259ad0.png

在本届 WAVE SUMMIT+ 开始前,NVIDIA 更与百度飞桨联合主办了“2022 飞桨 × NVIDIA AI 技术开放日”。作为 WAVE SUMMIT+ 的 “前哨站” ,本次活动邀请双方公司的 AI 技术专家与超过 2000 名开发者共同开展深度技术交流,内容囊括 NGC 飞桨容器特点、应用场景、模型优化,以及部署实践案例。

欲了解更多 NGC 飞桨容器,可查看以下延展介绍,或关注微信公众号【NVIDIA 英伟达企业解决方案】。

详细产品介绍视频

【飞桨开发者说|NGC 飞桨容器全新上线 NVIDIA 产品专家全面解读】

https://www.bilibili.com/video/BV16B4y1V7ue?share_source=copy_web&vd_source=266ac44430b3656de0c2f4e58b4daf82

详细安装介绍

【NGC 飞桨容器安装指南】

https://www.paddlepaddle.org.cn/documentation/docs/zh/install/install_NGC_PaddlePaddle_ch.html


原文标题:WAVE SUMMIT+2022 大会回顾,NVIDIA 极致性能赋能飞桨落地千行百业

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    23

    文章

    4039

    浏览量

    97656

原文标题:WAVE SUMMIT+2022 大会回顾,NVIDIA 极致性能赋能飞桨落地千行百业

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    云天励AI推理芯片如何千行百业

    11月26日,云天会客厅第二期生态沙龙暨深商联高科技高成长创新营走进上市公司活动圆满举办。来自深圳科技领域的多位企业负责人齐聚云天励,共同探讨AI推理时代的技术变革、产业机遇与落地挑战。
    的头像 发表于 12-03 13:58 203次阅读

    思必驰亮相2025 AI Partner百业大会

    AI浪潮席卷千行百业,“中国式方案”正在无声地改写着全球科技产业版图,实现“AI+”与千行百业的深度
    的头像 发表于 09-03 09:13 712次阅读

    昆仑芯科技亮相2025度云智大会

    近日,2025度云智大会在北京国家会议中心二期隆重启幕。本届大会以“智能,生成无限可能”为主题,聚焦人工智能从技术到产业的全链条落地,深入探讨AI
    的头像 发表于 09-01 11:00 992次阅读

    南方智能SmartDBase数字孪生底座平台千行百业智慧升级

    表达、时空计算和场景推演六大能力于一体,实现了时空信息生产、治理、应用全链条服务能力跃迁,千行百业迈向数字化未来。
    的头像 发表于 08-25 11:39 1490次阅读

    龙芯产品千行百业的突破性进展

    近日,2025龙芯产品发布暨用户大会在北京成功举办。本次大会集中展示了龙芯从基础民生到国防安全、从石油化工到航空航天、从智慧农业到轨道交通等领域的全栈创新应用成果,多角度、全方位呈现了龙芯用科技
    的头像 发表于 07-11 09:48 820次阅读

    腾视科技TS-NV-P100系列AI边缘算力盒子综合算力高达157TOPS:重新定义AI边缘算力,千行百业智能化升级

    视科技正通过持续的技术创新,为千行百业的智能化转型提供坚实的边缘算力底座,让AI真正成为驱动产业升级的核心动能。
    的头像 发表于 07-02 10:24 1463次阅读
    腾视科技TS-NV-P100系列AI边缘算力盒子综合算力高达157TOPS:重新定义AI边缘算力,<b class='flag-5'>赋</b><b class='flag-5'>能</b><b class='flag-5'>千行</b><b class='flag-5'>百业</b>智能化升级

    腾视科技TS-NV-P100系列AI边缘算力盒子综合算力高达157TOPS:重新定义AI边缘算力,千行百业智能化升级

    视科技正通过持续的技术创新,为千行百业的智能化转型提供坚实的边缘算力底座,让AI真正成为驱动产业升级的核心动能。
    的头像 发表于 07-02 10:16 763次阅读

    中兴通讯推动千行百业数智进阶的创新实践

    近日,2025 MWC 上海正式启幕,中兴通讯首席发展官崔丽应邀出席在同日举行的“科技企业转型:引领创新新时代”主旨演讲和以“预见未来,从5G-A到6G”为主题的2025 GTI上海国际产业大会,分享中兴通讯在AI大模型驱动的智能革命浪潮中,推动千行
    的头像 发表于 06-23 15:00 958次阅读

    华为全光网加速AI普惠千行

    近日,在“华为中国合作伙伴大会2025”期间,华为光产品线总裁陈帮华发表了“无光不AI,全光网加速AI普惠千行”主题演讲。他表示,各行各业都在积极拥抱AI,AI普及迫切需要光技术的广泛应用,光
    的头像 发表于 04-01 15:32 847次阅读

    华为与柳州市人民政府签署全面合作框架协议,推动“人工智能+”柳州千行百业

    2025年3月25日柳州市人民政府与华为技术有限公司(以下简称“华为”)在深圳签署全面合作框架协议。根据协议,双方将重点围绕“人工智能+制造”、人工智能千行百业、科技创新、人才培养
    的头像 发表于 03-26 19:52 2596次阅读

    润和软件携全栈星闪产品亮相第三届中国数字经济产业发展大会,共绘“AI+千行百业”新图景

    2025年3月22日,由中国计算机学会(CCF)主办的第三届中国数字经济产业发展大会(CCDE2025)在苏州举行。本届大会以“人工智能千行
    的头像 发表于 03-26 09:55 1397次阅读
    润和软件携全栈星闪产品亮相第三届中国数字经济产业发展<b class='flag-5'>大会</b>,共绘“AI+<b class='flag-5'>千行</b><b class='flag-5'>百业</b>”新图景

    MWC 2025 | 广和通发布「AI For X」:以AI重塑千行百业

    作为全球领先的AIoT模组及解决方案提供商,广和通26年来始终致力于为全球千行百业打造创新物联方式。面向全新的AI时代,广和通推出「AI For X」,宣布以全方位、多方式的AI技术能力、产品、行业解决方案、生态融合助力多行业从“互联万物”向“智联万物”跃迁。
    的头像 发表于 03-03 18:06 758次阅读
    MWC 2025 | 广和通发布「AI For X」:以AI重塑<b class='flag-5'>千行</b><b class='flag-5'>百业</b>

    MWC 2025 广和通发布「AI For X」:以AI重塑千行百业

    深圳2025年2月28日 /美通社/ -- 作为全球领先的AIoT模组及解决方案提供商,广和通26年来始终致力于为全球千行百业打造创新物联方式。面向全新的AI时代,广和通推出「AI For X
    的头像 发表于 03-03 16:39 567次阅读

    广和通CES 2025发布Fibocom AI Stack,千行百业端侧应用

    千行百业的智能化转型提供强有力的支持。 Fibocom AI Stack集成了高性能模组、AI工具链、高性能推理引擎、海量模型以及全方位的支持与服务,构成了一套完整的端侧AI解决方案。
    的头像 发表于 01-08 15:18 1115次阅读

    芯和半导体2024年度精彩回顾

    2024年,AI人工智能大潮澎湃、席卷而来,万物智能、AI千行百业推动半导体行业向万亿规模迅猛疾驰。
    的头像 发表于 01-02 09:46 1069次阅读