0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用 NVIDIA AI Enterprise 3.0 优化生产级 AI 的性能和效率

NVIDIA英伟达 来源:未知 2023-04-17 23:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA AI Enterprise 是一款端到端的安全云原生 AI 软件套件。最近发布的 NVIDIA AI Enterprise 3.0 加入了帮助优化生产级 AI 性能与效率的新功能。本文将详细介绍以下新功能及其工作原理

· Magnum IO GPUDirect Storage

· VMware vSphere 8.0的 GPU 虚拟化功能

· Red Hat Enterprise Linux(RHEL)KVM 8 和 9

· Fractional multi-vGPU 支持

· 对 NVIDIA AI 的扩展支持

生产级 AI 功能

NVIDIA AI Enterprise 3.0 版本中的新 AI 工作流有助于缩短生产级 AI 的开发时间。这些工作流是常见 AI 用例的参考应用,包括联络中心智能虚拟助理、音频转录、数字指纹等。

未加密的预训练模型也首次包括在内,这确保了 AI 的可解释性并使开发者能够查看模型的权重和偏差,并了解模型的偏差。

NVIDIA AI Enterprise 现在支持 NGC 目录中发布的所有 NVIDIA AI 软件。已经使用过 NGC 的开发者现在可以无缝过渡到 NVIDIA AI Enterprise 并使用支持 50 多个 AI 框架、预训练模型和 SDK 的 NVIDIA Enterprise Support。

基础设施性能功能

NVIDIA AI Enterprise 3.0 包含许多有助于优化基础设施性能的新功能,因此用户可以从他们的 AI 投资中获得最大收益并最大程度地节约成本和时间。下面将对这些功能进行详细说明。

Magnum IO GPUDirect Storage

企业现在可以在部署 NVIDIA AI Enterprise 3.0 的情况下,利用 Magnum IO GPUDirect Storage 的性能优势来加速和扩展他们的 AI 工作负载。GPUDirect Storage 1.4 打通了本地或远程存储与 GPU 内存之间的直接数据路径,为复杂的工作负载提供无与伦比的性能。

GPUDirect Storage 简化并提高了存储和 GPU 缓冲区之间的数据流的效率,适用于在 GPU 上消耗或产生数据而不需要 CPU 处理的应用。该功能通过远程直接内存访问(RDMA),在从存储到 GPU 内存的直接路径上快速移动数据,减少延迟并通过消除回弹缓冲区产生的多余复制来减轻 CPU 的负担。

GPUDirect Storage 带来了明显的性能提升。与 NumPy 相比,使用 NVIDIA DALI 进行深度学习推理时,性能提高了 7.2 倍。

美国国家航空航天局(NASA)的火星探测器演示项目使用 NVIDIA IndeX 和 GPUDirect Storage 以及 27000 多个 NVIDIA GPU 来模拟逆向推进,在使用 PCIe 交换机和 NVLinks 以及 GPUDirect Storage 时,带宽提高了 5 倍。

406dec70-dd32-11ed-bfe3-dac502259ad0.png

图 1. GPUDirect Storage 提供了一条从存储出发、完全跳过 CPU 的直接路径,消除了绑定在 CPU 上的回弹缓冲。

VMware vSphere 8.0 的 GPU 虚拟化功能

NVIDIA AI Enterprise 3.0 引入了对 VMware vSphere 8 的支持,包括多项可加速性能和提高运行效率的功能。VMware 环境现在可以在一个虚拟机上添加多达 8 个虚拟 GPU,vGPU 数量比之前的版本多了一倍。这提高了大型 ML 模型的性能,为复杂的 AI 和 ML 工作负载提供了更高的可扩展性。

随着设备组的引入,IT 管理员现在可以更好的控制虚拟机的放置。vSphere 附带的管理工具分布式资源调度(DRS)可确定虚拟机的最佳放置位置。

新的设备组功能提供了对 PCIe 设备的洞察,这些设备在硬件层面上(通过 NVLink 或 PCIe 开关)相互配对,IT 管理员可以从中选择一个子集,提交给虚拟机作出 DRS 调度决策。

通过设备组,IT 管理员可以确保设备子集被一起分配给虚拟机。例如,如果用户想要通过扩展 GPU 来加速大型模型,IT 管理员可以创建一个包含 GPU 的设备组并通过 NVLink 连接这些设备,比如图 2 中的设备组 1。

如果用户想要向外扩展到多台服务器以进行分布式训练,可以使用共享同一 PCIe 交换机的 GPU 和 NIC 组成设备组,比如图 2 中的设备组 2。

4091dd92-dd32-11ed-bfe3-dac502259ad0.png

图 2. 有两个 GPU 的设备组(左)和服务器上有一个 GPU 与网卡的设备组(右)

Red Hat Enterprise Linux KVM

NVIDIA AI Enterprise 3.0 将虚拟化支持扩展至 Red Hat Enterprise Linux 8.4、8.6、8.7、9.0 和 9.1,使企业能够将 KVM 功能扩展到他们的 AI 工作负载。通过 RHEL KVM,管理员可以在一个虚拟机上添加多达 16 个虚拟 GPU,将计算密集型工作负载的处理速度提高数倍。

Fractional multi-vGPU 支持

管理员现在可以通过 NVIDIA AI Enterprise 3.0,为一台虚拟机配置多个 Fractional vGPU,从而更加灵活地根据工作负载优化虚拟机的配置。在该版本发布之前,每台虚拟机只能通过一个或多个整数份 GPU 加速。

管理员现在能够更加灵活地根据工作负载的计算需求,为一个虚拟机分配多个部分 vGPU 配置文件。例如,当运行具有不同计算需求的多个推理工作负载时,管理员可以根据工作负载的内存需求,为一个虚拟机分配不同数量帧缓冲器的 NVIDIA A100 Tensor Core GPU 的部分配置文件。

需要注意的是,所有部分配置文件必须是相同的板卡类型和系列。可以将一个或多个物理 GPU 分成这些份额的 vGPU 配置文件。该功能在 VMware vSphere 8 和 RHEL KVM 8 和 9 上均可以使用。

40abb082-dd32-11ed-bfe3-dac502259ad0.png

图 3. 将一个配置文件分成多个 vGPU 分配给一个虚拟机

对 NVIDIA AI 的扩展支持

NVIDIA AI Enterprise 为 NGC 目录中发布的所有 NVIDIA AI 软件提供支持,该目录目前包含 50 多个框架和模型。所有受支持的模型都标有“NVIDIA AI Enterprise Supported”以帮助用户轻松识别支持的软件。

40c3de96-dd32-11ed-bfe3-dac502259ad0.png

图 4. 所有 NVIDIA AI Enterprise 支持的模型在 NGC 目录中都有标注

总结

通过最新 3.0 版本的 NVIDIA AI Enterprise,企业可以使用最新的性能和效率优化功能缩短生产级 AI 的开发时间。NVIDIA LaunchPad 使用户可以在私有加速计算环境中即时、短期访问 NVIDIA AI Enterprise 软件套件,包括各种动手实操实验室。

即刻点击“阅读原文”扫描下方海报二维码在 NVIDIA On-Demand 上观看 GTC 精选回放,包括主题演讲相关精选、中国本地精选内容、生成式 AI 专题以及全球各行业及领域最新成果!


原文标题:使用 NVIDIA AI Enterprise 3.0 优化生产级 AI 的性能和效率

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    23

    文章

    4040

    浏览量

    97680

原文标题:使用 NVIDIA AI Enterprise 3.0 优化生产级 AI 的性能和效率

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    BPI-AIM7 RK3588 AINvidia Jetson Nano 生态系统兼容的低功耗 AI 模块

    8K视频编解码和AI推理任务,降低延迟70%。 6 TOPS NPU 定制优化 :针对 YOLO/Transformer 等模型定制算子库,推理效率提升 5 倍。 2. 全面接口兼容,无缝生态系统迁移
    发表于 10-11 09:08

    NVIDIA DOCA 3.0版本的亮点解析

    NVIDIA DOCA 框架已发展成为新一代 AI 基础设施的重要组成部分。从初始版本到备受期待的 NVIDIA DOCA 3.0 发布,每个版本都扩展了
    的头像 发表于 07-04 14:27 962次阅读
    <b class='flag-5'>NVIDIA</b> DOCA <b class='flag-5'>3.0</b>版本的亮点解析

    全球各大品牌利用NVIDIA AI技术提升运营效率

    欧莱雅、LVMH 集团和雀巢利用 NVIDIA 加速的智能体 AI 和物理 AI,大幅提升产品设计、营销及物流等方面的运营效率
    的头像 发表于 06-19 14:36 968次阅读

    NVIDIA携手合作伙伴提升AI智能体的交互能力

    NVIDIA Enterprise AI Factory 的经验证设计和全新的 NVIDIA AI Blueprint 可帮助企业部署具有沟
    的头像 发表于 05-22 09:52 802次阅读

    NVIDIA助力安利生成式AI在效能和安全上破局

    依托 NVIDIA AI Enterprise 企业解决方案,安利正在构建安全、高效、可扩展的 AI 基础设施体系,全面提升算力资源调度能
    的头像 发表于 05-10 09:28 1055次阅读

    DevEco Studio AI辅助开发工具两大升级功能 鸿蒙应用开发效率再提升

    HarmonyOS应用的AI智能辅助开发助手——CodeGenie,该AI助手深度集成在DevEco Studio中,提供鸿蒙知识智能问答、鸿蒙ArkTS代码补全/生成和万能卡片生成等功能,提升了开发效率,深受广大
    发表于 04-18 14:43

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    PIX GP模型的整合,并且针对模型进行全链路微秒分析,以确保最佳的端到端性能表现。在双方的整个合作流程中,开发效率提升了30%。 天玑AI生态同样拓展到了智能座舱领域。联发科和绝影
    发表于 04-13 19:52

    NVIDIA AI Enterprise助力AI智能体重构工作模式

    无论是为人道主义援助、客户服务还是医疗健康而开发,基于NVIDIA AI Enterprise软件平台构建的 AI 智能体构成了新型数字劳动力,帮助专业人士以更低的成本、更大的影响力来
    的头像 发表于 03-25 14:59 836次阅读

    英伟达GTC2025亮点:Oracle与NVIDIA合作助力企业加速代理式AI推理

    Enterprise 软件平台之间的集成,将使 160 多个 AI 工具和 100 多个 NVIDIA NIM 微服务通过 OCI 控制台以原生方式提供。此外,Oracle 和 NVIDIA
    的头像 发表于 03-21 12:01 1182次阅读
    英伟达GTC2025亮点:Oracle与<b class='flag-5'>NVIDIA</b>合作助力企业加速代理式<b class='flag-5'>AI</b>推理

    Oracle 与 NVIDIA 合作助力企业加速代理式 AI 推理

    Oracle Cloud Infrastructure (OCI) 与 NVIDIA AI Enterprise 软件平台之间的集成,将使 160 多个 AI 工具和 100 多个
    发表于 03-19 15:24 470次阅读
    Oracle 与 <b class='flag-5'>NVIDIA</b> 合作助力企业加速代理式 <b class='flag-5'>AI</b> 推理

    FPGA+AI王炸组合如何重塑未来世界:看看DeepSeek东方神秘力量如何预测......

    。• AI加速器的开发:FPGA被广泛用于开发专为AI算法优化的加速器,例如深度学习推理加速器。这种定制化的硬件设计能够显著提升AI应用的效率
    发表于 03-03 11:21

    AI赋能边缘网关:开启智能时代的新蓝海

    ,准确率达到99.9%。 这一技术革新正在创造巨大的商业价值。在智慧城市领域,AI边缘网关可以实现交通流量实时分析、违章行为智能识别;在工业互联网中,能够实现设备预测性维护、生产工艺优化;在智慧能源领域
    发表于 02-15 11:41

    AI自动化生产:深度学习在质量控制中的应用

    生产效率、保证产品质量方面展现出非凡的能力。阿丘科技「AI干货补给站」推出《AI自动化生产:深度学习在质量控制中的应用》文章,探讨深度学习在
    的头像 发表于 01-17 16:35 1214次阅读
    <b class='flag-5'>AI</b>自动<b class='flag-5'>化生产</b>:深度学习在质量控制中的应用

    NVIDIA 发布保障代理式 AI 应用安全的 NIM 微服务

    的“知识机器人”,提升全球数十亿知识工作者的生产力。为了开发 AI 智能体,企业需要解决信任、物理安全、网络安全以及合规性等关键问题。 全新 NVIDIA NIM AI Guardra
    发表于 01-17 16:29 282次阅读

    NVIDIA推出面向RTX AI PC的AI基础模型

    NVIDIA 今日发布能在 NVIDIA RTX AI PC 本地运行的基础模型,为数字人、内容创作、生产力和开发提供强大助力。
    的头像 发表于 01-08 11:01 876次阅读