0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA NGC目录中的GPU优化容器

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2022-07-01 11:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

借助 NVIDIA NGC 目录中的 GPU 优化容器,更快地开发和部署应用。

什么是容器?

容器是一种便携式软件单元,可将应用及其所有依赖项合并为一个软件包,该软件包不受底层主机操作系统限制。这样无需再构建复杂的环境,并简化了应用开发到部署的过程。

NVIDIA NGC 目录包含一系列用于深度学习机器学习、可视化和高性能计算(HPC)应用的 GPU 优化容器,这些容器均已经过了性能、安全性和可扩展性测试。

NGC 目录中的容器的优势

轻松部署

内置库和依赖项可让您轻松部署和运行应用。

加快训练速度

TensorFlow 和 PyTorch 等 NVIDIA AI 容器每月会提供针对性能优化的更新版本,以便加快 AI 训练和推理速度。

运行位置不受限制

在 bare metal、虚拟机(VM)和 Kubernetes 上,将容器部署在任意位置(云端、内部私有云和边缘)的多 GPU/多节点系统上。

放心部署

容器经过常见漏洞和暴露(CVE)扫描(附有安全报告),并通过 NVIDIA AI Enterprise 得到了可选的企业支持。

性能优化

NVIDIA 构建的 Docker 容器每月都会更新,第三方软件也会定期更新,以提供所需的功能,便于您从现有基础架构中获得出色性能,并缩短找出解决方案的时间。

借助 BERT-Large 进行自然语言处理

BERT-Large 利用 VoltaV100 和 Ampere A100 GPU 上的混合精度运算和 Tensor Core,在保持目标准确性的同时缩短训练时间。

在单节点的 8x V100 (16GB) 和 A100 (40GB) 上使用 TensorFlow 时,BERT-Large 和训练的性能表现。混合精度。BERT 的批量大小:3 (V100)、24(A100)

用于图像处理的 ResNet50 v1.5

此模型使用 Volta、Turing 和 NVIDIA Ampere GPU 体系架构上的 Tensor Core 进行混合精度训练,以加快训练速度。

在单节点 8x V100 (16GB) 和 A100 (40GB) 上使用 TensorFlow 时,ResNet 50 的性能表现。混合精度。ResNet50 批量大小:26

用于深度学习的 Matlab

持续开发 Matlab 深度学习容器可提高训练和推理性能。

Windows 10Intel Xeon E5-2623 @2.4GHz,NVIDIA Titan V 12GB GPU

用于各种工作负载的容器

AI 容器

TensorFlow

TensorFlow 是一个用于高性能数值计算的开源软件库。

PyTorch

PyTorch 是具有 Python 前端的 GPU 加速型张量计算框架。

NVIDIA Triton 推理服务器

NVIDIA Triton 推理服务器是一种开源推理解决方案,可更大限度地提高 GPU 的利用率和性能。

NVIDIA TensorRT

NVIDIA TensorRT 是一个C++ 库,可加快 NVIDIA GPU 上的高性能推理。

应用框架

NVIDIA Clara

用于医疗成像的 NVIDIA Clara Train 是一个应用框架,包含超过 20 个先进的预训练模型、迁移学习和联合学习工具、AutoML,以及 AI 辅助的标记数据。

DeepStream

DeepStream 是一款流分析工具包,可用于基于 AI 的视频、音频和图像理解和多传感器处理。

NVIDIA Riva

NVIDIA Riva 是一个应用框架,适用于在 GPU 上提供实时性能的多模态对话式 AI 服务。

Merlin Training

Merlin HugeCTR 是 NVIDIA Merlin 的组件,是一款专为推荐系统设计的深度神经网络训练框架。

HPC 容器

NAMD

NAMD 是一段并行分子动力学代码,旨在实现生物大分子系统的高性能模拟

GROMACS

GROMACS 是一款热门的分子动力学应用,用于模拟蛋白质和脂质。

Relion

Relion 采用经验贝叶斯方法分析低温电子显微镜(cryo EM)。

NVIDIA HPC SDK

NVIDIA HPC SDK 是编译器、库和工具的综合套件,用于构建、部署和管理 HPC 应用。

点击阅读原文,了解更多 AI 和 HPC 容器相关内容

NVIDIA 深度学习培训中心

我们的 NVIDIA 深度学习培训中心还推出了 AI 和 HPC 容器及 NGC 相关课程,您可以复制链接查看课程详情。

使用容器实现高性能计算

学习使用容器化环境开发高性能计算(HPC)应用程序,降低编码的复杂性和可移植性,从而提高开发效率。

原文标题:DevZone | AI和HPC容器

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109048
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134419
  • 容器
    +关注

    关注

    0

    文章

    521

    浏览量

    22808

原文标题:DevZone | AI和HPC容器

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA RTX PRO 2000 Blackwell GPU性能测试

    Blackwell 架构 GPU 端专业图形卡,高度仅为全高 GPU 的二分之一。如果您需要的是一块半高显卡,能适配小机箱,功耗不高,还要具备 AI 及光线追踪性能的话,那么
    的头像 发表于 11-28 09:39 3519次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 2000 Blackwell <b class='flag-5'>GPU</b>性能测试

    NVIDIA Isaac Lab多GPU多节点训练指南

    NVIDIA Isaac Lab 是一个适用于机器人学习的开源统一框架,基于 NVIDIA Isaac Sim 开发,其模块化高保真仿真适用于各种训练环境,可提供各种物理 AI 功能和由 GPU 驱动的物理仿真,缩小仿真与现实世
    的头像 发表于 09-23 17:15 1961次阅读
    <b class='flag-5'>NVIDIA</b> Isaac Lab多<b class='flag-5'>GPU</b>多节点训练指南

    DeepSeek R1 MTP在TensorRT-LLM的实现与优化

    TensorRT-LLM 在 NVIDIA Blackwell GPU 上创下了 DeepSeek-R1 推理性能的世界纪录,Multi-Token Prediction (MTP) 实现了大幅提速
    的头像 发表于 08-30 15:47 3952次阅读
    DeepSeek R1 MTP在TensorRT-LLM<b class='flag-5'>中</b>的实现与<b class='flag-5'>优化</b>

    NVIDIA RTX PRO 4500 Blackwell GPU测试分析

    今天我们带来全新 NVIDIA Blackwell 架构 GPU —— NVIDIA RTX PRO 4500 Blackwell 的测试,对比上一代产品 NVIDIA RTX 450
    的头像 发表于 08-28 11:02 2851次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 Blackwell <b class='flag-5'>GPU</b>测试分析

    NVIDIA桌面GPU系列扩展新产品

    NVIDIA 桌面 GPU 系列扩展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell
    的头像 发表于 08-18 11:50 986次阅读

    如何在Ray分布式计算框架下集成NVIDIA Nsight Systems进行GPU性能分析

    在大语言模型的强化学习训练过程GPU 性能优化至关重要。随着模型规模不断扩大,如何高效地分析和优化 GPU 性能成为开发者面临的主要挑战
    的头像 发表于 07-23 10:34 2033次阅读
    如何在Ray分布式计算框架下集成<b class='flag-5'>NVIDIA</b> Nsight Systems进行<b class='flag-5'>GPU</b>性能分析

    NVIDIA Blackwell GPU优化DeepSeek-R1性能 打破DeepSeek-R1在最小延迟场景的性能纪录

    本文将探讨 NVIDIA TensorRT-LLM 如何基于 8 个 NVIDIA Blackwell GPU 的配置,打破 DeepSeek-R1 在最小延迟场景的性能纪录:在 G
    的头像 发表于 07-02 19:31 2925次阅读
    <b class='flag-5'>NVIDIA</b> Blackwell <b class='flag-5'>GPU</b><b class='flag-5'>优化</b>DeepSeek-R1性能 打破DeepSeek-R1在最小延迟场景<b class='flag-5'>中</b>的性能纪录

    NVIDIA虚拟GPU 18.0版本的亮点

    NVIDIA 虚拟 GPU(vGPU)技术可在虚拟桌面基础设施(VDI)解锁 AI 功能,使其比以往更加强大、用途更加广泛。vGPU 通过为各种虚拟化环境的 AI 驱动工作负载提供
    的头像 发表于 04-07 11:28 1120次阅读

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI开发

    NVIDIA GTC 推出新一代专业级 GPU 和 AI 赋能的开发者工具—同时,ChatRTX 更新现已支持 NVIDIA NIM,RTX Remix 正式结束测试阶段,本月的 NVIDIA
    的头像 发表于 03-28 09:59 1069次阅读

    NVIDIA GPU助力科研人员探索外星世界

    NVIDIA GPU 驱动的深度学习在短短几秒内解读出了卡西尼号土星探测器多年来收集的海量数据,为科研人员探索外星世界提供了更加智能的方式。
    的头像 发表于 02-27 10:37 845次阅读

    0xmd公司通过NVIDIA GPU打造医疗AI解决方案

    本案例,0xmd 公司通过 NVIDIA GPU 打造医疗 AI 解决方案,覆盖影像分析和文本解读等领域。
    的头像 发表于 01-14 16:23 891次阅读

    NVIDIA推出GeForce RTX 50系列台式机和笔记本电脑GPU

    NVIDIA 宣布为游戏玩家、创作者和开发者推出最先进的消费级 GPU——GeForce RTX 50 系列台式机和笔记本电脑 GPU
    的头像 发表于 01-08 11:05 1389次阅读

    NVIDIA和GeForce RTX GPU专为AI时代打造

    NVIDIA 和 GeForce RTX GPU 专为 AI 时代打造。
    的头像 发表于 01-06 10:45 1238次阅读

    借助NVIDIA GPU提升鲁班系统CAE软件计算效率

    本案例鲁班系统高性能 CAE 软件利用 NVIDIA 高性能 GPU,实现复杂产品的快速仿真,加速产品开发和设计迭代,缩短开发周期,提升产品竞争力。
    的头像 发表于 12-27 16:24 1136次阅读

    《CST Studio Suite 2024 GPU加速计算指南》

    的各个方面,包括硬件支持、操作系统支持、许可证、GPU计算的启用、NVIDIA和AMD GPU的详细信息以及相关的使用指南和故障排除等内容。 1. 硬件支持 - NVIDIA
    发表于 12-16 14:25