还未设置个性签名
成为VIP会员 享9项特权: 开通会员

完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>

3天内不再提示

NVIDIA NGC目录中的GPU优化容器

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2022-07-01 11:21 次阅读

借助 NVIDIA NGC 目录中的 GPU 优化容器,更快地开发和部署应用。

什么是容器?

容器是一种便携式软件单元,可将应用及其所有依赖项合并为一个软件包,该软件包不受底层主机操作系统限制。这样无需再构建复杂的环境,并简化了应用开发到部署的过程。

NVIDIA NGC 目录包含一系列用于深度学习机器学习、可视化和高性能计算(HPC)应用的 GPU 优化容器,这些容器均已经过了性能、安全性和可扩展性测试

NGC 目录中的容器的优势

轻松部署

内置库和依赖项可让您轻松部署和运行应用。

加快训练速度

TensorFlow 和 PyTorch 等 NVIDIA AI 容器每月会提供针对性能优化的更新版本,以便加快 AI 训练和推理速度。

运行位置不受限制

在 bare metal、虚拟机(VM)和 Kubernetes 上,将容器部署在任意位置(云端、内部私有云和边缘)的多 GPU/多节点系统上。

放心部署

容器经过常见漏洞和暴露(CVE)扫描(附有安全报告),并通过 NVIDIA AI Enterprise 得到了可选的企业支持。

性能优化

NVIDIA 构建的 Docker 容器每月都会更新,第三方软件也会定期更新,以提供所需的功能,便于您从现有基础架构中获得出色性能,并缩短找出解决方案的时间。

借助 BERT-Large 进行自然语言处理

BERT-Large 利用 VoltaV100 和 Ampere A100 GPU 上的混合精度运算和 Tensor Core,在保持目标准确性的同时缩短训练时间。

在单节点的 8x V100 (16GB) 和 A100 (40GB) 上使用 TensorFlow 时,BERT-Large 和训练的性能表现。混合精度。BERT 的批量大小:3 (V100)、24(A100)

用于图像处理的 ResNet50 v1.5

此模型使用 Volta、Turing 和 NVIDIA Ampere GPU 体系架构上的 Tensor Core 进行混合精度训练,以加快训练速度。

在单节点 8x V100 (16GB) 和 A100 (40GB) 上使用 TensorFlow 时,ResNet 50 的性能表现。混合精度。ResNet50 批量大小:26

用于深度学习的 Matlab

持续开发 Matlab 深度学习容器可提高训练和推理性能。

Windows 10Intel Xeon E5-2623 @2.4GHz,NVIDIA Titan V 12GB GPU

用于各种工作负载的容器

AI 容器

TensorFlow

TensorFlow 是一个用于高性能数值计算的开源软件库。

PyTorch

PyTorch 是具有 Python 前端的 GPU 加速型张量计算框架。

NVIDIA Triton 推理服务器

NVIDIA Triton 推理服务器是一种开源推理解决方案,可更大限度地提高 GPU 的利用率和性能。

NVIDIA TensorRT

NVIDIA TensorRT 是一个C++ 库,可加快 NVIDIA GPU 上的高性能推理。

应用框架

NVIDIA Clara

用于医疗成像的 NVIDIA Clara Train 是一个应用框架,包含超过 20 个先进的预训练模型、迁移学习和联合学习工具、AutoML,以及 AI 辅助的标记数据。

DeepStream

DeepStream 是一款流分析工具包,可用于基于 AI 的视频音频和图像理解和多传感器处理。

NVIDIA Riva

NVIDIA Riva 是一个应用框架,适用于在 GPU 上提供实时性能的多模态对话式 AI 服务。

Merlin Training

Merlin HugeCTR 是 NVIDIA Merlin 的组件,是一款专为推荐系统设计的深度神经网络训练框架。

HPC 容器

NAMD

NAMD 是一段并行分子动力学代码,旨在实现生物大分子系统的高性能模拟。

GROMACS

GROMACS 是一款热门的分子动力学应用,用于模拟蛋白质和脂质。

Relion

Relion 采用经验贝叶斯方法分析低温电子显微镜(cryo EM)。

NVIDIA HPC SDK

NVIDIA HPC SDK 是编译器、库和工具的综合套件,用于构建、部署和管理 HPC 应用。

点击阅读原文,了解更多 AI 和 HPC 容器相关内容

NVIDIA 深度学习培训中心

我们的 NVIDIA 深度学习培训中心还推出了 AI 和 HPC 容器及 NGC 相关课程,您可以复制链接查看课程详情。

使用容器实现高性能计算

学习使用容器化环境开发高性能计算(HPC)应用程序,降低编码的复杂性和可移植性,从而提高开发效率。

原文标题:DevZone | AI和HPC容器

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

  • NVIDIA
    +关注

    关注

    14

    文章

    2677

    浏览量

    95713
  • gpu
    gpu
    +关注

    关注

    27

    文章

    2841

    浏览量

    116765
  • 容器
    +关注

    关注

    0

    文章

    196

    浏览量

    20144
收藏 人收藏

    评论

    相关推荐

    摩尔定律为处理器创新让路

    从数据中心到网络边缘传感器,摩尔定律、冯诺依曼和哈佛在人工智能和图像处理的信号处理新方法方面排名第二
    发表于 08-12 16:04 15次 阅读
    摩尔定律为处理器创新让路

    AI GPU计算在工厂车间提供数据中心性能

    用于自动检测的 AI GPU 计算改变了质量控制操作、运行复杂的视觉算法并整合了工作负载。
    发表于 08-12 16:01 9次 阅读

    壁仞科技发布首款通用GPU芯片 苹果智能指环专利曝光

    近日,亚马逊宣布将以约17亿美元的价格收购真空吸尘器制造商iRobot。根据公告,亚马逊表示,将以每....
    的头像 Camsense 发表于 08-12 13:50 107次 阅读

    芯动科技风华2号GPU与麒麟操作系统完成互认证

    近期,由芯动科技(INNOSILICON)自主研发的“风华2号”GPU与银河麒麟桌面操作系统全面完成....
    的头像 芯动科技Innosilicon 发表于 08-12 11:37 121次 阅读

    NVIDIA Studio技术如何加速创意工作流

    编辑注:本文是 NVIDIA Studio 创意加速系列的一部分,该系列旨在介绍一些特邀艺术家、提供....
    的头像 NVIDIA英伟达企业解决方案 发表于 08-12 11:21 128次 阅读

    NVIDIA SIGGRAPH的最新发布与重要更新

    在今年的 SIGGRAPH 2022 上,NVIDIA 宣布,为基于通用场景描述(USD)连接和构建....
    的头像 NVIDIA英伟达企业解决方案 发表于 08-12 11:14 90次 阅读

    NVIDIA谈引发图形革命的三大驱动力

    AI、虚拟世界和数字人正在推动视觉设计进入更宽广的轨道。
    的头像 NVIDIA英伟达企业解决方案 发表于 08-12 11:12 82次 阅读

    NVIDIA Instant NeRF赢得SIGGRAPH最佳论文

    世界各地的开发者和创作者下载了来自 NVIDIA Research 的最新代码,以使用 2D 图像创....
    的头像 NVIDIA英伟达企业解决方案 发表于 08-12 11:10 128次 阅读

    全新NVIDIA神经图形SDK助力3D内容创建

    新发布的 NeuralVDB 和 Kaolin Wisp 等十几款工具和程序使数百万设计师和创作者能....
    的头像 NVIDIA英伟达企业解决方案 发表于 08-12 11:07 89次 阅读

    配置Python开发环境的DeepStream容器

    对于熟悉 C++ 的开发人员来说,前一篇文章将 DeepStreamSamples 版容器的范例搬到....
    的头像 NVIDIA英伟达企业解决方案 发表于 08-12 11:05 112次 阅读

    IP平台支持云连接设备开发

      越来越广泛的高度便携应用平台,如 Linux、Android 和复杂的实时操作系统 (RTOS)....
    的头像 星星科技指导员 发表于 08-12 10:27 23次 阅读

    医疗设备3D图形挑战系统硬件开发

      以 3D 形式查看患者图像正在稳步改进治疗选择——更好的数据有助于从手术、创伤情况或常规治疗等各....
    的头像 星星科技指导员 发表于 08-11 17:46 87次 阅读

    使用AI技术改进医学成像

      RDMA 的一个典型用例是超声波。在大多数情况下,超声波利用 FPGA 等前端设备在数据到达 G....
    的头像 星星科技指导员 发表于 08-11 16:37 226次 阅读

    GPU引擎增强了超声检测到的大脑运动计算

      平均而言,GPU 计算位移的时间为 51.50 毫秒,而 CPU 计算的时间为 621.5 毫秒....
    的头像 星星科技指导员 发表于 08-11 15:00 122次 阅读
    GPU引擎增强了超声检测到的大脑运动计算

    NVIDIA Jetson TX2 NX GPU助力微链DaoAI加速数据处理

    微链 DaoAI是市场领先的3D 视觉和 AI 机器人系统供应商,拥有全球领先的 3D 视觉认知技术....
    的头像 NVIDIA英伟达企业解决方案 发表于 08-11 09:31 120次 阅读

    NVIDIA发布Omniverse重要版本

    NVIDIA 新发布的工具和功能包括:Avatar Cloud Engine;DeepSearch ....
    的头像 NVIDIA英伟达 发表于 08-11 09:29 77次 阅读

    NVIDIA第二季度收入预计约为67亿美元

    NVIDIA 公司宣布截至 2022 年 7 月 31 日的第二季度初步财务报告部分内容。
    的头像 NVIDIA英伟达 发表于 08-11 09:28 92次 阅读

    全新NVIDIA Omniverse ACE加速虚拟形象开发工作

    Omniverse Avatar Cloud Engine(ACE)为游戏、聊天机器人、数字孪生和虚....
    的头像 NVIDIA英伟达 发表于 08-11 09:24 120次 阅读

    NVIDIA发布开源USD资源和测试套件

    在皮克斯、Adobe、Autodesk、西门子以及媒体、游戏、机器人、工业自动化和零售业等领域创新者....
    的头像 NVIDIA英伟达 发表于 08-11 09:22 126次 阅读

    NVIDIA DOCA 1.4版本的主要更新内容

    NVIDIA DOCA 软件框架旨在帮助开发者在当前和未来的 NVIDIA BlueField DP....
    的头像 NVIDIA英伟达 发表于 08-11 09:20 58次 阅读

    NVIDIA 将为StreamLake释放更多视频云计算能力

    8 月 10 日,快手 StreamLake 品牌发布会正式举办,以“云启共生·水润万象”为主题,推....
    的头像 NVIDIA英伟达 发表于 08-11 09:19 130次 阅读

    FPGA执行通信密集型任务优势 FPGA部署方式特点及限制

    FPGA可针对数据包步骤数量搭建同等数量流水线(流水线并行结构),数据包经多个流水线处理后可即时输出....
    发表于 08-10 10:19 134次 阅读

    NVIDIA发布2023财年第二季度初步财务报告

        第二季度初步核算收入为67.0亿美元,而展望为81.0亿美元     收入不及预期的主要原因....
    发表于 08-09 18:08 113次 阅读
    NVIDIA发布2023财年第二季度初步财务报告

    壁仞科技发布首款通用GPU芯片,创全球算力新纪录

    今天,国产芯片迎来重大突破,壁仞科技在上海发布首款通用GPU芯片BR100,创出全球算力纪录,16位....
    发表于 08-09 17:55 149次 阅读
    壁仞科技发布首款通用GPU芯片,创全球算力新纪录

    使用TREX探索NVIDIA TensorRT引擎

      元数据 JSON 文件描述了引擎的生成器配置以及用于构建引擎的 GPU 的相关信息。此信息为引擎....
    的头像 星星科技指导员 发表于 08-09 10:34 75次 阅读
    使用TREX探索NVIDIA TensorRT引擎

    i9-13900K加速频率5.8GHz,单核心2314分、多核心26464分

    i9-13900K将利用更成熟的工艺架构、各种睿频极速技术,再创频率新高。之前也多次见过i9-139....
    发表于 08-08 17:39 139次 阅读

    NVIDIA cuBLAS库加速BLAS的GPU设计实现

    cuBLASMg 提供了先进的多 GPU 矩阵间乘法,您可在多台设备间以 2D 块循环方式分发每个矩....
    的头像 NVIDIA英伟达企业解决方案 发表于 08-07 15:46 158次 阅读

    英伟达是一家非常值得长期投资的公司

    随着英伟达(NVDA)的市值逐渐逼近1万亿美元,我们将在本文中讨论一下我们长期投资一家公司时最关注的....
    的头像 猛兽财经 发表于 08-07 14:39 55次 阅读
    英伟达是一家非常值得长期投资的公司

    惊艳全场!风华2号桌面GPU性能领先,体验流畅,实现商用突破

    8月3日,芯动科技“风华2号”GPU新品发布会暨前沿技术应用研讨会,在武汉光谷皇冠假日酒店隆重举办。....
    发表于 08-05 10:23 335次 阅读
    惊艳全场!风华2号桌面GPU性能领先,体验流畅,实现商用突破

    随机森林的概念、工作原理及用例

    随机森林是一种监督式算法,使用由众多决策树组成的一种集成学习方法,输出是对问题最佳答案的共识。随机森....
    的头像 NVIDIA英伟达 发表于 08-05 10:00 81次 阅读

    摩尔线程与宝德签署战略合作协议

    在此宏观背景之下,专注于多功能GPU研发与设计的摩尔线程发起了PES (完美体验系统,Perfect....
    的头像 摩尔线程 发表于 08-05 09:42 130次 阅读

    芯动科技风华2号桌面GPU实现多个创新突破

    8月3日,芯动科技“风华2号”GPU新品发布会暨前沿技术应用研讨会,在武汉光谷皇冠假日酒店隆重举办。....
    发表于 08-05 09:18 102次 阅读

    快进到GaN数据中心

    “硅芯片”一直是数据革命的支柱——实际上是推动者——无论是在 CPU、GPU、内存、网络等的数据处理....
    的头像 五斤麻辣油 发表于 08-05 08:04 69次 阅读
    快进到GaN数据中心

    怎么使用ARM处理器上的GPU进行编程工作呢

    怎么使用ARM处理器上的GPU进行编程工作呢?有哪位大神可以解释一下 ...
    发表于 08-04 14:17 1691次 阅读

    NVIDIA帮助快速构建性能更强大的AI产品

    将近三十多家合作伙伴正在提供基于新一代的 NVIDIA Jetson Orin 模块打造的系统,以帮....
    的头像 NVIDIA英伟达企业解决方案 发表于 08-04 14:17 228次 阅读

    电源内部的元器件你知道多少

    电源不像处理器,可以看规格知性能;电源也不像显卡,由一颗关键的GPU来决定档次。一款好的电源除了满足....
    发表于 08-04 11:19 34次 阅读

    基于 NVIDIA DRIVE Orin赋能小马智行重新定义长途运输

    重型设备制造商三一重卡将与自动驾驶公司小马智行联合开发 L4 级重卡产品,并计划于今年投产。
    发表于 08-04 10:00 120次 阅读

    小马智行将与三一重卡共同开发L4级自动驾驶重卡产品

    重型设备制造商三一重卡将与自动驾驶公司小马智行联合开发 L4 级重卡产品,并计划于今年投产。
    发表于 08-04 09:55 113次 阅读

    快速了解kubernetes

    Master 即主节点,负责控制整个 kubernetes 集群。它包括 Api Server、Sc....
    发表于 08-03 10:38 54次 阅读

    NVIDIA DALI概述及主要特性

    NVIDIA 数据加载库(DALI)是一个可移植的开源库,专用于解码及增强图像、视频和语音,从而加速....
    的头像 NVIDIA英伟达企业解决方案 发表于 08-03 10:20 1023次 阅读

    DeepStream Samples版的操作环境调试过程

    NVIDIA 的 DeepStream 是目前业界最好开发而且功能强大的 AI 视频分析工具,在 N....
    的头像 NVIDIA英伟达企业解决方案 发表于 08-03 10:18 87次 阅读

    Exaflop简史

    Exaflop 是衡量超级计算机性能的单位,表示该计算机每秒可至少进行百亿亿次浮点运算。
    的头像 NVIDIA英伟达企业解决方案 发表于 08-03 09:54 81次 阅读

    基于芯原GPU IP 的处理器平台上完成适配及性能优化

    在芯原微电子(上海)股份有限公司(芯原股份,VeriSilicon,688521.SH)和睿赛德科技....
    的头像 RTThread物联网操作系统 发表于 08-03 09:08 169次 阅读

    请问大神如何使用RK3568的自带系统上的GPU呢

    请问大神如何使用RK3568的自带系统上的GPU呢?有什么方法吗 ...
    发表于 07-22 16:27 2342次 阅读

    华秋第八届硬创大赛携手NVIDIA初创加速计划,赋能企业发展

    中国硬件创新创客大赛始于2015年,由深圳华秋电子有限公司主办,至今已经成功举办七届,赛事范围覆盖华南、华东、华北三大地...
    发表于 07-11 11:28 3303次 阅读

    香橙派RK3399开发板OrangePi4 LTS在linux上的GPU测试说明

    1、Linux4.4 和 Linux5.10 Debian 系统 GPU 的测试说明 注意,Linux4.4 Debian10 和 Linux5.10 Debian11 系统使用的...
    发表于 06-22 20:17 16027次 阅读
    香橙派RK3399开发板OrangePi4 LTS在linux上的GPU测试说明

    请问在RK3399pro中间计算时能否调用GPU的一些现成数据库或函数来计算

    我在用RK3399pro的NPU做深度学习计算,使用了两个rknn模型进行推理,但是在这两个rknn模型之间需要进行一些中间计算(从第一...
    发表于 05-09 15:26 3823次 阅读

    tf代码为什么在rk3399上训练比没有gpu的电脑慢很多

    把tf代码从电脑上放到rk3399上运行训练,比电脑慢的很多很多,板子不是带有npu吗?是不是代码需要改动什么啊? ...
    发表于 04-22 16:23 8833次 阅读

    简单介绍下Arm Mali的GPU系列

    对于手机终端来说,GPU图像处理能力是衡量一台手机的性能标杆。首先,是UI流畅性,大家拿到手机都得先划来划去看下UI是否...
    发表于 04-12 11:01 5681次 阅读

    充分利用Arm NN进行GPU推理

    Arm拥有跨所有处理器的计算IP。而且,无论您要在GPU,CPU还是NPU上进行ML推理,都可以在一个通用框架下使用它们:...
    发表于 04-11 17:33 4428次 阅读

    介绍android下的OpenCL开发步骤

    1、介绍android下OpenCL开发 Firefly rk3288采用Mali-T764的GPU,该GPU支持OpeCL 1.1。下面一步一步介绍android...
    发表于 04-11 14:35 2960次 阅读

    英伟达DPU的过“芯”之处

    最近几年,经常关注科技圈的朋友们总会发现,每次遇到厂商有重大发布,就总能看到“颠覆”、“极致”、“革命性”等概念出现在发...
    发表于 03-29 14:42 3116次 阅读