0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

全新NVIDIA Base Command功能说明

NVIDIA英伟达 来源:NVIDIA英伟达 作者:NVIDIA英伟达 2022-09-26 09:21 次阅读

新一批创新企业开始基于 DGX 系统、Base Command 和 DGX SuperPOD 来实现 AI,包括 Adept AI、现代汽车集团、KT 和威斯康星大学麦迪逊分校。

在GTC 大会上,NVIDIA 公布了DGX 产品系列的多项更新,有望推动企业级 AI 开发实现新突破。

NVIDIA DGX H100 系统现已提供订购。这些基础设施的基础构建模块支持 NVIDIA 的全栈企业级 AI 解决方案。

NVIDIA DGX H100 在 FP8 精度下提供 32 petaflop 的性能,将能大幅提升企业级 AI 开发的效率。与上一代系统相比,DGX H100 的总体拥有成本降至1/3,能效提高 3.5 倍。

新的 NVIDIA Base Command 软件可简化和加速 AI 开发,有力支持从单节点到 DGX SuperPOD 的各种 DGX 系统高效运行。

此外,NVIDIA DGX BasePOD(DGX POD 的进阶版)也揭开了面纱,它使 IT 团队能更快速轻松地获得、部署和管理企业级数据中心 AI。

全球许多 AI 领军企业都在使用 NVIDIA DGX 系统和软件,致力于寻求技术突破(从自动驾驶汽车到语音助手),且从未放缓创新的步伐。

全新 NVIDIA Base Command 功能

NVIDIA Base Command 提供企业级编排和集群管理功能,并且包含完整的软件栈,以尽可能地提高 AI 开发者的工作效率、IT 可管理性和工作负载性能。

Base Command 的工作流管理功能现在包含对本地 DGX SuperPOD 环境的支持,使企业能通过简化的项目团队协作、集成的监控和报告面板来集中控制 AI 开发项目。

Base Command 与 NVIDIA AI Enterprise 软件套件配合使用,该套件现已包含在所有 DGX 系统中。借助此 NVIDIA AI 软件,客户可以使用其所支持的 AI 和数据科学工具、优化的框架和预训练模型,进行端到端 AI 开发和部署。

另外,此软件还能与以下公司的企业工作流管理和 MLOps 工具进行集成:DGX-Ready 软件提供商 Domino Data Lab、Run.ai、Weights & Biases,以及NVIDIA初创加速计划成员 Rescale。此软件还包含多个库,不仅能优化和加速计算、存储和网络基础设施,还能确保尽可能地延长系统的正常运行时间、安全性和可靠性。

全新 DGX BasePOD 参考架构

DGX BasePOD 为 DGX 系统提供参考架构,该架构融合了集成计算、网络、存储和软件方面的最佳设计实践。

客户已经使用 NVIDIA DGX POD 来推动各种企业应用的开发。DGX BasePOD 基于DGX POD 的成功,其新型行业解决方案瞄准了 AI 领域的巨大机遇,包括自然语言处理、医疗健康和生命科学以及欺诈检测

DGX BasePOD 解决方案通过 NVIDIA 合作伙伴网络,作为完全集成、可随时部署的产品提供给客户,其规模介于两个到数百个 DGX 系统之间,并采用由以下 NVIDIA DGX 存储技术合作伙伴开发的认证高性能存储技术:DDN、戴尔、NetApp、Pure Storage、VAST Data 和 WEKA 等。

领军企业借助 DGX 系统推动 AI 开发实现突破

世界各地的许多企业都选择 NVIDIA DGX 系统来有效运行其高级 AI 工作负载。以下是在 DGX A100 系统上开发任务关键型 AI 功能的部分 AI 创新者:

机器学习研究和产品实验室 Adept 正在打造基于大型语言模型的 AI 团队成员,其原型基于 NVIDIA DGX Foundry 开发,然后利用 Oracle Cloud Infrastructure上的 NVIDIA A100 GPU 和 NVIDIA Megatron 进行扩展。

现代汽车集团正使用 40 个节点的 DGX SuperPOD,探索研究超大规模 AI 工作负载。

电信公司 KT 正在使用 NVIDIA NeMo Megatron 框架、NVIDIA DGX SuperPOD 和 NVIDIA Base Command 软件,为各种韩语应用(包括 GiGA Genie 智能扬声器)开发一个包含大约 400 亿参数的 LLM。

威斯康星大学麦迪逊分校正在将 NVIDIA DGX 系统与 Flywheel 研究平台以及 NVIDIA Clara 医疗健康应用框架一起使用,致力于快速将 AI 引入到医学成像设备中。该大学与其他医院合作,使用 NVIDIA 联邦学习应用运行时环境 (NVIDIA FLARE) 在 DGX 系统上安全地训练用于医学成像、标注数据和分类的 AI 模型。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4592

    浏览量

    101706
  • AI
    AI
    +关注

    关注

    87

    文章

    26443

    浏览量

    264043

原文标题:GTC22 | 全新 NVIDIA DGX 系统软件和基础设施解决方案强效赋能企业 AI

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA推出两款基于NVIDIA Ampere架构的全新台式机GPU

    两款 NVIDIA Ampere 架构 GPU 为工作站带来实时光线追踪功能和生成式 AI 工具支持。
    的头像 发表于 04-26 11:25 129次阅读

    NVIDIA Edify为视觉内容提供商带来3D生成式AI和全新图像控件

    用于视觉生成式 AI 的多模态架构 NVIDIA Edify 正在迈入全新维度。
    的头像 发表于 03-26 09:49 317次阅读

    NVIDIA宣布推出基于Omniverse Cloud API构建的全新软件框架

    NVIDIA 在 GTC 大会上宣布推出基于 Omniverse Cloud API(应用编程接口)构建的全新软件框架。
    的头像 发表于 03-25 09:09 194次阅读

    NVIDIA Omniverse中的物理模拟功能

    NVIDIA Omniverse™ Simulation 作为 NVIDIA Omniverse™ 平台的关键组件之一,由 NVIDIA 技术提供动力支持,包括 PhysX®、Flow、Blast 和 AI 等技术。
    的头像 发表于 03-08 11:30 313次阅读
    <b class='flag-5'>NVIDIA</b> Omniverse中的物理模拟<b class='flag-5'>功能</b>

    Altium Designer 24.2.2新功能说明

    当前版本扩展了PCB Layout Replication工具的功能,支持用户在工具检测到多个元件具有类似连接的目标块中手动映射元件。该功能使您可以在不违反电路连接的前提下,手动选择可以相互替换的可用元件。
    的头像 发表于 02-23 09:33 799次阅读
    Altium Designer 24.2.2新<b class='flag-5'>功能说明</b>

    三合一筋膜枪功能说明

    电子发烧友网站提供《三合一筋膜枪功能说明.rar》资料免费下载
    发表于 01-12 09:13 1次下载

    MD8002D 3W 单声道 AB类音频功放芯片功能说明

    电子发烧友网站提供《MD8002D 3W 单声道 AB类音频功放芯片功能说明.pdf》资料免费下载
    发表于 01-02 11:31 0次下载

    NVIDIA DOCA 2.5 长期支持版本发布

    开放的软件开发套件和运行环境,同时驱动 NVIDIA DOCA 开发者社区和生态合作的长足发展。 此次发布,NVIDIA DOCA 2.5 新版本引入了全新功能和增强功能,强
    的头像 发表于 12-26 18:25 198次阅读
    <b class='flag-5'>NVIDIA</b> DOCA 2.5 长期支持版本发布

    lm311工作原理和功能说明

    解释LM311的工作原理和功能说明。 一、工作原理 LM311采用了电压比较器的结构,它将两个输入信号(Vin+和Vin-)进行比较,并输出一个高电平或低电平的结果信号。下面我们将详细介绍LM311的工作原理。 输入端 LM311具有非常高的输入阻抗,使得
    的头像 发表于 12-15 11:08 1579次阅读

    工业以太网标准10BASE-T1L的最佳PHY是什么呢?

    随着工厂网络面临的压力加强,工业以太网标准 10BASE-T1L 正引起越来越多的关注。看到 10BASE-T1L,许多人可能会说:“我知道 10BASE-T1L 这个名字,但我想再次查看它的
    的头像 发表于 12-11 16:12 937次阅读

    全新NVIDIA Spectrum-X网络平台构筑阿里生成式AI云底座

    全新 NVIDIA Spectrum-X 网络平台构筑阿里生成式 AI 云底座。
    的头像 发表于 11-02 09:07 346次阅读
    <b class='flag-5'>全新</b><b class='flag-5'>NVIDIA</b> Spectrum-X网络平台构筑阿里生成式AI云底座

    NVIDIA Hopper GPU上的新cuBLAS12.0功能和矩阵乘法性能

    NVIDIA Hopper GPU 上的新 cuBLAS 12.0 功能和矩阵乘法性能
    的头像 发表于 07-05 16:30 1757次阅读
    <b class='flag-5'>NVIDIA</b> Hopper GPU上的新cuBLAS12.0<b class='flag-5'>功能</b>和矩阵乘法性能

    ZSC31050功能说明

    ZSC31050功能说明
    发表于 07-04 18:31 1次下载
    ZSC31050<b class='flag-5'>功能说明</b>

    USB电流电压表-功能说明

    电流
    YS YYDS
    发布于 :2023年07月02日 17:03:19

    工程监测无线中继采集发送仪 指示灯功能说明及接口定义

    工程监测NLM5无线中继采集发送仪 指示灯功能说明及接口定义 工程监测NLM5无线中继采集发送仪   指示灯功能说明 标识 名称 状态 描述说明 备注说明 CHG 正在充电 常亮 正在
    的头像 发表于 05-10 11:16 437次阅读
    工程监测无线中继采集发送仪 指示灯<b class='flag-5'>功能说明</b>及接口定义