0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

从2023 GTC谈NVIDIA硬核技术

智能计算芯世界 来源:Nvidia 2023开发者大会 2023-03-28 09:28 次阅读

2023 年 GTC 大会上,英伟达 CEO 发布了四个全新推理平台,每个平台都包含针对特定的 AIGC 推理工作负载优化的 NVIDIA GPU 以及专用软件:

1)用于图像渲染和 AI 视频的 L4。L4 提供增强的视频解码/转码、视频流、增强现实以及生成 AI 视频等功能,可提供比 CPU 高 120 倍的 AI 视频性能,一台 8 卡 L4 服务器能够替代 100 多台用于处理 AI 视频的双插槽 CPU 服务器。

2)用于 Omniverse、图像生成、文本转图像等各类生成式 AI 的 L40。L40 针对图形和支持 AI 的 2D、视频和 3D 图像生成进行了优化。L40 平台作为 Omniverse 的引擎,用于在数据中心构建和运行元宇宙应用程序,推理性能是云推理 GPU T4 的 10 倍。

3)用于大语言模型(LLM)推理的 H100 NVL。H100 NVLGPU 适用于大规模部署 ChatGPT 等大型 LLM。H100 NVL 通过 NVLINK 将两张 H100 PCIE 桥接在一起,其中的每张卡拥有 94GB HBM3 内存,同时内置 Transformer 引擎。与目前唯一可以在云上处理 GPT 模型的 HXG A100 相比,一台搭载四对 H100 NVL 和双 GPU NVLINK 的服务器可以将推理速度提高 10 倍。

4)Grace Hopper Superchip 适用于推荐模型、向量数据库和大型语言模型的 AI 数据库,并通过 NVLink-C2C 技术为 Grace CPU 和 Hopper GPU 之间提供高达 900GB/s 的高速连接,CPU 查询和存储巨型嵌入表,GPU 负责将收到的结果进行推理,整体是 PCIE 速度的 7 倍。

一、DGX CloudAI超级计算服务DGX Cloud提供专用的NVIDIA DGX AI超级计算集群,搭配NVIDIA AI软件,可让企业立即访问为生成AI和其他突破性应用程序训练高级模型所需的基础设施和软件。该服务使每个企业都可以使用简单的网络浏览器访问自己的AI超级计算机,企业按月租用DGX Cloud集群,确保可快速轻松地扩展大型多节点训练工作负载的开发,而无需等待通常需求量很大的加速计算资源。 NVIDIA Base Command平台软件:可使用其管理和监控DGX Cloud训练工作负载,该软件可在DGX Cloud以及本地NVIDIA DGX超级计算机上提供无缝的用户体验。使用Base Command Platform,客户可将其工作负载与每项工作所需的正确数量和类型的DGX基础设施相匹配。DGX Cloud包括NVIDIA AI Enterprise,平台的软件层,提供端到端的AI框架和预训练模型。今日发布的NVIDIA AI Enterprise 3.1提供了新的预训练模型、优化框架和加速数据科学软件库,为开发人员的AI项目提供了额外的快速启动。行业巨头案例:

①Amgen(世界领先的生物技术公司之一)正在使用DGX Cloud和NVIDIA BioNeMo大型语言模型软件来加速药物发现,包括NVIDIA AI Enterprise软件,内含NVIDIA RAPIDS数据科学加速库。

②CCC Intelligent Solutions (领先的财产和意外伤害保险经济云平台,CCC)正在使用DGX Cloud来加速和扩展其AI模型的开发和培训。

③ServiceNow(数字业务平台提供商)将DGX Cloud与本地NVIDIA DGX超级计算机结合使用,以实现灵活、可扩展的混合云AI超级计算,这有助于推动其在大型语言模型、代码生成和因果分析方面的AI研究。二、Picasso Service云服务

用途:用于构建和部署生成式AI驱动的图像、视频和3D应用程序,具有高级文本到图像、文本到视频和文本转3D功能,可通过简单云API提高创造力、设计和数字模拟的生产力。用法:软件制造商、服务提供商和企业可使用Picasso在其专有数据上训练NVIDIA Edify基础模型,以构建使用自然文本提示的应用程序,从而为数百个用例快速创建和定制视觉内容,包括产品设计、数字孪生、讲故事和人物创作。拓展:要构建自定义应用程序,企业还可以从Picasso的Edify模型集开始,这些模型使用完全许可的数据进行预训练,还可以使用Picasso来优化和运行生成式AI模型。三、NVIDIA BioNeMo服务BioNeMo Service是一种用于早期药物发现中生成AI的云服务,具有九种最先进的大型语言和扩散模型。可通过Web界面或完全托管的API访问,并且可以在NVIDIA DGX Cloud上进一步训练和优化,生物学生成式AI的工作流程得到了优化和统包。 BioNeMo服务具有九个AI生成模型,涵盖了开发AI药物发现管道的广泛应用:AlphaFold 2、ESMFold和OpenFold用于根据一级氨基酸序列预测3D蛋白质结构、用于蛋白质特性预测的ESM-1nv和ESM-2、用于蛋白质生成的ProtGPT2、MegaMolBART和MoFlow用于小分子生成、用于预测小分子与蛋白质结合结构的DiffDock等。

21f8ab8a-ccf8-11ed-bfe3-dac502259ad0.png

四、推出四种配置:L4、L40、H100 NVL、Grace Hopper

L4:一台8-GPU L4服务器将取代一百多台用于处理AI视频的双插槽CPU服务器。L40:针对Omniverse、图形渲染以及文本转图像和文本转视频等生成式AI,推出L40,其性能是云推理GPU T4的10倍。

H100 NVL:针对ChatGPT等大型语言模型的推理,推出Hopper GPU,配备双GPU NVLink的 PCIE H100 , H100 NVL配备94GB HBM3显存,可处理拥有1750亿参数的GPT-3, 同时还可支持商用PCIE服务器轻松扩展。

Grace Hopper:新超级芯片,通过900GB/秒高速一致性芯片到芯片接口,非常适合处理大型数据集,例如推荐系统和大型语言模型的AI数据库借助Grace Hopper,Grace可以查询嵌入表,并将结果直接传入到Hopper,速度比PCIE快7倍。

五、Omniverse应用Omniverse是实现工业数字化的数字到物理操作系统,是云原生,同时不限平台,可让团队随时随地在我们的虚拟工场中展开协作。Omniverse网络中的网络正在呈指数级增长,还连接了Siemens Teamcenter、NX和Process Simulate、RockWell Automation Emulate3D、Cesium、Unity等许多应用。应用于汽车企业数字化:①沃尔沃汽车公司和通用汽车使用Omniverse USD Composer连接和统一其资产工作流,并将汽车零部件在虚拟环境中组装成数字孪生汽车,在工程和仿真中, Omniverse将Powerflow空气动力学可视化。 ②新一代梅赛德斯-奔驰和捷豹陆虎汽车,使用Omniverse Drive Sim生成,梅赛德斯奔驰使用Omniverse为新车型构建、优化和规划组装流水线。 ③丰田公司使用Omniverse构建工厂的数字孪生。

三款专为Omniverse设计的系统:

①新工作站,由NVIDIA Ada RTX GPU和英特尔最新款CPU提供动力支持,适合光线追踪、物理仿真、神经图形和生成式AI,2023年3月起,BOXX、戴尔、惠普、联想将提供这款工作站。

②新型NVIDIA OVX服务器,由Omniverse优化而来,OVX由服务器GPU Ada RTX L40和BlueField-3组成,将由戴尔、HPE、Quanta、技嘉、联想和Supermicro提供。

③Omniverse Cloud,基于NVIDIA OVX运算系统推出, 每一层Omniverse堆栈包括芯片、系统、网络和软件都是新发明,正将Omniverse连接到微软365生产力套件。

六、超算及云服务

发布Grace、Grace-Hopper和BlueField-3三款新芯片,适用于超级节能加速数据中心,更新了100个加速库,包括用于量子计算的cuQuantum、用于组合优化的cuOpt、以及用于计算光刻的cuLitho(与台积电、ASML和Synopsys合作,达到2nm及更高制程),可将计算光刻用时提速40倍。计算光刻:500套DGX H100(包含4000颗Hopper GPU)可完成与4万颗CPU运算服务器相同的工作量,但速度快40倍,功耗低9倍,即意味着GPU加速后,生产光掩模的计算光刻工作用时可以从几周减少到八小时。 NVIDIA DGX AI超级计算机是生成式大型言模型取得突破的引擎,DGX H100 AI超级计算机正在生产,并即将通过全球不断扩大的OEM和云服务合作伴网络面世。DGX没有止步于研究,正在成为现代化AI工厂,Nvidia通过与Azure、Google GCP、Oracle OCI合作,拓展NVIDIA DGX Cloud业务模式。

七、总结

英伟达推出了新的推理平台,包括四种配置和一个体系架构:

①适用于处理AI视频的8-GPU服务器L4。

②适用于Omniverse和图形渲染的L40。

③适用于扩展LLM推理的H100PCIE。

④适用于推荐系统和向量数据库的Grace-Hopper。 此外,通过与Google合作,Google GCP成为首款NVIDIA AI云,NVIDIA AI Foundations是一个云服务和代工厂,用于构建自定义语言模型和生成式AI,包括语言视觉和生物学模型构建服务。

Omniverse是实现工业数字化的数字到物理操作系统,可以统一端到端工作流,并将价值3万亿美元的汽车行业数字化;在Azure上进行托管,与微软合作,将Omniverse Cloud引入各行业。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4597

    浏览量

    101763
  • 超级计算机
    +关注

    关注

    2

    文章

    434

    浏览量

    41613
  • 数字化
    +关注

    关注

    8

    文章

    7722

    浏览量

    60892

原文标题:从2023 GTC谈NVIDIA硬核技术

文章出处:【微信号:AI_Architect,微信公众号:智能计算芯世界】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【限时领取精美礼品】报名2022 GTC大会,与行业大咖探索 AI 前沿科技

    NVIDIA GTC22 将于 3 月 21 日至 24 日线上举办。NVIDIA 创始人兼首席执行官黄仁勋将带来囊括众多新闻发布的主题演讲。电子发烧友平台作为NVIDIA 初创加速计
    发表于 03-18 11:06

    助力AI产业落地,云知声展示全栈AI硬核技术

    本次云知声开放日聚焦 AI 技术、应用和产业,云知声董事长/CTO 梁家恩博士与多位云知声技术专家向深圳的合作伙伴、行业人士全面的秀出了全栈 AI 硬核技术,并与腾讯杰出科学家/腾讯 AI Lab
    的头像 发表于 04-26 16:42 2631次阅读

    小米将投入资金超100亿元,争取在“硬核技术”上突围

    小米公司今年成立10周年了,以往给大家的印象就是性价比制胜,不过这两年来小米一直在转型技术领先。雷军今天在采访中更表态,要下决心突围硬核技术
    的头像 发表于 10-15 09:38 1508次阅读

    GTC23 | 倒计时 5 天,火速收藏 NVIDIA 高性能加速网络专场预约攻略!

    倒计时 5 天! NVIDIA GTC 大会将于 2023 年 3 月 20 日 - 23 日 举行。本次 GTC 针对中国用户举办的特别活动——
    的头像 发表于 03-19 22:45 351次阅读

    NVIDIA GTC 2023看点:AI计算系统、生成式AI 、工业元宇宙与机器人

    NVIDIA GTC 2023看点:AI 计算系统、生成式 AI 、工业元宇宙与机器人 GTC 2023 线上大会将于 3 月 20 日至
    的头像 发表于 03-22 13:42 1150次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>GTC</b> <b class='flag-5'>2023</b>看点:AI计算系统、生成式AI 、工业元宇宙与机器人

    NVIDIA GTC 2023:GPU算力是AI的必需品

    从OpenAI发布GPT-4,到百度发布文心一言;AI开始了爆走模式,现在我们来看看 NVIDIA GTC 2023 。 手握GPU算力的NVIDIA是AI的必需品。 图源 
    的头像 发表于 03-22 15:23 2946次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>GTC</b> <b class='flag-5'>2023</b>:GPU算力是AI的必需品

    NVIDIA GTC 2023:摩尔定律的动力来源是AI

    NVIDIA GTC 2023:摩尔定律的动力来源是AI 在 NVIDIA GTC 2023
    的头像 发表于 03-22 16:48 1424次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>GTC</b> <b class='flag-5'>2023</b>:摩尔定律的动力来源是AI

    英伟达 GTC 2023上黄仁勋谈生成式AI

    英伟达 GTC 2023上黄仁勋谈生成式AI 黄教主在GTC 2023上大谈特谈生成式AI,同时在GTC
    的头像 发表于 03-22 17:14 1659次阅读
    英伟达 <b class='flag-5'>GTC</b> <b class='flag-5'>2023</b>上黄仁勋谈生成式AI

    GTC 2023上英伟达发布NVIDIA DGX Cloud人工智能云服务

    2023 GTC大会上线,在大会的主题演讲中,黄仁勋围绕AI、量子计算、芯片等前沿科技,发布了一系列前沿技术和产品。包括:L4 Tensor Core GPU、L40 GPU、H100 NVL
    的头像 发表于 03-22 19:16 3167次阅读
    <b class='flag-5'>GTC</b> <b class='flag-5'>2023</b>上英伟达发布<b class='flag-5'>NVIDIA</b> DGX Cloud人工智能云服务

    GTC 2023NVIDIA cuLitho将加速计算引入计算光刻技术领域的突破性成果

    领域的突破成果.NVIDIA宣布推出一项将加速计算引入计算光刻技术领域的突破性成果。在当前生产工艺接近物理极限的情况下,这项突破使ASML、TSMC和Synopsys等半导体行业领导者能够加快新一代芯片的设计和制造。 官网直播截图 在2
    的头像 发表于 03-22 19:29 1w次阅读
    <b class='flag-5'>GTC</b> <b class='flag-5'>2023</b>:<b class='flag-5'>NVIDIA</b> cuLitho将加速计算引入计算光刻<b class='flag-5'>技术</b>领域的突破性成果

    GTC 2023上黄仁勋谈AI ChatGPT仅是一个起点NVIDIA将AI引入各行各业

    GTC 2023上黄仁勋谈AI ChatGPT仅是一个起点NVIDIA将AI引入各行各业 ChatGPT是非常火爆但是; ChatGPT仅是一个起点。 从 AI训练到部署,从半导体到软件库,从系统
    的头像 发表于 03-22 19:42 2237次阅读
    <b class='flag-5'>GTC</b> <b class='flag-5'>2023</b>上黄仁勋谈AI ChatGPT仅是一个起点<b class='flag-5'>NVIDIA</b>将AI引入各行各业

    GTC23 | 美敦力与 NVIDIA 携手打造医疗设备 AI 平台

    NVIDIA 技术集成到美敦力的实时 AI 内窥镜设备,帮助改善患者疗效 加利福尼亚州圣克拉拉 – GTC – 太平洋时间 2023 年 3 月 21 日 –
    的头像 发表于 03-23 06:55 373次阅读

    NVIDIA GTC黄仁勋: 属于AI的高光时刻已经到来

    NVIDIA GTC黄仁勋: 属于AI的高光时刻已经到来 GTC已成为全球最重要的AI大会之一。在此次的GTC主题会议上黄仁勋表示计算正在以“光速”发展。 目前全球
    的头像 发表于 03-23 16:34 1394次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>GTC</b>黄仁勋: 属于AI的高光时刻已经到来

    GTC 2023 NVIDIA将加速计算引入半导体光刻 计算光刻技术提速40倍

    GTC 2023 NVIDIA将加速计算引入半导体光刻 计算光刻技术提速40倍 NVIDIA cuLitho的计算光刻库可以将计算光刻
    的头像 发表于 03-23 18:55 7537次阅读
    <b class='flag-5'>GTC</b> <b class='flag-5'>2023</b> <b class='flag-5'>NVIDIA</b>将加速计算引入半导体光刻 计算光刻<b class='flag-5'>技术</b>提速40倍

    自动驾驶资讯集锦:GTC 最新发布及汽车数字工厂精彩视频!

    2023 年 3 月 20 日 - 2023 年 3 月 23 日举行的 GTC 大会上,NVIDIA 分享了在加速计算、AI 和工业元宇宙技术
    的头像 发表于 04-07 02:30 549次阅读