0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

超级芯片GH200发布,AI算力是H100的两倍

智能计算芯世界 来源:智能计算芯世界 2023-08-10 09:16 次阅读

英伟达在计算机图形学顶会 SIGGRAPH 2023 上发布了专为生成式 AI 打造的下一代 GH200 Grace Hopper 平台,并推出了 OVX 服务器、AI Workbench 等一系列重磅更新。

五年前,也是在 SIGGRAPH 大会的演讲中,英伟达宣布将 AI 和实时光线追踪引入 GPU ,可以说,当时的这个决定重塑了计算图形学。

「我们意识到光栅化已经达到了极限,」黄仁勋表示:「这要求我们重塑硬件、软件和算法。在我们用 AI 重塑 CG 的同时,也在为 AI 重塑 GPU。」

预言应验了:几年来,计算系统变得越来越强大,例如 NVIDIA HGX H100,它利用 8 个 GPU 和总共 1 万亿个晶体管,与基于 CPU 的系统相比,提供了显著的加速。

「这就是世界数据中心迅速转向加速计算的原因,」在今年的 SIGGRAPH 大会,黄仁勋重申:「The more you buy, the more you save.」

如今,训练越来越大的生成式 AI 模型所需的计算未必由具有一定 GPU 能力的传统数据中心来完成,而是要依靠像 H100 这样从一开始就为大规模运算而设计的系统。可以说,AI 的发展在某种程度上只受限于这些计算资源的可用性。

但黄仁勋断言,这仅仅是个开始。新模型不仅需要训练时的计算能力,还需要实现由数百万甚至数十亿用户实时运行的计算能力。

「未来,LLM 将出现在几乎所有事物的前端:人类就是新的编程语言。从视觉效果到快速数字化的制造市场、工厂设计和重工业,一切都将采用自然语言界面。」黄仁勋表示。

在这场一个多小时的演讲中,黄仁勋带来了一系列新发布,全部面向「生成式 AI」。

更强的 GH200 Grace Hopper 超级芯片平台

英伟达的 Grace Hopper 超级芯片 NVIDIA GH200 结合了 72 核 Grace CPU 和 Hopper GPU,并已在 5 月全面投入生产。

现在,黄任勋又宣布 Grace Hopper 超级芯片将配备 HBM3e 高带宽内存(HBM3e 比当前的 HBM3 快 50%),下一代 GH200 Grace Hopper 平台将大幅提升生成式 AI 的计算速度。

全新的 GH200 内存容量将增加至原有的 3.5 倍,带宽增加至 3 倍,包含一台具有 144 个 Arm Neoverse 核心、282GB HBM3e 内存的服务器,提供 8 petaflops 的 AI 算力。

为了提升大模型的实际应用效率,生成式 AI 模型的工作负载通常涵盖大型语言模型、推荐系统和向量数据库。GH200 平台旨在全面处理这些工作负载,并提供多种配置。

英伟达表示,这款名为 GH200 的超级芯片将于 2024 年第二季度投产。

Nvidia AI Workbench,模型即服务

此外,为了加快全球企业定制化采用生成式 AI,老黄宣布英伟达即将推出 Nvidia AI Workbench。

尽管很多预训练模型都是开源的,但使其定制化服务自身业务仍然具有挑战性。AI Workbench 减轻了企业 AI 项目入门的复杂程度,将所有必要的企业级模型、框架、软件开发套件和库整合到统一的 workspace 之中。

只需要在本地系统上运行的简化界面进行点击,AI Workbench 就能让开发者使用自定义数据微调 Hugging Face、GitHub 和 NGC 等流行存储库中的模型,然后将其扩展到数据中心、公有云或 Nvidia DGX 云。

黄仁勋还宣布英伟达将与 Hugging Face 合作,开发人员将能够访问 Hugging Face 平台中的 NVIDIA DGX Cloud AI 超级计算来训练和调整 AI 模型。这将使数百万构建大型语言模型和其他高级 AI 应用程序的开发人员能够轻松实现生成式 AI 超级计算。

「这将是一项全新的服务,将世界上最大的人工智能社区与世界上最好的训练和基础设施连接起来,」黄仁勋表示。

全新的 RTX 工作站和 Omniverse

老黄还宣布,英伟达与 BOXX、戴尔科技、惠普和联想等工作站制造商合作,打造了一系列全新的高性能 RTX 工作站。

最新发布的 RTX 工作站提供多达四个英伟达 RTX 6000 Ada GPU,每个 GPU 配备 48GB 内存。单个桌面工作站可提供高达 5828 TFLOPS 的性能和 192GB 的 GPU 内存。

根据用户需求,这些系统可配置 Nvidia AI Enterprise 或 Omniverse Enterprise 软件,为各种要求苛刻的生成式 AI 和图形密集型工作负载提供必要的动力。这些新发布预计将于秋季推出。

新发布的 Nvidia AI Enterprise 4.0 引入了 Nvidia NeMo,这是一个用于构建和定制生成式 AI 基础模型的端到端框架。它还包括用于数据科学的 Nvidia Rapids 库,并为常见企业 AI 用例(例如推荐器、虚拟助理和网络安全解决方案)提供框架、预训练模型和工具。

工业数字化平台 Omniverse Enterprise 是 Nvidia 生态系统的另一个组成部分,让团队能够开发可互操作的 3D 工作流程和 OpenUSD 应用程序。Omniverse 利用其 OpenUSD 原生平台,使全球分布的团队能够协作处理来自数百个 3D 应用程序的完整设计保真度数据集。

此次英伟达主要升级了 Omniverse Kit(用于开发原生 OpenUSD 应用和扩展程序的引擎),以及 NVIDIA Omniverse Audio2Face 基础应用和空间计算功能。开发者可以轻松地利用英伟达提供的 600 多个核心 Omniverse 扩展程序来构建自定义应用。

作为发布的一部分,英伟达还推出了三款全新的桌面工作站 Ada Generation GPU:Nvidia RTX 5000、RTX 4500 和 RTX 4000。

全新 NVIDIA RTX 5000、RTX 4500 和 RTX 4000 桌面 GPU 采用最新的 NVIDIA Ada Lovelace 架构技术。其中包括增强的 NVIDIA CUDA 核心(用于增强单精度浮点吞吐量)、第三代 RT 核心(用于改进光线追踪功能)以及第四代 Tensor 核心(用于更快的 AI 训练性能)。

Nvidia RTX 5000 Ada 一代 GPU。

这几款 GPU 还支持 DLSS 3,为实时图形提供更高水平的真实感和交互性,以及更大的 GPU 内存选项,用于大型 3D 模型、渲染图像、模拟和 AI 数据集的无差错计算。此外,它们还提供扩展现实功能,以满足创建高性能 AR、VR 和混合现实内容的需求。

因为配备了第三代 RT Core,这几款 GPU 的吞吐量高达上一代的 2 倍,使用户能够实时处理更大、保真度更高的图像,将应用于艺术创作和设计生产。

RTX 5000 GPU 已经上市,并由 HP 和分销合作伙伴发货,而 RTX 4500 和 RTX 4000 GPU 将于秋季从 BOXX、Dell Technologies、HP、Lenovo 及其各自的分销合作伙伴上市。

Nvidia OVX 服务器

英伟达还推出了配备 Nvidia L40S GPU 的 Nvidia OVX 服务器,用于生成式 AI 和数字化时代的开发和内容创作。

每台 Nvidia OVX 服务器将支持多达 8 个 Nvidia L40S GPU,每个 GPU 配备 48GB 内存。L40S GPU 由 Nvidia Ada Lovelace GPU 架构提供支持,拥有第四代张量核心和 FP8 Transformer 引擎,可实现超过 1.45 petaflops 的张量处理能力。

Nvidia L40S GPU。

在具有数十亿参数和多种数据模式的生成式 AI 工作负载领域,与 Nvidia A100 Tensor Core GPU 相比,L40S GPU 的生成式 AI 推理性能提高了 1.2 倍,训练性能提高了 1.7 倍。这将更好地满足 AI 训练和推理、3D 设计和可视化、视频处理和工业数字化等计算密集型应用的需求,加速多个行业的工作流程和服务。






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA技术
    +关注

    关注

    0

    文章

    17

    浏览量

    6215
  • 晶体管
    +关注

    关注

    77

    文章

    9059

    浏览量

    135246
  • 英伟达
    +关注

    关注

    22

    文章

    3332

    浏览量

    87809
  • GPU芯片
    +关注

    关注

    1

    文章

    292

    浏览量

    5692
  • NGC
    NGC
    +关注

    关注

    0

    文章

    8

    浏览量

    3780

原文标题:超级芯片GH200发布,AI算力是H100两倍

文章出处:【微信号:AI_Architect,微信公众号:智能计算芯世界】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    英伟达发布新一代H200,搭载HBM3e,推理速度是H100两倍

    电子发烧友网报道(文/李弯弯)日前,英伟达正式宣布,在目前最强AI芯片H100的基础上进行一次大升级,发布新一代H200
    的头像 发表于 11-15 01:15 2393次阅读
    英伟达<b class='flag-5'>发布</b>新一代H<b class='flag-5'>200</b>,搭载HBM3e,推理速度是<b class='flag-5'>H100</b><b class='flag-5'>两倍</b>!

    英伟达GH200、特斯拉Dojo超级算力集群,性能爆棚!算力之争加剧!

    等全球最复杂的生成式 AI 工作负载而构建。   日前,这款GH200 Grace Hopper超级芯片首次亮相MLPerf行业基准测试,在此次测试中,具有更高的内存带宽和更大的内存容
    的头像 发表于 09-14 09:10 2464次阅读
    英伟达<b class='flag-5'>GH200</b>、特斯拉Dojo<b class='flag-5'>超级</b>算力集群,性能爆棚!算力之争加剧!

    gh200和a100的区别

    gh200和a100的区别 GH200和A100是两款不同的移动通讯设备,GH200是一款手机,而A10
    的头像 发表于 08-17 10:52 712次阅读

    gh200h100哪个更好

    gh200h100哪个更好 在冷静分析的基础上,我认为GH200H100各有优缺点,没有绝对的好与不好之分。以下是我对GH200
    的头像 发表于 08-17 10:51 698次阅读

    gh200相比gh100的区别

    gh200相比gh100的区别 GH200GH100是两种不同种类的石油钻探钻头。它们在许多方面都有所不同,包括形状、尺寸、重量、确切的钻头构造和优缺点等。 形状和尺寸:
    的头像 发表于 08-17 10:51 433次阅读

    gh200h100性能对比

    gh200h100性能对比 随着计算机的普及和技术的不断提高,CPU发热问题越来越重要。因此,散热器作为一种重要的CPU散热装置,起到了非常重要的作用。其中,GH200H100散热
    的头像 发表于 08-17 10:51 1011次阅读

    gh200和a100的区别

    gh200和a100的区别 GH200和A100是两款不同的移动通讯设备,GH200是一款手机,而A10
    的头像 发表于 08-16 17:34 593次阅读

    gh200和4090对比

    gh200和4090对比   GH200和4090 说到游戏耳机,市场上有很多选择。其中,GH200和4090是两个很好的选择,已经在游戏玩家中流行起来。这两款耳机都提供了令人惊叹的功能,旨在增强
    的头像 发表于 08-16 17:34 564次阅读

    gh200h100哪个更好

    gh200h100哪个更好 在冷静分析的基础上,我认为GH200H100各有优缺点,没有绝对的好与不好之分。以下是我对GH200
    的头像 发表于 08-16 17:33 706次阅读

    gh200相比gh100的区别

    gh200相比gh100的区别 GH200GH100是两种不同种类的石油钻探钻头。它们在许多方面都有所不同,包括形状、尺寸、重量、确切的钻头构造和优缺点等。 形状和尺寸:
    的头像 发表于 08-16 17:33 485次阅读

    gh200h100性能对比

    gh200h100性能对比 随着计算机的普及和技术的不断提高,CPU发热问题越来越重要。因此,散热器作为一种重要的CPU散热装置,起到了非常重要的作用。其中,GH200H100散热
    的头像 发表于 08-16 17:33 618次阅读

    生成式AI新增多重亮点,英伟达推出超级芯片GH200 Grace

    GH200 Grace芯片搭载全球首款HBM3e处理器,可通过英伟达的NVLink技术连接其他GH200芯片,计划明年二季度投产。
    发表于 08-09 17:19 460次阅读
    生成式<b class='flag-5'>AI</b>新增多重亮点,英伟达推出<b class='flag-5'>超级</b><b class='flag-5'>芯片</b><b class='flag-5'>GH200</b> Grace

    黄仁勋有望公布DGX-GH200 AI超级计算机更多消息

    英伟达于2023年5月发布的dgx-gh200 ai超级计算机使用nvlink技术,拥有256个gh200
    的头像 发表于 08-08 11:37 454次阅读

    NVIDIA推出DGX GH200 AI超级计算机

    ——2023年5月29日—— NVIDIA今天宣布推出一款新型大内存AI超级计算机——由NVIDIA® GH200 Grace Hopper超级
    发表于 05-30 14:15 450次阅读
    NVIDIA推出DGX <b class='flag-5'>GH200</b> <b class='flag-5'>AI</b><b class='flag-5'>超级</b>计算机

    COMPUTEX2023 | NVIDIA 推出 DGX GH200 AI 超级计算机

    —2023 年 5 月 29 日— NVIDIA 今天宣布推出一款新型大内存 AI 超级计算机——由 NVIDIA GH200 Grace Hopper 超级
    的头像 发表于 05-30 01:40 1518次阅读
    COMPUTEX2023 | NVIDIA 推出 DGX <b class='flag-5'>GH200</b> <b class='flag-5'>AI</b> <b class='flag-5'>超级</b>计算机