0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于NVIDIA H100 GPU的问题解答

NVIDIA英伟达 来源:NVIDIA英伟达 作者:NVIDIA英伟达 2022-07-18 10:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA 带来知乎精彩问答甄选系列,将为您精选知乎上有关 NVIDIA 产品的精彩问答。

本期为问答甄选第二期 ——探索 H100 的奥秘!

NVIDIA H100 是全球 AI 基础设施的引擎,

让企业能够利用其实现自身 AI 业务的加速。

今年的 GTC22 上 NVIDIA 发布其首款基于 Hopper 架构的 GPU —NVIDIA H100。

该款 GPU 集成了 800 亿个晶体管。H100 是全球范围内最大的性能出众的加速器,拥有革命性的 Transformer 引擎和高度可扩展的 NVIDIA NVLink 互连技术等突破性功能,可推动庞大的 AI 语言模型、深度推荐系统、基因组学和复杂数字孪生的发展。

以下三个知乎甄选问答将为您了解NVIDIA H100带来更加精彩的解答!

Q:NVIDIA GTC 2022 大会官宣,Hopper 计算架构要来了,该架构有哪些值得期待的亮点?

A:NVIDIA 宣布推出采用 NVIDIA Hopper架构的新一代加速计算平台。与上一代产品相比,该平台实现了数量级的性能飞跃。这一全新架构以美国计算机领域的先驱科学家 Grace Hopper 的名字命名,将取代两年前推出的 NVIDIA Ampere 架构。

使用 Transformer 引擎训练 AI 模型:

随着一些模型(例如大型语言模型)达到数万亿参数,AI、高性能计算和数据分析变得日益复杂。在当今计算平台上,大型 AI 模型可能需要数月来完成训练。而这样的速度对于企业来说太慢了。

NVIDIA Hopper 架构从头开始构建,凭借强大的算力和快速的内存来加速这些新一代 AI 工作负载,从而处理日益增长的网络和数据集。Transformer 引擎是全新 Hopper 架构的一部分,将显著提升 AI 性能和功能,并助力在几天或几小时内训练大型模型。

Transformer 引擎采用 16 位浮点精度和新增的 8 位浮点数据格式,并整合先进的软件算法,将进一步提升 AI 性能和功能。

采用全新 DPX 指令将动态编程速度提升 40 倍:

NVIDIA Hopper GPU 架构利用全新 DPX 指令,将动态编程速度提高多达 40 倍。动态编程是一种应用于基因组学、量子计算、路线优化等领域算法中,用以解决问题的技术。

Q:基于 Hopper 架构的 NVIDIA H100 GPU 有什么突破性创新?

A:H100 GPU 为加速大规模 AI 和 HPC 设定了新的标准,带来了六项突破性创新:

先进的芯片—— H100 由 800 亿个晶体管构建而成,这些晶体管采用了专为 NVIDIA 加速计算需求设计的尖端的 TSMC 4N 工艺,因而能够显著提升 AI、HPC、显存带宽、互连和通信的速度,并能够实现近 5TB/s 的外部互联带宽。H100 是首款支持 PCIe 5.0 的 GPU,也是首款采用 HBM3 的 GPU,可实现 3TB/s 的显存带宽。20个 H100 GPU 便可承载相当于全球互联网的流量,使其能够帮助客户推出先进的推荐系统以及实时运行数据推理的大型语言模型。

新的 Transformer 引擎—— Transformer 现在已成为自然语言处理的标准模型方案,也是深度学习模型领域最重要的模型之一。H100 加速器的 Transformer 引擎旨在不影响精度的情况下,将这些网络的速度提升至上一代的六倍。

第二代安全多实例 GPU—— MIG 技术支持将单个 GPU 分为七个更小且完全独立的实例,以处理不同类型的作业。与上一代产品相比,在云环境中 Hopper 架构通过为每个 GPU 实例提供安全的多租户配置,将 MIG 的部分能力扩展了 7 倍。

机密计算—— H100 是全球首款具有机密计算功能的加速器,可保护 AI 模型和正在处理的客户数据。客户还可以将机密计算应用于医疗健康和金融服务等隐私敏感型行业的联邦学习,也可以应用于共享云基础设施。

第 4 代 NVIDIA NVLink—— 为加速大型 AI 模型,NVLink 结合全新的外接 NVLink Switch,可将 NVLink 扩展为服务器间的互联网络,最多可以连接多达 256 个 H100 GPU,相较于上一代采用 NVIDIA HDR Quantum InfiniBand网络,带宽高出9倍。

DPX 指令—— 新的 DPX 指令可加速动态规划,适用于包括路径优化和基因组学在内的一系列算法,与 CPU 和上一代 GPU 相比,其速度提升分别可达 40 倍和 7 倍。Floyd-Warshall 算法与 Smith-Waterman 算法也在其加速之列,前者可以在动态仓库环境中为自主机器人车队寻找最优线路,而后者可用于 DNA 和蛋白质分类与折叠的序列比对。

H100 的多项技术创新相结合,进一步扩大了 NVIDIA在 AI 推理和训练的领导地位,利用大规模 AI 模型实现了实时沉浸式应用。H100 将支持聊天机器人使用功能超强大的monolithic Transformer 语言模型 Megatron 530B,吞吐量比上一代产品高出 30 倍,同时满足实时对话式 AI 所需的次秒级延迟。利用 H100,研究人员和开发者能够训练庞大的模型,如包含 3950 亿个参数的混合专家模型,训练速度加速高达9倍,将训练时间从几周缩短到几天。

Q:NVIDIA H100 在 AI 基础架构方面有什么作用?

A:基于 Hopper 架构的 NVIDIA H100,是“全球 AI 基础架构的新引擎”。

语音、对话、客服和推荐系统等 AI 应用正在推动数据中心设计领域的巨大变革。“AI 数据中心需要处理海量且持续的数据,以训练和完善 AI 模型,原始数据进来,经过提炼,然后智能输出——企业正在制造智能并运营大型 AI 工厂。” 这些工厂全天候密集运行,即便是质量上的小幅改进也能大幅增加客户参与和企业利润。

H100 将帮助这些工厂更快发展。这个 “庞大” 的 800 亿晶体管芯片采用了台积电的 4 纳米工艺制造而成。

“Hopper H100 是有史以来最大的一次性能飞跃——其大规模训练性能是 A100 的 9 倍,大型语言模型推理吞吐量是 A100 的 30 倍。”

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109097
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134464
  • AI
    AI
    +关注

    关注

    89

    文章

    38121

    浏览量

    296677
  • H100
    +关注

    关注

    0

    文章

    33

    浏览量

    564

原文标题:NVIDIA 知乎精彩问答甄选(二) | 探索 H100 的奥秘!

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    先收藏系列 工业相机的六问六答!

    工业相机常用问题解答
    的头像 发表于 10-22 09:26 192次阅读
    先收藏系列 工业相机的六问六答!

    关于太阳光模拟器的常见问题解答(二)

    的含义。同时,我们将解答关于光谱特性(如紫外线含量与光谱定制)、设备使用寿命及使用环境要求等实操中至关重要的问题,提供深入且实用的技术指南,助力大家更正确的选用太
    的头像 发表于 10-17 18:03 188次阅读
    <b class='flag-5'>关于</b>太阳光模拟器的常见<b class='flag-5'>问题解答</b>(二)

    关于太阳光模拟器的常见问题解答(一)

    太阳光模拟器是研究与测试中不可或缺的核心设备,其性能直接关系到数据的准确性与可靠性。为帮助大家更深入地理解其工作原理与选型要点,下文,紫创测控Luminbox梳理了关于太阳光模拟器的高频疑问以及解答
    的头像 发表于 10-15 18:04 307次阅读
    <b class='flag-5'>关于</b>太阳光模拟器的常见<b class='flag-5'>问题解答</b>(一)

    英伟达 H100 GPU 掉卡?做好这五点,让算力稳如泰山!

    H100服务器停工一天损失的算力成本可能比维修费还高。今天,我们给大家总结一套“防掉卡秘籍”,从日常管理到环境把控,手把手教你把掉卡风险压到最低。一、供电是“生命线”,这3点必须盯紧H100满载功耗
    的头像 发表于 09-05 11:03 716次阅读
    英伟达 <b class='flag-5'>H100</b> <b class='flag-5'>GPU</b> 掉卡?做好这五点,让算力稳如泰山!

    NVIDIA RTX PRO 4500 Blackwell GPU测试分析

    今天我们带来全新 NVIDIA Blackwell 架构 GPU —— NVIDIA RTX PRO 4500 Blackwell 的测试,对比上一代产品 NVIDIA RTX 450
    的头像 发表于 08-28 11:02 2876次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 Blackwell <b class='flag-5'>GPU</b>测试分析

    NVIDIA桌面GPU系列扩展新产品

    NVIDIA 桌面 GPU 系列扩展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell
    的头像 发表于 08-18 11:50 998次阅读

    搞定英伟达 H100 ECC 报错:从原理到维修,一步到位解烦忧

    最近,捷智算GPU维修室收到了不少H100服务器需要维修,故障问题集中为ECC报错。为了帮大家更好地认识和了解情况,下面就详细分享一下ECC报错系统化排查方法和维修流程。一、ECC报错
    的头像 发表于 08-14 18:05 1395次阅读
    搞定英伟达 <b class='flag-5'>H100</b> ECC 报错:从原理到维修,一步到位解烦忧

    汽车喇叭气密性检测仪常见问题解答

    在汽车生产和检测环节,汽车喇叭气密性检测仪起着至关重要的作用。以下是一些关于它的常见问题解答。(1)检测仪的精度受哪些因素影响?检测仪的精度主要受环境因素、仪器本身的稳定性以及被测喇叭的特性
    的头像 发表于 06-25 11:52 380次阅读
    汽车喇叭气密性检测仪常见<b class='flag-5'>问题解答</b>

    变频器与传动使用的常见问题解答

    变频器与传动系统作为工业自动化领域的核心设备,其稳定运行直接影响生产效率和设备寿命。以下是针对实际应用中高频问题的系统性解答,结合技术原理与现场经验,为从业者提供实用参考。 一、电机过热问题解析 某
    的头像 发表于 06-10 07:35 434次阅读
    变频器与传动使用的常见<b class='flag-5'>问题解答</b>

    GPU 维修干货 | 英伟达 GPU H100 常见故障有哪些?

    上涨,英伟达H100GPU凭借其强大的算力,成为AI训练、高性能计算领域的核心硬件。然而,随着使用场景的复杂化,H100服务器故障率也逐渐攀升,轻则影响业务进度,重
    的头像 发表于 05-05 09:03 2464次阅读
    <b class='flag-5'>GPU</b> 维修干货 | 英伟达 <b class='flag-5'>GPU</b> <b class='flag-5'>H100</b> 常见故障有哪些?

    常见问题解答:低压运算放大器

    本应用笔记解答了一些关于低压运算放大器的常见问题。
    的头像 发表于 02-21 14:10 880次阅读
    常见<b class='flag-5'>问题解答</b>:低压运算放大器

    英伟达A100H100比较

    英伟达A100H100都是针对高性能计算和人工智能任务设计的GPU,但在性能和特性上存在显著差异。以下是对这两款GPU的比较: 1. 架构与核心规格: A
    的头像 发表于 02-10 17:05 1.1w次阅读
    英伟达A<b class='flag-5'>100</b>和<b class='flag-5'>H100</b>比较

    【斯丹麦德电子】常见问题解答:干簧继电器在测试与测量中的应用

    电子发烧友网站提供《【斯丹麦德电子】常见问题解答:干簧继电器在测试与测量中的应用.pdf》资料免费下载
    发表于 01-20 10:44 0次下载

    NVIDIA和GeForce RTX GPU专为AI时代打造

    NVIDIA 和 GeForce RTX GPU 专为 AI 时代打造。
    的头像 发表于 01-06 10:45 1251次阅读

    《CST Studio Suite 2024 GPU加速计算指南》

    的各个方面,包括硬件支持、操作系统支持、许可证、GPU计算的启用、NVIDIA和AMD GPU的详细信息以及相关的使用指南和故障排除等内容。 1. 硬件支持 - NVIDIA
    发表于 12-16 14:25