0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大家都在争相超过A100,无人对标的Grace Hopper性能几何?

E4Life 来源:电子发烧友网 作者:周凯扬 2023-09-06 01:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/周凯扬)作为英伟达CPUGPU技术开发上的集大成之作,Grace Hopper很大程度上象征着复杂计算领军产品。尽管英伟达竭尽所能地去堆这一“超级芯片”的性能,但英伟达还是选择将Grace Hopper(GH200)描述成了世界上最万能的计算平台,这也得益于它同时在AI计算和HPC计算领域展现的可怕性能。

AI计算性能

相信绝大多数人已经从市场疯抢A100、H100的现状,对Hopper GPU(H100)的性能有了大致的了解,但Grace Hopper作为一个异构计算平台,在与传统的x86 CPU与H100对比上,也有着不小的性能差距。

首要区别自然就是连接Grace CPU和Hopper GPU的NVLink-C2C,这一高带宽低延迟的互联技术可谓是目前唯一能发挥H100近乎全部实力的方案。支持最高144TB内存的同时,提供900GB/s的带宽。

英伟达官方也对部分AI计算负载进行了测试,在终端应用上对比x86+Hopper与Grace Hopper的一体化方案有何异同。其性能差距可以说是巨大的,就拿最常见的大语言模型推理来说,GH200可以做到x86平台的4.5倍性能表现,而DLRM(深度学习推荐模型)训练与图神经网络(GNN)训练的性能也可以分别达到3.5倍和1.9倍。

其实这里的差异还是体现在互联方案的带宽上,例如x86+Hopper的方案还是在使用PCIe方案,该方案在batch size较小时性能落后还不算明显,一旦到了更大的batch size,PCIe的带宽就成了瓶颈,而不断以高带宽输送数据给H100的NVLink-C2C则可以实现比PCIe高出数倍的性能。

HPC计算性能

Grace Hopper的另一大应用领域自然就是HPC了。HPC主要集中在一些科学、工程的复杂计算上,比如天气预测、生命科学、流体力学等。然而与此同时,不少商业相关的HPC计算也在进一步推动HPC的发展,甚至更早用上最新的芯片技术,比如油藏模拟等。

著名油藏模拟软件ECHELON的开发商Stone Ridge,在最近获得了早期访问权,对英伟达的H100-PCIe、H100-NVL和Grace-Hopper来了场性能测试。早在Volta和Ampere架构时,Stone Ridge就对不同架构的GPU进行了测试,而如今的H100相较这些旧GPU已经在CUDA核心、内存容量和内存带宽上有了数倍的提升。

这些还只是表面上的变化,英伟达还引入了诸多架构改进,提高了ML和HPC应用程序的性能。而Grace Hopper相较传统的x86+GPU方案就更具优势了,首先Grace本身就是一个强大的CPU,每个内核都有四个128位适量单元,超高的内存带宽以及超大的L2+L3缓存。其次,NVLink的存在大大减少了CPU和GPU之间的通信时间。

wKgaomT2_uKAdLA8AAFQ5Yki0Qg725.png
不同架构不同版本的英伟达GPU在ECHELON模型上的性能对比 / Stone Ridge


Stone Ridge选择了不同细胞规模的模型,从83000个细胞到670万个细胞,其中Grace Hopper都展现出了不俗的性能,最高可达Volta架构的V100的5.7倍。值得一提的是,由于CPU采用了新的Arm架构,所以ECHELON必须重新编译才能在系统上运行,不过对于ECHELON来说,重新编译并不要花太多力气,他们在不修改代码的情况就成功重编译在GH200上正常运行。如果对代码进行进一步优化的话,还有机会获得更高的性能表现。如此高的性能提升,意味着油藏勘探模拟的时间可以被大幅缩短,从而加快油藏评估的速度。

结语

可以说无论是A100还是H100,都只是英伟达在AI与HPC战线扩大战果的第一步棋,明年Q2交付到各大系统中的GH200才是最大的杀手锏,也很可能会成为更抢手的数据中心与超算中心硬件产品。这也恰好证明了英伟达给它的定位,世界上最万能的计算平台。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    TE Connectivity 2.0mm信号GRACE INERTIA连接器技术解析

    TE Connectivity (TE) 2.0mm信号GRACE INERTIA连接器采用紧凑、节省空间的设计,额定电压为50V ~AC~ ,设有2至10位。这些连接器具有惯性锁定机制(有助于防止
    的头像 发表于 11-09 15:12 488次阅读

    看点:OpenAI全球企业客户数量超过100万 ASML:半导体产业开放合作是主流

    大家带来一些业界资讯: OpenAI全球企业客户数量超过100万 据外媒报道,OpenAI在当地时间周三宣布,全球已经有100万家企业正在直接使用该公司的服务;其中包括所有主动为商业
    的头像 发表于 11-06 16:17 566次阅读

    ‌TE Connectivity GRACE INERTIA多负载连接器技术解析与应用实践

    TE Connectivity GRACE INERTIA多负载连接器为需要多功能线对板解决方案的印刷电路板(PCB) 制造商提供了设计灵活性。 这些连接器具有14.1mm的低插配高度,便于 PCB
    的头像 发表于 11-02 16:55 1150次阅读

    TE Connectivity GRACE INERTIA连接器技术解析:微型化SMT解决方案的设计实践

    的设计、耐用性和高性能。TE 1.25mm和1.5mm信号型GRACE INERTIA连接器适合用于电源和信号应用,如电器、运输和照明。
    的头像 发表于 11-02 16:23 483次阅读
    TE Connectivity <b class='flag-5'>GRACE</b> INERTIA连接器技术解析:微型化SMT解决方案的设计实践

    新手小白必看!关于A100云主机租用,你想知道的一切都在这!

    “我想租一台A100云主机来跑我的模型,但完全不知道从何下手。”——这是我们听到最多的来自AI新手的声音。A100,这个听起来就“高大上”的名词,背后其实是一套清晰、可操作的流程。今天,我们就用
    的头像 发表于 10-31 19:24 1060次阅读
    新手小白必看!关于<b class='flag-5'>A100</b>云主机租用,你想知道的一切<b class='flag-5'>都在</b>这!

    DGX A100服务器出故障?选对维修商,帮你省心又省钱!

    企业级GPU服务器已成为企业核心生产力的关键支撑。然而,这些高性能设备一旦出现故障,将对企业的业务运营造成重大影响。尤其是高端的DGXA100服务器,其复杂的技术架构和高昂的维修成本,让许多企业在
    的头像 发表于 10-24 19:05 164次阅读
    DGX <b class='flag-5'>A100</b>服务器出故障?选对维修商,帮你省心又省钱!

    大家都在用什么AI软件?有没有好用的免费的AI软件推荐一下?

    大家都在用什么AI软件?有没有好用的免费的AI软件推荐一下?直接发个安装包,谢谢。比如deepseek、Chatgpt、豆包、阿里AI、百度AI、腾讯AI,哪个能用、好用?没找到安装包,都是在线搜索?想要Windows版本和IOS版本或者安卓版本
    发表于 07-09 18:30

    NVIDIA技术赋能欧洲最快超级计算机JUPITER

    NVIDIA 宣布,搭载 NVIDIA Grace Hopper 平台的 JUPITER 超级计算机成为欧洲最快超级计算机,其运行 HPC 和 AI 工作负载的速度是第二名的两倍以上。
    的头像 发表于 06-12 15:33 1041次阅读

    NVIDIA Grace CPU C1获得广泛支持

    NVIDIA 在本周 COMPUTEX 上重点展示了其全新的 Grace CPU C1,并获得多家主要原始设计制造商合作伙伴的大力支持。
    的头像 发表于 05-22 10:01 616次阅读

    SL9486A DCDC100V降压恒压芯片 优势替代兼容MP9486A 国产替代

    SL9486A100V耐压降压恒压电源芯片,全面升级替代MP9486A的最佳方案 在高压电源管理领域,SL9486A凭借其卓越的性能与兼容
    发表于 04-12 10:59

    精密几何测量技术在电子芯片制造中的重要性

    精密几何测量技术在电子芯片制造中具有极其重要的地位,主要体现在以下几个方面:1、确保芯片性能-晶体管性能优化:在芯片中,晶体管的尺寸和结构对其性能至关重要。通过精密
    的头像 发表于 02-28 14:23 774次阅读
    精密<b class='flag-5'>几何</b>测量技术在电子芯片制造中的重要性

    英伟达A100和H100比较

    英伟达A100和H100都是针对高性能计算和人工智能任务设计的GPU,但在性能和特性上存在显著差异。以下是对这两款GPU的比较: 1. 架构与核心规格:
    的头像 发表于 02-10 17:05 1.1w次阅读
    英伟达<b class='flag-5'>A100</b>和H<b class='flag-5'>100</b>比较

    植保无人机电池性能测试方法

    随着农业现代化的不断推进,植保无人机作为一种高效、精准的农业植保工具,正逐渐受到广大农户和农业企业的青睐。植保无人机的性能在很大程度上取决于其搭载的电池系统,因此,对植保无人机电池进行
    的头像 发表于 01-08 09:26 1566次阅读
    植保<b class='flag-5'>无人</b>机电池<b class='flag-5'>性能</b>测试方法

    小轴距高性能!时代星光发布蜂鹰F1超高性价比单兵无人

    随着无人机产业的发展,无人机在各个行业、各个领域的应用都在不断深化。近日,时代星光科技发布了全新自研的高性能单兵无人机蜂鹰F1,以轻巧便携、
    的头像 发表于 12-24 15:01 1304次阅读
    小轴距高<b class='flag-5'>性能</b>!时代星光发布蜂鹰F1超高性价比单兵<b class='flag-5'>无人</b>机

    商超便利店配送“新宠”,九识无人车为100余家门店降本!

    被九识无人车而改变,负责人杨经理的话语中透露出的对九识无人车的由衷认可。目前,九识无人车的运营服务已经覆盖了近十个省份,超过100家商超便利
    的头像 发表于 12-17 14:21 1126次阅读
    商超便利店配送“新宠”,九识<b class='flag-5'>无人</b>车为<b class='flag-5'>100</b>余家门店降本!