0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

赢麻了!英伟达发布史上最强“巨型GPU”,黄仁勋:CPU扩张时代结束了

Hobby观察 来源:电子发烧友网 作者:梁浩斌 2023-05-31 09:08 次阅读

电子发烧友网报道(文/梁浩斌)今年英伟达可谓风生水起,过去五个月市值增长近三倍,自上周四公布今年一季度财报以来,截至5月30日股价也飙涨27%,市值9632亿美元,有望进入万亿美元俱乐部。作为在这一轮生成式AI浪潮中的核心算力硬件供应商,已经“赢麻了”的英伟达并未有因此停下脚步,而是趁热打铁继续推出惊人的算力硬件。

wKgaomR2nkKAC4AGAAYE7vCm_W4996.jpg
图源:英伟达中国


英伟达CEO黄仁勋在周一的台北Computex展上带来了2小时的激情演讲,发布上推出了GH200 Grace Hopper超级芯片,以及将多达256块GH200超级芯片整合到一起的DGX GH200“巨型GPU”,同时还展示了一系列AI相关的应用和产品

黄仁勋表示:CPU扩张的时代已经结束了。

新计算时代:GPU买得越多,省得越多!

在这场2小时的演讲开场,黄仁勋就提出了一个“暴论”,他表示“CPU扩张的时代已经结束了”。

加速计算和AI重塑计算机行业的当下,从需要持续提升算力的数据中心可以看到,CPU的需求越来越少,而GPU的需求则不断增长。黄仁勋认为,如今的计算机是指数据中心、是指云服务,与此同时可以为未来“计算机”编写程序的程序员,如今将面临行业的变革。

“我们已经到达生成式AI的爆点,从此世界的每一个角落,都会有计算需求。”在这样的计算需求背景下,计算的性价比也非常重要。黄仁勋举了两个例子证明GPU比CPU在AI计算时代更有优势:

在1000万美元的成本下,可以用于建设一个有960颗CPU的数据中心,其中可以处理1X LLM(大语言模型)的数据量,同时需要消耗11GWh的能耗;同样成本下,如果用于建设一个有48颗GPU的数据中心,不仅可以处理的LLM数据量是同成本CPU数据中心44倍,在功耗方面还能大幅降低至3.2GWh。

所以,黄仁勋不禁喊出了“The more you buy,The more you save”的口号,买GPU越多,你省下的钱也就越多。

强到离谱的GH200和DGX GH200

这次发布会上最重磅的产品无疑是GH200 Grace Hopper超级芯片,在发布会上,黄仁勋也公布了该款芯片的细节。GH200是基于NVIDIA NVLink-C2C互连技术,将Arm架构的NVIDIA Grace CPU和Hopper架构的 GPU实现互联整合,最终实现高达900GB/s的总带宽,这相比传统的PCIe 5.0通道带宽要高出7倍,可以满足需求最严苛的AI 和HPC应用。

去年三月,英伟达在GTC大会上发布了基于Arm架构的Grace CPU,这款CPU专为计算加速平台设计,拥有多达72个Armv9 CPU核心,缓存容量高达198MB,支持LPDDR5X ECC内存,带宽高达1TB/s,并支持NVLink-C2C和PCIe 5.0两种互连协议。

同样是在去年的GTC大会上,英伟达发布了基于Hopper架构的全新H100 GPU,截至目前,H100依然是英伟达用于AI加速、HPC和数据分析等处理的最强GPU。

H100采用台积电4nm定制工艺,拥有多达800亿个晶体管,集成了18432个CUDA核心、576个Tenor核心、60MB二级缓存,并支持6144-bit位宽的HBM3/2e高带宽内存。

而GH200 Grace Hopper,就是将72核的Grace CPU和当今世上最强的GPU H100,加上96GB的HBM3显存、512GB的LPDDR5X内存封装在一起,集成到一片“超级芯片”上。

wKgZomR2nk6ABzyrAAnYC8xJtq4959.jpg
图源:英伟达中国


黄仁勋将GH200 Grace Hopper形容为“这是一台计算机,而不是芯片”。同时他透露,GH200 Grace Hopper目前已经全面投产。

如果GH200 Grace Hopper还不能满足你的需求,英伟达还提供了一个由256个GH200 Grace Hopper组成的超级计算机系统——DGX GH200,而上一代的系统在不影响性能的前提下只能通过NVLink将8个GPU整合成一个系统。

那么DGX GH200是如何做到将256个GH200 Grace Hopper连接成一个系统?GH200 Grace Hopper和NVLink4.0、NVLink Switch System(交换机系统)是组建DGX GH200的重点。NVLink交换机系统形成了一个两级、无阻塞、胖树NVLink结构,结合新的NVLink 4.0和第三代NV SWitch,英伟达可以用一个前所未有的高带宽水平来构建大规模NVLink交换机系统。通过计算节点外的交换机模块,将最高256个计算节点,也就是GPU连接为一个整体。

最终这个拥有256个GH200 Grace Hopper超级芯片的DGX GH200超级计算机能够提供高达能够提供1 Exaflop(百亿亿次)级别的性能、并具有144TB的共享内存,内容容量几乎是上一代的500倍。

黄仁勋称DGX GH200是“巨型GPU”,并预计DGX GH200将在今年年底开始供货并投入使用,Google Cloud、Meta与微软将会是首批能够使用DGX GH200的公司

除此之外,英伟达还在使用DGX GH200打造一个更大规模的超级计算机,这款被称为NVIDIA Helios的超级计算机将配备4个DGX GH200,通过英伟达的Quantum-2 InfiniBand交换机进行互连。那么NVIDIA Helios将成为一个由1024个GH200 Grace Hopper超级芯片构成的巨型AI计算系统,这套系统也将会在今年年底启用。

AI应用遍地开花

发布会上,黄仁勋还宣布推出一种名为Avatar Cloud Engine(ACE)的AI模型代工服务,这种模型主要应用在游戏领域,可以为游戏开发人员提供训练模型,通过简单的操作定制想要的游戏AI模型。

wKgaomR2nluATyrWAAFrbWnAHyU904.jpg
图源:英伟达中国


在演示中,游戏玩家可以用自己的声音与NPC角色进行对话,由生成式AI加持的NPC,可以根据玩家的语音实时生成不同的回答,增强游戏的沉浸体验。

在内容方面,英伟达目前正在与全球最大的广告集团WPP合作,开发一款利用NVIDIA Omniverse和AI的内容引擎,以更高效地帮助创意团队制作高质量商业内容,并针对客户的品牌产出不同的针对性内容,这或许是AI颠覆广告行业的一个尝试。

除此之外,在工业领域,英伟达也正在用AI来帮助工业生产提高效率,比如用于模拟和测试机器人的英伟达Isaac Sim;用于自动光学检测的英伟达Metropolis视觉AI框架;用于3D设计协作的英伟达Omniverse等。

黄仁勋表示,目前富士康工业互联网、宜鼎国际、和硕、广达、纬创等制造业巨头都在使用英伟达的参考工作流程,比如构建数字孪生、模拟协作机器人、检测自动化等。

小结:

今年AIGC发展速度超出所有人想象,近期甚至有调研机构在一个半月之内将今年AI服务器出货量增长预期从15.4%提升至38.4%。毫无疑问,黄仁勋和他的英伟达是在这新一轮AI革命中最大的赢家。

截至5月30日18时,英伟达盘前涨近4%,市值突破万亿美元,英伟达成为全球第一家市值破万亿美元的芯片公司。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    9369

    浏览量

    204778
  • 英伟达
    +关注

    关注

    21

    文章

    2526

    浏览量

    86481
收藏 人收藏

    评论

    相关推荐

    英伟发布新一代 GPU 架构图灵和 GPU 系列 Quadro RTX

    英伟 CEO 正式发布新一代 GPU 架构 Turing(图灵),以及一系列基于图灵架构的 GPU,包括全球首批支持即时光线追踪
    发表于 08-15 10:59

    英伟GPU惨遭专业矿机碾压,宣布砍掉加密货币业务!

    英伟CEO也做出类似表态,他表示,随着数字化加密货币的价格一路走低,英伟专用
    发表于 08-24 10:11

    全新的RTX3090和RTX3080,看看怎么说?

    还表示今年秋季将会有360Hz的显示器产品上市。正式发布新的RTX架构,第二代RTX核心——安培,基于英伟定制的三星8nm工艺。新的RTX架构在RTX游戏中可以展现出最低
    发表于 09-02 17:38

    英伟DPU的过“芯”之处

    GPU技术大会,从那里听到:数据中心已成为全新的计算单元。之所以有这样的底气,就在于这次发布会上推出了一款全新处理器DPU,以及围绕该处理器的软件生态架构DOCA。据英伟的介绍,DPU可以
    发表于 03-29 14:42

    英伟CEO发布十年技术成果:全球最大GPU,超算级逆天算力

    说两件大事,一是发布迄今最大的GPU,二是自动驾驶暂停研发。
    的头像 发表于 03-30 09:47 5367次阅读

    英伟CEO发布史上最强GPU 世界首个实时光线追踪新一代图灵架构

    英伟CEO在SIGGRAPH 2018上大秀肌肉,推出世界首个实时光线追踪GPU,基于图灵架构,这是自2006年以来GPU实现的最最重大的飞跃,每秒处理高达10GB Rays,这将彻底改变整个计算机图形处理界的工作流程。
    的头像 发表于 08-14 15:32 4295次阅读

    主旨演讲:计算的未来离不开英伟

    总结,深度学习一直是GPU加速的,机器学习是在没有加速能力的CPU环境中发展起来的。更大的数据量和摩尔定律的终结将促使业界创建一个开源的、CUDA加速的堆栈,而英伟全新的机器学习加速开源库RAPIDS,如果不能成为这个堆栈,也必将成为这个堆栈的重要基础。
    的头像 发表于 11-22 09:44 2407次阅读

    Nvidia GTC2019:没有新架构,但打造一个巨大的生态圈

    英伟 GTC(GPU Technology Conference)大会正式开幕,英伟创始人兼 CEO 做了重磅演讲。
    的头像 发表于 03-22 14:42 3593次阅读

    英伟创造全新游戏平台游戏本,中国成增长最快市场

    英伟首席执行官在2020年第三季度财报电话会议上对投资者发表演讲,在笔记本方面,他提到RTX和Max-Q的结合创造一个全新的游戏平台——游戏本,中国成为该品类增长最快的市场。
    的头像 发表于 11-18 15:25 2422次阅读

    :下一代7nm GPU仍由台积电代,三星占小比例

    英伟CEO带来花费4年、耗资数十亿美元打造的重磅新产品:自动驾驶和机器人芯片Orin,同时也为台积电和三星的代工订单之争也终于有答案。表示下一代7n
    的头像 发表于 12-23 16:02 2500次阅读

    :最近英伟还将加速计算Cuda带给Arm

    英伟创始人、CEO对于收购Arm传闻回应称,“英伟迄今为止与Arm有很多合作,但尚未提出收购计划。”
    的头像 发表于 09-14 11:12 1712次阅读

    :ARM中国将是英伟的一部分

    英伟收购ARM的线上媒体答疑会,而英伟CEO与ARM CEO Simon Sagars(西蒙赛格尔
    的头像 发表于 09-17 17:20 1700次阅读

    英伟:不要低估中国企业的追赶能力

    英伟创始人兼ceo30日在台北就美国限制对华半导体出口问题再次警告说:“不要低估中国企业的追击能力。”当地的gpu初创企业正在大举出现。美国东部时间30日,英伟股价再次大涨,盘中市值暂时突破1万亿美元,创造历史。
    的头像 发表于 06-01 10:57 390次阅读

    英伟CEO或将于6月6日到访上海

    英伟创始人兼CEO或将于6月份来华,这将是他多年来首次访华。据知情人士透露,的行程安排还没有最终确定,他可能会访问腾讯、字节跳动、理想汽车、比亚迪汽车、以及小米等中国公司。
    的头像 发表于 06-02 16:51 2852次阅读

    英伟首席执行官会见印度总理,讨论该国在 AI 领域的潜力

    印度在人工智能领域提供的丰富潜力。”   这是莫迪和的第二次会面,强调了英伟在该国快速发展的科技行业中的作用。随后,会见了来自印度科学院、印度理工学院各校区等全球科技强国的数十名研究人员
    的头像 发表于 09-06 08:40 167次阅读