0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达超级芯片的真正杀手锏,C2C互联技术

E4Life 来源:电子发烧友网 作者:周凯扬 2023-08-16 00:12 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/周凯扬)英伟达于今年发布了新一代的GH200 Grace Hopper硬件平台,预示着其发展HPC与AI的重要路线迈进了新阶段。GH200将用于应对世界上最复杂的生成式AI负载,涵盖大语言模型、推荐系统和矢量数据库等应用,且英伟达依然为GH200准备了不同的配置选项,无疑这一芯片很快就会用于各大数据中心和超算中。

NVLink,从片外互联走向片内互联

或许在多数人眼中,GH200不过是新一代Grace CPU和Hopper GPU结合的又一新产品,但这必然不是英伟达追求的“1+1=2”效果。事实上,GH200是象征着英伟达在芯片互联技术先进设计水平的集大成者。

在英伟达的第四代NVLink技术和第三代NVSwitch技术下,创造一个256个GH200连接在一起的系统也不在话下。但这样的片外互联技术并不算罕见,市面上也有不少初创公司的AI芯片可以做到类似或者更夸张的扩展性。

然而在片内芯片互联上,NVLink-C2C这一互联技术确实达到了新的高度。NVLink-C2C是英伟达专为其superchip系列打造的内存一致、高带宽、低延迟互联技术。也是其实现高达900GB/s总带宽的关键所在。900GB/s的带宽是什么概念呢?与现代AI/HPC加速器常用的16路的PCIe 5.0相比,还要快上6倍。

NVLink-C2C的优势

NVLink-C2C的第一大优势就是其内存一致性,这不仅提高了开发者的效率、芯片性能,还提高了GPU可以访问的内存量。在这一互联技术的支持下,如今CPU、GPU线程都可以并行访问CPU和GPU各自的内存,无需页迁移,所以开发者可以专心于优化算法本身,而不是内存管理。

其次就是900GB/s的带宽了,有了NVLink-C2C,应用程序可以直接用满GPU的内存,再以超高的带宽直接调用Grace CPU的内存。毕竟即便是最新的HBM3e版GH200,也只有144GB的内存,而Grace CPU可以支持到最高480GB的LPDDR5X内存。甚至在NVSwitch的支持下,可以高速访问整个系统中最高达144TB的内存。

如此一来在GPT这样的LLM模型中,可用的内存也就变多了。这对于batch size增加后,推理所需内存数增加的生成式AI来说至关重要。相比过去x86 CPU+PCIe 5.0 H100的搭配组合,GH200在更大的batch size下推理速度有着数倍的提升。

英伟达也对高带宽在HPC加速上的优势进行了解读,以ABINIT的标准执行时间为例,ABINIT是一个用于计算材料光学机械、振动等特性的模拟软件。以只用x86 CPU的执行时间作为标准,在x86 CPU与Hopper GPU的结合下,超高性能的Hopper GPU极大地缩短了执行时间。

然而在CPU与GPU之间的传输开销下,这一组合最终只能做到快上1.16倍的优势。而如果是使用Grace Hopper方案的话,在NVLink-C2C的超大带宽下,CPU与GPU之间的传输开销迅速缩减,最终实现了缩短4.25倍的执行时间。

写在最后

英伟达会走上自研CPU和Superchip的路线其实并不令人意外,为CPU与GPU之间打通一个更快的接口一直是英伟达的努力方向之一。此前由于x86的CPU设计主要还是有英特尔AMD两家厂商完成,而Grace这样的自研Arm芯片则没了设计限制,可以掺入英伟达的各种定制化开发。

NVLink-C2C也为市面上其他的AI芯片带来了更大的挑战,毕竟英伟达在性能、软件生态上已经处于领先地位,又有着如此高效的互联技术。可以预见未来其他厂商也会在芯片互联、高速接口等领域发力,否则很难与英伟达同台竞争。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    23

    文章

    4040

    浏览量

    97656
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    英伟发布 NVQLink 开放系统架构;国内首个汽车芯片标准验证平台投入使用

    英伟发布 NVQLink 开放系统架构 在华盛顿特区举行的英伟全球技术大会上,英伟
    发表于 10-29 10:33 993次阅读

    英伟下一代Rubin芯片已流片

    继8月底英伟透露Rubin架构芯片计划明年量产后,当地时间9月8日的高盛技术会议上,英伟又谈
    的头像 发表于 09-12 17:15 959次阅读

    英伟被约谈!“后门”风险阴影下,人脸识别终端为何选国产芯片

    7月31日消息,为维护中国用户网络安全、数据安全,国家互联网信息办公室已约谈英伟,要求英伟公司就对华销售的H20算力
    的头像 发表于 08-08 09:43 727次阅读
    <b class='flag-5'>英伟</b><b class='flag-5'>达</b>被约谈!“后门”风险阴影下,人脸识别终端为何选国产<b class='flag-5'>芯片</b>

    国家网信办约谈英伟

    近日,英伟算力芯片被曝出存在严重安全问题。此前,美议员呼吁要求美出口的先进芯片必须配备“追踪定位”功能。美人工智能领域专家透露,英伟
    的头像 发表于 07-31 13:56 2528次阅读
    国家网信办约谈<b class='flag-5'>英伟</b><b class='flag-5'>达</b>

    GB10超级芯片开卖!正式杀入AI PC

    电子发烧友网综合报道,近日,联发科与英伟合作开发的GB10超级芯片,作为首款个人AI超级电脑的核心组件,已经获得了主要PC品牌大厂的青睐,
    的头像 发表于 07-09 01:21 3734次阅读

    瑞之辰传感器:从“卡脖子”到“杀手锏”的技术突围

    压力传感器的国产化替代,将这一“卡脖子”难题逐步转变为自身的技术杀手锏”。破解“卡脖子”的技术密码当动力电池安全监测需要精度1%FS的微型压力传感器时,当工业自动化
    的头像 发表于 07-01 17:06 1738次阅读
    瑞之辰传感器:从“卡脖子”到“<b class='flag-5'>杀手锏</b>”的<b class='flag-5'>技术</b>突围

    美国限制英伟向华出售H20芯片

    出口H20芯片,以及任何其他性能达到H20内存带宽、互连带宽或其组合的芯片,都必须获得出口许可。 公告披露,美国政府称,这旨在解决相关产品可能被用于或被转用于中国超级计算机的风险。4月14日,美国政府通知
    的头像 发表于 04-16 17:28 852次阅读

    特朗普要叫停英伟对华特供版 英伟H20出口限制 或损失55亿美元

    据外媒报道,英伟公司发布了一项通知称,美国政府于9日告知英伟公司;特供版的H20芯片出口到中国需要许可证,紧接着在14日又告知
    的头像 发表于 04-16 16:59 1889次阅读

    新思科技携手英伟加速芯片设计,提升芯片电子设计自动化效率

    解决方案在英伟 GPU和英伟 CUDA-X库上所实现的加速 基于英伟 GB200 Grac
    发表于 03-19 17:59 437次阅读

    英伟市值一夜蒸发近2万亿 英伟股价下跌超8%

    财年第四财季和全财年业绩数据上看,2025财年第四财季及全年的营收和利润都实现了大幅增长,大家特别关注的数据中心业务也是业绩增长的核心动力,展现出英伟在AI领域的强大实力。而且英伟
    的头像 发表于 03-04 10:19 988次阅读

    英伟带来Reflex 2低延迟技术

    在 2025 年国际消费电子展(CES 2025)上,英伟不仅推出了备受瞩目的 RTX 50 系列显卡,还带来了一项名为 Reflex 2 的低延迟技术,引发行业广泛关注。 Refl
    的头像 发表于 02-05 15:15 2101次阅读

    英伟Blackwell芯片机架出现故障 订单下滑

    据外媒报道,英伟首批搭载Blackwell芯片的机架出现过热问题,芯片之间的连接方式也存在故障。主要客户微软、亚马逊云部门、谷歌母公司Alphabet和Meta等公司已经减少了
    的头像 发表于 01-14 15:39 661次阅读

    英伟推出GB200 NVL4芯片!液冷UQD快接头崛起

    中,英伟推出了全新的硬件产品——GB200 NVL4超级芯片。该芯片展现出了较为出色的性能表现,在业界引起了广泛关注,并预计于2025年下
    的头像 发表于 01-10 16:58 1802次阅读
    <b class='flag-5'>英伟</b><b class='flag-5'>达</b>推出GB200 NVL4<b class='flag-5'>芯片</b>!液冷UQD快接头崛起

    荷兰与英伟携手推进AI超级计算机设施建设

    超级计算机”的先进设施,以推动人工智能技术的研发和应用。该设施将作为欧盟一系列旨在加强欧洲数字经济的重要项目之一,为欧洲的科技创新和数字经济发展注入新的活力。 通过与英伟的合作,荷
    的头像 发表于 01-10 15:34 779次阅读

    微软大手笔采购英伟AI芯片

    据全球知名市场调研机构Omdia的最新估计,微软在2024年的英伟Hopper架构芯片采购计划上展现出了惊人的手笔。这一举动旨在帮助微软在构建下一代人工智能(AI)系统的激烈竞争中抢占先机。 据悉
    的头像 发表于 12-20 15:50 951次阅读