0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA发布采用直接芯片冷却技术的数据中心PCIe GPU

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2022-05-25 11:20 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

液冷 NVIDIA A100 PCIe GPU 能够满足客户对高性能绿色数据中心的需求,在主流服务器 GPU 中尚属首例。

为了遏制气候变化,全球企业正在加快构建高性能、高能效的数据中心,Equinix 边缘基础设施主管 Zac Smith 也参与其中。

他所效力的 Equinix 是一家全球服务提供商,旗下管理的数据中心超过 240 个,致力于在业内率先实现气候中和。

“一万家客户依赖 Equinix 达成气候中和的目标。他们需要更大量的数据以及更高水平的智能,而这通常有赖于 AI,且他们希望能够以一种具有可持续性的方式来实现。”Smith 说道。2000 年代初还在茱莉亚音乐学院读研的他,为纽约的音乐家同僚们搭建了网站,由此与技术结下不解之缘。

能效稳步提升

截至 4 月,Equinix 已发行 49 亿美元的绿色债券。Equinix 将通过这些投资工具来优化电源使用效率 (PUE),以期减少对环境的影响。PUE 是一种行业指标,用于衡量数据中心使用的能源有多少直接用于计算任务。

数据中心运营商正试图将 PUE 降至接近 1.0 的理想水平。Equinix 设施目前的平均PUE为 1.48,而其旗下新数据中心的 PUE 最低可低于 1.2。

从 PUE 来看, Equinix 正在稳步提升数据中心的能效

Equinix 于 1 月新启动了一个专门用于提升能效的设施,在此方向上更进一步。其中一部分工作侧重于液冷技术。

液冷技术诞生于大型机时代,在 AI 时代日臻成熟。如今,液冷技术已经以直接芯片(Direct-to-Chip)冷却的形式广泛应用于全球高速超级计算机。

NVIDIA GPU 在 AI 推理和高性能计算方面的能效已比 CPU 高出 20 倍, 而加速计算也顺理成章地将采用液冷技术。

通过加速提高效率

如果将全球所有运行 AI 和 HPC 的 CPU 服务器切换为 GPU 加速系统,每年可节省高达 11 万亿瓦时的能源。节约的能源量可供 150 多万套房屋使用一年。

今日,NVIDIA 发布了率先采用直接芯片(Direct-to-Chip)冷却技术的数据中心 PCIe GPU,为可持续发展贡献了自己的力量。

Equinix 正在验证 A100 80GB PCIe 液冷 GPU 在其数据中心的应用,这也是该公司为实现可持续性冷却和热量捕获的综合性方案中的一部分。GPU 现已进入试用阶段,预计将于今年夏季正式发布。

节约用水和用电

“这是我们实验室中引入的首款液冷 GPU,我们倍感兴奋,因为客户迫切希望通过可持续的方式来利用 AI,” Smith 说道。

数据中心运营商旨在淘汰用于冷却数据中心内部气体的冷水机组,因其每年会蒸发数百万加仑的水量。而借助液冷技术,系统仅需对封闭系统中的少量液体进行循环利用,并能够着重于主要的发热点。

Smith说:“我们将变废为宝。”

同等性能,更少耗电

在单独的测试中,Equinix 和 NVIDIA 均发现:采用液冷技术的数据中心工作负载可与风冷设施持平,同时消耗的能源减少了约 30%。NVIDIA 估计,液冷数据中心的 PUE 可能达到 1.15,远低于风冷的 PUE 1.6。

在空间相同的条件下,液冷数据中心可以实现双倍的计算量。这是由于 A100 GPU 仅使用一个 PCIe 插槽,而风冷 A100 GPU 需使用两个 PCIe 插槽。

NVIDIA 借助液冷技术达到了节省电力和增加密度的效果

至少有十几家系统制造商计划于今年晚些时候在其产品中使用液冷 GPU,包括华硕(ASUS)、永擎电子(ASRock Rack)、富士康工业互联网(Foxconn Industrial Internet)、技嘉科技(GIGABYTE)、新华三(H3C)、浪潮(Inspur)、英业达(Inventec)、宁畅(Nettrix)、云达科技(QCT)、 超微(Supermicro)、 纬颖科技(Wiwynn)和超聚变(xFusion)。

全球趋势

在亚洲、欧洲和美国,制定能效标准的法规尚未确定。这也推动了银行和其他大型数据中心运营商纷纷加入液冷技术评估的队伍。

液冷技术的使用范围并不局限于数据中心,汽车和其他系统也需要利用该项技术来冷却封闭空间内的高性能系统。

可持续发展之路

“我们即将开启新的旅程,” Smith 谈及这一采用液冷技术的主流加速器首次亮相时如是说。

事实上, NVIDIA 计划于明年推出的一版 A100 PCIe 卡中搭载基于 NVIDIA Hopper 架构的 H100 Tensor Core GPU。近期内,NVIDIA 计划将液冷技术应用于自有高性能数据中心 GPU 和 NVIDIA HGX 平台。

为推动快速采用,今日发布的液冷 GPU 可在减少能耗的同时维持性能不变。未来,我们期望这些卡在使用同等能源的条件下,展现更出色的性能,满足用户所需。

“仅仅测量功率没有意义,降低碳排放的同时提升性能才是我们努力的方向,” Smith 说道。

原文标题:NVIDIA 推出液冷 GPU,助力实现可持续、高效计算

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5729

    浏览量

    110304
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5329

    浏览量

    136229
  • 数据中心
    +关注

    关注

    18

    文章

    5854

    浏览量

    75255

原文标题:NVIDIA 推出液冷 GPU,助力实现可持续、高效计算

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AMC16Z为数据中心

    数据中心
    安科瑞缪志澄
    发布于 :2026年05月08日 14:47:10

    晶科能源全球发布新一代数据中心AIDC组件

    2026年3月20日,上海,全球领先的光伏企业晶科能源全球发布新一代数据中心AIDC组件,该产品依托成熟的飞虎3组件平台技术,深度聚焦数据中心高负荷、高财产安全、全天长时运行、极端耐候
    的头像 发表于 03-23 11:35 478次阅读

    1分钟带你了解数据中心供电架构 #电子元器件 #数据中心 #供电架构

    数据中心
    沛城芯动力
    发布于 :2026年02月03日 15:39:04

    NVIDIA软件可选服务支持数据中心集群管理

    这项可选服务将帮助数据中心运营商监测整个 AI GPU 集群运行状况,从而最大限度地延长正常运行时间。
    的头像 发表于 12-13 09:37 1140次阅读
    <b class='flag-5'>NVIDIA</b>软件可选服务支持<b class='flag-5'>数据中心</b>集群管理

    伟创力重磅发布全球首款面向千兆瓦级数据中心的AI基础设施平台

    伟创力重磅发布全球首款面向千兆瓦级数据中心的AI基础设施平台,平台集成了电源和冷却产品、计算能力和服务,专为AI和高性能计算而设计,帮助数据中心运营商将部署速度提升高达30%,大幅降低
    的头像 发表于 10-23 15:08 1033次阅读

    OpenAI和NVIDIA宣布达成合作,部署10吉瓦NVIDIA系统

    此次合作将助力 OpenAI 构建和部署至少 10 吉瓦(gigawatt)的 AI 数据中心,这些数据中心采用 NVIDIA 系统,包含数百万块
    的头像 发表于 09-23 14:37 1644次阅读
    OpenAI和<b class='flag-5'>NVIDIA</b>宣布达成合作,部署10吉瓦<b class='flag-5'>NVIDIA</b>系统

    技术资讯 I 数据中心能否承受高温运行?

    通常,当我们讨论面向数据中心的数字孪生软件时,会重点介绍工程师如何运用基于物理原理的仿真技术,通过我们的数据中心软件建立复杂热力学模型,为IT设备寻找高效的冷却方案。但从提高效能和节约
    的头像 发表于 09-19 15:55 703次阅读
    <b class='flag-5'>技术</b>资讯 I <b class='flag-5'>数据中心</b>能否承受高温运行?

    华为液冷热管理控制器TMU荣获“数据中心冷却创新奖”

    近日,W.Media 2025中东云计算和数据中心产业奖项在迪拜揭晓,华为液冷热管理控制器TMU凭借卓越的换热性能、前瞻的可靠性设计以及敏捷的智能运维能力,在众多冷却技术中脱颖而出,斩获“数据
    的头像 发表于 09-16 15:19 2382次阅读

    睿海光电以高效交付与广泛兼容助力AI数据中心800G光模块升级

    引领AI时代网络变革:睿海光电的核心竞争力 在AI时代,数据中心正经历从传统架构向AI工厂与AI云的转型。AI工厂依赖超大规模GPU集群驱动大模型训练,要求网络具备超高带宽与超低延迟;AI云则为多
    发表于 08-13 19:01

    加速AI未来,睿海光电800G OSFP光模块重构数据中心互联标准

    定义数据中心互联的新范式。 一、技术实力:800G OSFP光模块的卓越性能表现 睿海光电800G OSFP光模块系列采用行业领先的PAM4调制技术,具备以下核心优势: 超高速率 :单
    发表于 08-13 16:38

    PCIe协议分析仪在数据中心中有何作用?

    数据中心的整体可靠性。以下是其核心作用及具体应用场景的详细分析:一、性能优化:突破带宽瓶颈,提升计算效率 链路带宽利用率分析 场景:在AI训练集群中,GPU通过PCIe与CPU交换数据
    发表于 07-29 15:02

    PCIe协议分析仪能测试哪些设备?

    :提升数据中心的整体效率,降低CPU负载。 四、异构计算与扩展设备 多GPU系统 测试场景:利用PCIe协议分析仪模拟高负载的GPU间通信,测试P
    发表于 07-25 14:09

    中型数据中心中的差分晶体振荡器应用与匹配方案

    关键业务平台,需高IO能力、低时延响应与高并发处理,具备容灾与跨区域同步能力。 使用设备: 数据中心级交换机、光模块、RAID控制器、企业级SSD阵列、PCIe HBA/NIC、高精度差分振荡器、时间
    发表于 07-01 16:33

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    。。) 原理学习 在「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」书中,作者详解了从帕斯卡架构到40系的Hopper架构的技术演变进化,按照出版时间算是囊括了NVIDIA
    发表于 06-18 19:31

    Kao Data与Cadence合作验证数据中心间接蒸发冷却设计

    Kao Data 计划在占地 36 英亩的园区内建立四个数据中心,目前已完成其中一个,即 KDL1 数据中心,这是英国第一个 100% 自由冷却的大规模主机托管设施。该数据中心园区旨在
    的头像 发表于 06-11 10:43 1178次阅读