0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA 推出液冷 GPU,助力实现可持续、高效计算

21克888 来源:厂商供稿 作者:NVIDIA 2022-05-24 14:07 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

液冷NVIDIA A100 PCIe GPU能够满足客户对高性能绿色数据中心的需求,在主流服务器GPU中尚属首例。

pYYBAGKMdZWACQthAASQ7HkSUuU128.jpg


为了遏制气候变化,全球企业正在加快构建高性能、高能效的数据中心,Equinix边缘基础设施主管Zac Smith也参与其中。

他所效力的Equinix是一家全球服务提供商,旗下管理的数据中心超过240个,致力于在业内率先实现气候中和。

“一万家客户依赖Equinix达成气候中和的目标。他们需要更大量的数据以及更高水平的智能,而这通常有赖于AI,且他们希望能够以一种具有可持续性的方式来实现。”Smith说道。2000年代初还在茱莉亚音乐学院读研的他,为纽约的音乐家同僚们搭建了网站,由此与技术结下不解之缘。

能效稳步提升

截至4月,Equinix已发行49亿美元的绿色债券。Equinix将通过这些投资工具来优化电源使用效率(PUE),以期减少对环境的影响。PUE是一种行业指标,用于衡量数据中心使用的能源有多少直接用于计算任务。

数据中心运营商正试图将PUE降至接近1.0的理想水平。Equinix设施目前的平均PUE为1.48,而其旗下新数据中心的PUE最低可低于1.2。

poYBAGKMdayARXfIAAXeCYnjbyQ769.jpg

从PUE来看,Equinix正在稳步提升数据中心的能效

Equinix于1月新启动了一个专门用于提升能效的设施,在此方向上更进一步。其中一部分工作侧重于液冷技术。

液冷技术诞生于大型机时代,在AI时代日臻成熟。如今,液冷技术已经以直接芯片(Direct-to-Chip)冷却的形式广泛应用于全球高速超级计算机。

NVIDIA GPU在AI推理和高性能计算方面的能效已比CPU高出20倍,而加速计算也顺理成章地将采用液冷技术。

通过加速提高效率

如果将全球所有运行AI和HPC的CPU服务器切换为GPU加速系统,每年可节省高达11万亿瓦时的能源。节约的能源量可供150多万套房屋使用一年。

今日,NVIDIA发布了率先采用直接芯片(Direct-to-Chip)冷却技术的数据中心PCIe GPU,为可持续发展贡献了自己的力量。

Equinix正在验证A100 80GB PCIe液冷GPU在其数据中心的应用,这也是该公司为实现可持续性冷却和热量捕获的综合性方案中的一部分。GPU现已进入试用阶段,预计将于今年夏季正式发布。

节约用水和用电


“这是我们实验室中引入的首款液冷GPU,我们倍感兴奋,因为客户迫切希望通过可持续的方式来利用AI,”Smith说道。

数据中心运营商旨在淘汰用于冷却数据中心内部气体的冷水机组,因其每年会蒸发数百万加仑的水量。而借助液冷技术,系统仅需对封闭系统中的少量液体进行循环利用,并能够着重于主要的发热点。

Smith说:“我们将变废为宝。”

同等性能,更少耗电

在单独的测试中,Equinix和NVIDIA均发现:采用液冷技术的数据中心工作负载可与风冷设施持平,同时消耗的能源减少了约30%。NVIDIA估计,液冷数据中心的PUE可能达到1.15,远低于风冷的PUE 1.6。

在空间相同的条件下,液冷数据中心可以实现双倍的计算量。这是由于A100 GPU仅使用一个PCIe插槽,而风冷A100 GPU需使用两个PCIe插槽。

pYYBAGKMdfSADGNzAAIT-9o6HR4055.jpg

NVIDIA借助液冷技术达到了节省电力和增加密度的效果


至少有十几家系统制造商计划于今年晚些时候在其产品中使用液冷GPU,包括华硕(ASUS)、永擎电子(ASRock Rack)、富士康工业互联网(Foxconn Industrial Internet)、技嘉科技(GIGABYTE)、新华三(H3C)、浪潮(Inspur)、英业达(Inventec)、宁畅(Nettrix)、云达科技(QCT)、超微(Supermicro)、纬颖科技(Wiwynn)和超聚变(xFusion)。

全球趋势

在亚洲、欧洲和美国,制定能效标准的法规尚未确定。这也推动了银行和其他大型数据中心运营商纷纷加入液冷技术评估的队伍。

液冷技术的使用范围并不局限于数据中心,汽车和其他系统也需要利用该项技术来冷却封闭空间内的高性能系统。

可持续发展之路

“我们即将开启新的旅程,”Smith谈及这一采用液冷技术的主流加速器首次亮相时如是说。

事实上,NVIDIA计划于明年推出的一版A100 PCIe卡中搭载基于NVIDIA Hopper架构的H100 Tensor Core GPU。近期内,NVIDIA计划将液冷技术应用于自有高性能数据中心GPU和NVIDIA HGX平台。

为推动快速采用,今日发布的液冷GPU可在减少能耗的同时维持性能不变。未来,我们期望这些卡在使用同等能源的条件下,展现更出色的性能,满足用户所需。

“仅仅测量功率没有意义,降低碳排放的同时提升性能才是我们努力的方向,” Smith说道。

详细了解NVIDIA全新发布的A100 PCIe液冷GPU。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5729

    浏览量

    110301
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5329

    浏览量

    136222
  • 服务器
    +关注

    关注

    14

    文章

    10451

    浏览量

    91857
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    芸海君蓝:新能源液冷高低温测试解决方案

    液冷高低温测试冷水机凭借高效换热、精准控温、宽温域控制以及智能化管理等优势,正在成为新能源行业温控升级的重要设备。   作为温控领域的重要企业,芸海君蓝始终专注于液冷温控设备研发与制造,为新能源行业提供专业、
    的头像 发表于 05-22 14:38 66次阅读
    芸海君蓝:新能源<b class='flag-5'>液冷</b>高低温测试解决方案

    中航光电推出插拔式GPU液冷组件

    随着AI芯片功耗持续攀升、单机算力密度不断突破上限,与之配套的液冷散热组件也正朝着更高散热性能、更小结构尺寸、更优集成封装的方向快速迭代升级。针对高功率PCIe式GPU的散热需求,中航光电推出
    的头像 发表于 04-08 16:04 572次阅读
    中航光电<b class='flag-5'>推出</b><b class='flag-5'>可</b>插拔式<b class='flag-5'>GPU</b><b class='flag-5'>液冷</b>组件

    NVIDIA向Kubernetes社区捐赠动态资源分配GPU驱动程序

    此外,NVIDIA 在 KubeCon Europe 大会上宣布推出适用于 GPU 加速工作负载的机密容器解决方案、NVIDIA KAI Scheduler 更新,以及用于
    的头像 发表于 04-01 09:10 887次阅读

    NVIDIA推出cuEST量子化学加速库

    本周,NVIDIA 发布了 NVIDIA cuEST。这是一款全新的 NVIDIA CUDA-X 库,可将电子结构计算迁移到 GPU 上执行
    的头像 发表于 03-23 15:11 631次阅读

    NVIDIA推出BlueField-4 STX存储架构

    NVIDIA 今日宣布推出 NVIDIA BlueField-4® STX 模块化参考架构,该架构助力企业、云
    的头像 发表于 03-18 14:40 349次阅读

    中航光电持续深耕流体传输及液冷散热领域

    在各行业技术升级的浪潮下,设备集成度与运行负荷持续提升,数据中心、工业智造、光伏储能等场景的散热需求均朝着高效、可靠、绿色的方向升级。依托互连技术核心优势,中航光电深耕流体传输及液冷散热领域,以高可靠传输架构与
    的头像 发表于 01-09 15:52 1463次阅读

    NVIDIA RTX PRO 5000 Blackwell GPU的深度评测

    NVIDIA RTX PRO 5000 Blackwell 是 NVIDIA RTX 5000 Ada Generation 的升级迭代产品,其各项核心指标均针对 GPU 加速工作流的高性能
    的头像 发表于 01-06 09:51 4946次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 Blackwell <b class='flag-5'>GPU</b>的深度评测

    NVIDIA RTX PRO 4000 Blackwell GPU性能测试

    作为 NVIDIA 专业显卡产品线中单槽性能的巅峰之作,NVIDIA RTX PRO 4000 Blackwell 在各项核心指标上均实现对前代 NVIDIA RTX 4000 Ada
    的头像 发表于 12-29 15:30 2120次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 4000 Blackwell <b class='flag-5'>GPU</b>性能测试

    在Python中借助NVIDIA CUDA Tile简化GPU编程

    NVIDIA CUDA 13.1 版本新增了基于 Tile 的GPU 编程模式。它是自 CUDA 发明以来 GPU 编程最核心的更新之一。借助 GPU tile kernels,可以用
    的头像 发表于 12-13 10:12 1570次阅读
    在Python中借助<b class='flag-5'>NVIDIA</b> CUDA Tile简化<b class='flag-5'>GPU</b>编程

    NVIDIA推出NVQLink高速互连架构

    NVIDIA 推出 NVIDIA NVQLink,这是一种开放式系统架构,可将 GPU 计算的极致性能与量子处理器紧密结合,以构建加速的量子
    的头像 发表于 11-03 14:53 959次阅读

    IQM与NVIDIA携手开展NVQLink合作,推动扩展量子纠错技术发展

    应用的关键环节。 NVQLink是一款与NVIDIA CUDA-Q深度集成的开放且互操作平台,旨在连接量子硬件与人工智能超级计算系统。该平台通过在量子计算机与
    的头像 发表于 10-31 10:30 573次阅读

    NVIDIA RTX PRO 4500 Blackwell GPU测试分析

    今天我们带来全新 NVIDIA Blackwell 架构 GPU —— NVIDIA RTX PRO 4500 Blackwell 的测试,对比上一代产品 NVIDIA RTX 450
    的头像 发表于 08-28 11:02 4603次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 Blackwell <b class='flag-5'>GPU</b>测试分析

    NVIDIA桌面GPU系列扩展新产品

    NVIDIA 桌面 GPU 系列扩展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 20
    的头像 发表于 08-18 11:50 1754次阅读

    睿海光电以高效交付与广泛兼容助力AI数据中心800G光模块升级

    400G/800G光模块已实现规模化量产,并基于AI工厂与AI云的核心需求进行深度优化: 速率突破:采用PAM4调制技术,单通道速率达100Gbps,整模块实现800Gbps传输能力,为GPU集群的
    发表于 08-13 19:01

    NVIDIA AI助力科学研究领域持续突破

    随着 AI 技术的广泛应用,AI 正在成为科学研究的引擎。NVIDIA 作为重要的技术推手,持续驱动着 AI 系统解锁更多领域的科学突破。
    的头像 发表于 08-05 16:30 1378次阅读