创作

完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>

3天内不再提示

NVIDIA 推出液冷 GPU,助力实现可持续、高效计算

21克888 来源:厂商供稿 作者:NVIDIA 2022-05-24 14:07 次阅读

液冷NVIDIA A100 PCIe GPU能够满足客户对高性能绿色数据中心的需求,在主流服务器GPU中尚属首例。

pYYBAGKMdZWACQthAASQ7HkSUuU128.jpg


为了遏制气候变化,全球企业正在加快构建高性能、高能效的数据中心,Equinix边缘基础设施主管Zac Smith也参与其中。

他所效力的Equinix是一家全球服务提供商,旗下管理的数据中心超过240个,致力于在业内率先实现气候中和。

“一万家客户依赖Equinix达成气候中和的目标。他们需要更大量的数据以及更高水平的智能,而这通常有赖于AI,且他们希望能够以一种具有可持续性的方式来实现。”Smith说道。2000年代初还在茱莉亚音乐学院读研的他,为纽约的音乐家同僚们搭建了网站,由此与技术结下不解之缘。

能效稳步提升

截至4月,Equinix已发行49亿美元的绿色债券。Equinix将通过这些投资工具来优化电源使用效率(PUE),以期减少对环境的影响。PUE是一种行业指标,用于衡量数据中心使用的能源有多少直接用于计算任务。

数据中心运营商正试图将PUE降至接近1.0的理想水平。Equinix设施目前的平均PUE为1.48,而其旗下新数据中心的PUE最低可低于1.2。

poYBAGKMdayARXfIAAXeCYnjbyQ769.jpg

从PUE来看,Equinix正在稳步提升数据中心的能效

Equinix于1月新启动了一个专门用于提升能效的设施,在此方向上更进一步。其中一部分工作侧重于液冷技术。

液冷技术诞生于大型机时代,在AI时代日臻成熟。如今,液冷技术已经以直接芯片(Direct-to-Chip)冷却的形式广泛应用于全球高速超级计算机

NVIDIA GPU在AI推理和高性能计算方面的能效已比CPU高出20倍,而加速计算也顺理成章地将采用液冷技术。

通过加速提高效率

如果将全球所有运行AI和HPC的CPU服务器切换为GPU加速系统,每年可节省高达11万亿瓦时的能源。节约的能源量可供150多万套房屋使用一年。

今日,NVIDIA发布了率先采用直接芯片(Direct-to-Chip)冷却技术的数据中心PCIe GPU,为可持续发展贡献了自己的力量。

Equinix正在验证A100 80GB PCIe液冷GPU在其数据中心的应用,这也是该公司为实现可持续性冷却和热量捕获的综合性方案中的一部分。GPU现已进入试用阶段,预计将于今年夏季正式发布。

节约用水和用电


“这是我们实验室中引入的首款液冷GPU,我们倍感兴奋,因为客户迫切希望通过可持续的方式来利用AI,”Smith说道。

数据中心运营商旨在淘汰用于冷却数据中心内部气体的冷水机组,因其每年会蒸发数百万加仑的水量。而借助液冷技术,系统仅需对封闭系统中的少量液体进行循环利用,并能够着重于主要的发热点。

Smith说:“我们将变废为宝。”

同等性能,更少耗电

在单独的测试中,Equinix和NVIDIA均发现:采用液冷技术的数据中心工作负载可与风冷设施持平,同时消耗的能源减少了约30%。NVIDIA估计,液冷数据中心的PUE可能达到1.15,远低于风冷的PUE 1.6。

在空间相同的条件下,液冷数据中心可以实现双倍的计算量。这是由于A100 GPU仅使用一个PCIe插槽,而风冷A100 GPU需使用两个PCIe插槽。

pYYBAGKMdfSADGNzAAIT-9o6HR4055.jpg

NVIDIA借助液冷技术达到了节省电力和增加密度的效果


至少有十几家系统制造商计划于今年晚些时候在其产品中使用液冷GPU,包括华硕(ASUS)、永擎电子(ASRock Rack)、富士康工业互联网(Foxconn Industrial Internet)、技嘉科技(GIGABYTE)、新华三(H3C)、浪潮(Inspur)、英业达(Inventec)、宁畅(Nettrix)、云达科技(QCT)、超微(Supermicro)、纬颖科技(Wiwynn)和超聚变(xFusion)。

全球趋势

在亚洲、欧洲和美国,制定能效标准的法规尚未确定。这也推动了银行和其他大型数据中心运营商纷纷加入液冷技术评估的队伍。

液冷技术的使用范围并不局限于数据中心,汽车和其他系统也需要利用该项技术来冷却封闭空间内的高性能系统。

可持续发展之路

“我们即将开启新的旅程,”Smith谈及这一采用液冷技术的主流加速器首次亮相时如是说。

事实上,NVIDIA计划于明年推出的一版A100 PCIe卡中搭载基于NVIDIA Hopper架构的H100 Tensor Core GPU。近期内,NVIDIA计划将液冷技术应用于自有高性能数据中心GPU和NVIDIA HGX平台。

为推动快速采用,今日发布的液冷GPU可在减少能耗的同时维持性能不变。未来,我们期望这些卡在使用同等能源的条件下,展现更出色的性能,满足用户所需。

“仅仅测量功率没有意义,降低碳排放的同时提升性能才是我们努力的方向,” Smith说道。

详细了解NVIDIA全新发布的A100 PCIe液冷GPU。

  • NVIDIA
    +关注

    关注

    14

    文章

    2589

    浏览量

    94904
  • gpu
    gpu
    +关注

    关注

    27

    文章

    2759

    浏览量

    114984
  • 服务器
    +关注

    关注

    10

    文章

    4429

    浏览量

    75993
收藏 人收藏

    评论

    相关推荐

    Think Silicon和RISC-V GPU即将爆发

    无论是业界动态还是RISC-V国际组织相关人员的公开发言,RISC-V都是一款全方位挑战ARM架构的....
    的头像 电子发烧友网 发表于 07-05 10:30 15次 阅读

    算力由性能、规模和利用率三部分组成

    有的算力芯片,可能可以做到性能狂飙,但较少考虑芯片的通用性易用性,然后芯片销量不高落地规模小,那就无....
    的头像 Imagination Tech 发表于 07-05 10:18 7次 阅读

    Apache JMeter可用于性能测试的工具

      JMeter 工具易于用于在 Web 应用程序服务器上注入负载。开发和质量工程师可以使用 JMe....
    发表于 07-05 09:49 19次 阅读
    Apache JMeter可用于性能测试的工具

    NVIDIA Merlin GPU推荐系统加速大模型训练和推理

    暌违两年,NVIDIA Merlin 推荐系统公开课将于 7 月 5 日全面上新。本次公开课将由 N....
    的头像 NVIDIA英伟达 发表于 07-05 09:02 83次 阅读

    火山引擎机器学习平台与NVIDIA加深合作

    随着 AI 在医疗健康和生命科学领域应用的不断增加,GPU 算力的需求迅猛增长。火山引擎机器学习平台....
    的头像 NVIDIA英伟达 发表于 07-05 08:59 115次 阅读

    RISC-V GPU离产业爆发仅一步之遥?

    电子发烧友网报道(文/吴子鹏)近日,在德国纽伦堡举行的 Embedded World 2022 大会....
    的头像 Felix分析 发表于 07-05 07:06 228次 阅读
    RISC-V GPU离产业爆发仅一步之遥?

    如何远程登入Windows系统

    远程功能是租用服务器常用的技术, 主要是经网络远程非本地的服务器作业务管理, Windows系统与L....
    的头像 陈志诚 发表于 07-04 20:20 2次 阅读
    如何远程登入Windows系统

    防火墙(Firewall)是什么

    防火墙簡介 如果租用服務器的作業系統比喻一間房子, 防火墙便是房子的大門, 用作前線網絡安全保....
    的头像 陈志诚 发表于 07-04 20:15 0次 阅读
    防火墙(Firewall)是什么

    如何选择机房,这五大注意事项需了解

    如何选择适合自己的机房【5大注意事项】?
    的头像 陈志诚 发表于 07-04 20:08 2次 阅读

    服务器为什么配大带宽会更好

    香港服务器为什么配大带宽更好?如今很多站长都会倾向于租用香港大带宽服务器,很明显,大带宽服务器的优势....
    的头像 深圳_SEO_青春聆听log 发表于 07-04 16:48 110次 阅读

    现代测试系统具有丰富的数据管理策略

      Cyth Systems 在设计 Omnimetriq 产品系列时实施了上述数据管理策略。打包为....
    的头像 星星科技指导员 发表于 07-04 14:30 56次 阅读
    现代测试系统具有丰富的数据管理策略

    Nginx如何做到热部署

    Nginx是一款轻量级的Web服务器、反向代理服务器,由于它的内存占用少(一个worker进程只占用....
    的头像 一口Linux 发表于 07-04 11:26 93次 阅读

    芯动科技风华系列GPU与中望CAD Linux版软件完成兼容性认证

    近日,芯动科技自主研发的风华系列GPU与中望CAD Linux版软件完成兼容性认证,综合性能优越,共....
    的头像 芯动科技Innosilicon 发表于 07-04 10:02 62次 阅读

    SMP、NUMA、MPP体系结构比较

    从系统架构来看,目前的商用服务器大体可以分为三类,即对称多处理器结构 (SMP :Symmetric....
    的头像 马哥Linux运维 发表于 07-04 09:04 39次 阅读

    带宽与网速之间的区别是怎样的

    什么是带宽?什么是网速?至今我接触的客户还有不少是没搞懂这块, 误认为互联网的一切只是数据传输交换互....
    的头像 陈志诚 发表于 07-03 20:50 25次 阅读
    带宽与网速之间的区别是怎样的

    NVIDIA提供用于AI训练的合成数据生成工具

    提供合成数据生成工具和服务的企业以及开发者现在可以使用 Omniverse Replicator S....
    的头像 NVIDIA英伟达企业解决方案 发表于 07-03 10:06 111次 阅读

    NVIDIA研究人员创建可以疏通计算机网络拥堵的AI模型

    NVIDIA 研究人员创建了可以疏通计算机网络拥堵的 AI 模型,该模型很快就会出现在大众附近的数据....
    的头像 NVIDIA英伟达 发表于 07-03 10:04 110次 阅读

    利用AI技术加强视频内容创作和传播

    芬兰的 MTV Oy 采用由 NVIDIA 技术驱动的 Valossa AI 解决方案自动分析视频内....
    的头像 NVIDIA英伟达 发表于 07-03 09:59 157次 阅读

    西门子和NVIDIA共同推动数字孪生的发展

    西门子首席执行官 Roland Busch 和 NVIDIA 创始人兼首席执行官黄仁勋在慕尼黑举行的....
    的头像 NVIDIA英伟达 发表于 07-03 09:55 195次 阅读

    如何迁移docker的存储目录

    那就准备迁移 docker 的存储目录吧,或者对 /var 设备进行扩容来达到相同的目的。更多关于 ....
    的头像 马哥Linux运维 发表于 07-03 09:21 119次 阅读

    华为OceanStor2810计算型存储助力档案信息化建设加速

    在国家经济社会发展的历史进程中,各项重大事业的规律认识、经验总结、历史文化传承延续,老百姓的生产生活....
    的头像 华为数字中国 发表于 07-01 15:31 170次 阅读

    新加坡vps和新加坡云服务器有什么区别

    许多公司都在租用新加坡vps和新加坡云服务器,不知道这两者有何区别?新加坡vps和新加坡云服务器肯定....
    的头像 深圳市恒讯科技有限公司 发表于 07-01 15:24 38次 阅读

    调度中心显示系统设计应用方案

    根据调度所大屏幕显示单元的具体配置,由于各显示单元至大屏幕控制室之间的距离远超过15m,采用数字DV....
    发表于 07-01 13:25 251次 阅读
    调度中心显示系统设计应用方案

    关于llist.h文件中的链表宏讲解

    链表宏在linux内核、鸿蒙内核、rtos和一些开源代码中用的非常多。链表宏是双向链表的经典实现方式....
    的头像 一口Linux 发表于 07-01 11:58 225次 阅读

    NETWORKX Python编程语言软件包概述及用途

    NetworkX 是一个 Python 编程语言软件包,可用于创建、操作和学习复杂图形网络的结构、动....
    的头像 NVIDIA英伟达 发表于 07-01 11:30 197次 阅读

    NVIDIA NGC目录中的GPU优化容器

    借助 NVIDIA NGC 目录中的 GPU 优化容器,更快地开发和部署应用。
    的头像 NVIDIA英伟达企业解决方案 发表于 07-01 11:21 173次 阅读

    NVIDIA Isaac Sim 2022.1版本的亮点及功能

    NVIDIA 宣布推出2022.1 版 NVIDIA Isaac Sim。作为一种机器人仿真和合成数....
    的头像 NVIDIA英伟达企业解决方案 发表于 07-01 11:19 194次 阅读

    NVIDIA AI平台在MLPerf基准测试实现飞跃

    NVIDIA AI 仍是唯一能够运行 MLPerf 行业基准测试中所有测试的平台, A100 GPU....
    的头像 NVIDIA英伟达企业解决方案 发表于 07-01 10:52 156次 阅读

    MIT的SpAtten架构将注意力机制用于高级NLP

      通用的 AI 加速器、GPU、TPU 和 NPU 即使支持高计算能力也无法实现这些技术,因为这些....
    的头像 星星科技指导员 发表于 07-01 10:43 151次 阅读

    模型有助于实现最大的运营效率

      为了推动行动或结果,非结构化数据通过 DeepStream 等处理模型运行,从而产生结构化数据。....
    的头像 星星科技指导员 发表于 07-01 10:29 180次 阅读

    NVIDIA Omniverse和西门子Xcelerator平台来实现全保真数字孪生

    西门子 Process Simulate(左)与 NVIDIA Omniverse(右)相连接,实现....
    的头像 NVIDIA英伟达企业解决方案 发表于 07-01 10:28 141次 阅读

    使用TensorBoard进行机器学习模型分析

      总体而言,TensorBoard 是帮助开发和培训过程的绝佳工具。Scalar and Metr....
    的头像 星星科技指导员 发表于 07-01 09:44 94次 阅读
    使用TensorBoard进行机器学习模型分析

    新一代旗舰!Arm Cortex-X3 + Immortalis GPU发布,Arm全面计算赋能视觉体验

    电子发烧友网报道(文/黄晶晶)去年初,被称为Arm公司十年来最大技术革新的Armv9架构发布,基于此....
    发表于 06-30 20:32 554次 阅读
    新一代旗舰!Arm Cortex-X3 + Immortalis GPU发布,Arm全面计算赋能视觉体验

    Arm推出全新旗舰级GPU产品Arm Immortalis™

    Arm® 今日宣布推出 2022 全面计算解决方案 (TCS22),可提供不同级别的性能、效率和可扩....
    的头像 科技绿洲 发表于 06-30 17:37 303次 阅读

    2022年中国DPU行业白皮书 DPU将成为CPU、GPU后的第三块主力芯片

    本报告旨在分析 DPU 发展现状、产品特点、技术动向及发展趋势,并识别中国芯片厂商与海外芯片厂商的差....
    的头像 拍明芯城 发表于 06-30 16:05 1567次 阅读
    2022年中国DPU行业白皮书 DPU将成为CPU、GPU后的第三块主力芯片

    NVIDIA Morpheus应用框架可实时发现和阻止复杂攻击

    如今,网络安全格局随着威胁与攻击方法的不断变化而变化,使商业世界处于高度戒备状态。通过不断改变攻击技....
    的头像 科技绿洲 发表于 06-30 14:38 271次 阅读
    NVIDIA Morpheus应用框架可实时发现和阻止复杂攻击

    Ampere Mt. Jade服务器首款通过SystemReady LS等级认证

    Arm SystemReady 合规性认证计划已经达到了一个重要里程碑——基于 Arm 架构的 Am....
    的头像 科技绿洲 发表于 06-30 11:25 199次 阅读

    NVIDIA DeepStream SDK是什么 有哪些特性

    快速开发和部署视觉 AI 应用和服务。DeepStream 提供多平台、可扩展、TLS 加密的安全性....
    的头像 NVIDIA英伟达企业解决方案 发表于 06-30 10:55 188次 阅读

    NVIDIA和三维家助力提升家居行业生产效率

    家居行业的可视化需求越来越高,从物理工作站的 GPU 算力、渲染能力,到 AI 辅助设计功能,再到可....
    的头像 NVIDIA英伟达企业解决方案 发表于 06-30 10:42 124次 阅读

    NVIDIA助力理想汽车发布第二款电动汽车L9

    这款电动汽车通过高性能传感器和 AI 计算为每位乘员提供直观的智能化体验。
    的头像 NVIDIA英伟达企业解决方案 发表于 06-30 10:38 195次 阅读

    统信服务器操作系统V20助力铁路局完成核心业务系统信创改造

    未来,统信软件将提供更加安全稳定和智能易用的产品和服务,成为坚实可信的新基建基座,与国铁集团及相关单....
    的头像 科技绿洲 发表于 06-30 10:33 174次 阅读

    NVIDIA BlueField-2 DPU上的ARIA零信任安全网关

    如今,网络安全格局随着威胁与攻击方法的不断变化而变化,使商业世界处于高度戒备状态。通过不断改变攻击技....
    的头像 NVIDIA英伟达企业解决方案 发表于 06-30 10:32 153次 阅读

    PING不通是怎么回事

    1、访问控制。不管中间跨越了多少跳,只要有节点(包括端节点)对ICMP进行了过滤,Ping不通是正常的。最常见的就是防火墙的...
    发表于 06-30 09:41 1760次 阅读

    CheerPrintService基于浏览器渲染的服务器PDF打印服务

    ./oschina_soft/CheerPrintService.zip
    发表于 06-30 09:23 6次 阅读
    CheerPrintService基于浏览器渲染的服务器PDF打印服务

    OAuth2-Server OAuth 2.0授权服务器的实现

    ./oschina_soft/oauth2-server.zip
    发表于 06-30 09:19 7次 阅读
    OAuth2-Server OAuth 2.0授权服务器的实现

    开源软件-不死鸟微信域名防封整站系统

    ./oschina_soft/gitee-WechatUrlWebSite.zip
    发表于 06-30 09:15 9次 阅读
    开源软件-不死鸟微信域名防封整站系统

    什么是镜像技术

    镜像(Mirroring)是冗余的一种类型,一个磁盘上的数据在另一个磁盘上存在一个完全相同的副本即为镜像,RAID 1和RAID 1...
    发表于 06-28 09:38 3866次 阅读

    香橙派RK3399开发板OrangePi4 LTS在linux上的GPU测试说明

    1、Linux4.4 和 Linux5.10 Debian 系统 GPU 的测试说明 注意,Linux4.4 Debian10 和 Linux5.10 Debian11 系统使用的...
    发表于 06-22 20:17 1505次 阅读
    香橙派RK3399开发板OrangePi4 LTS在linux上的GPU测试说明

    物理机服务器有什么用?

    首先我们先了解物理机是由什么部分组成:主板、内存、硬盘、阵列卡、电源、网卡、风扇。tg@CDNJSFY 另外物理机服务器有几...
    发表于 06-22 10:16 2013次 阅读
    物理机服务器有什么用?

    将Arm架构代码从X86服务器迁移到aarch64服务器上实战分享

    1、Arm架构代码移植实战分享编程语言简介按照翻译方式的不同,高级语言通常可以分为两类:一类是编译翻译,一类是解释翻译,分别...
    发表于 06-02 17:04 5436次 阅读

    为什么要在OpenHarmony设备上安装Dropbear呢

    ssh是一个常见的、可靠的远程终端/文件传输的协议,OpenHarmony本身并没有ssh服务器的功能。 为了启用ssh功能,我们需要引入一...
    发表于 05-23 17:45 1913次 阅读

    HTTP OTA webclient获取不到服务器如何处理?

    尝试用HTTP_OTA的方式来升级程序,按照网上的资料搭建程序,在http_ota.c中现在遇到Webclient获取不到服务器的情况: ...
    发表于 05-19 10:43 1303次 阅读

    自己上传的工程无法在线查看

    是服务器问题吗 一直提示无法下载
    发表于 05-17 14:25 4675次 阅读
    自己上传的工程无法在线查看

    影响服务器访问速度的因素

    我们在租用服务器的过程中,可能在访问速度方面,会受到某些因素影响,如果您要进行此项业务,进行一些简单的了解是非常的有必要...
    发表于 05-17 09:50 4397次 阅读

    请问在RK3399pro中间计算时能否调用GPU的一些现成数据库或函数来计算

    我在用RK3399pro的NPU做深度学习计算,使用了两个rknn模型进行推理,但是在这两个rknn模型之间需要进行一些中间计算(从第一...
    发表于 05-09 15:26 3596次 阅读