0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

PUE的拯救者,液冷服务器

E4Life 来源:电子发烧友 作者:周凯扬 2024-06-06 00:23 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/周凯扬)随着这几年数据中心算力持续飙升,风冷已经快要cover不住芯片的热功率之际,以液体作为冷却媒介的液冷方案很快就被推到台前。在不同国家对于PUE指标的要求越来越严格的情境下,要想借助GPU密集的计算集群打造智算网络,是肯定不能在散热上马虎的。为此,自19年起组建开展商业化应用的液冷服务器,开始慢慢抢占更多的市场份额。

液冷的必要性

随着英伟达B200 GPU的推出,8路B200的DGX B200接近15kW的最高功耗,已经让不少服务器厂商都已经感受到了全面走向液冷势在必行,尤其是在对比之下,如今的液冷方案已经提供了更多的技术优势。

比如在相同标准的机柜下,相比风冷服务器,液冷服务器可以提供更高的服务器计算密度,从而可以将更多的空间分配给计算资源。其次过热的CPU、GPU和其他加速器抵达热瓶颈后,会显著降低服务器性能。尽管风冷同样可以解决散热问题,但在散热效率和极限效果上,相较液冷还是有一定的差距,所以液冷方案更容易提高服务器的整体性能,并潜在降低失效率。

再者就是在噪声上的优势了,无论是哪一种液冷方案,在噪声控制上都要比风冷方案安静,因为服务器风扇都运行在极低的速度下。不仅如此,比起风冷散热,液冷散热更容易保证均衡的散热表现,从而消灭任何热点的存在。尽管风冷和液冷都有节省能耗的作用,但液冷方案由于液体更高的比热容和密度,更容易实现较低的PUE值,比如传统的风冷数据中心PUE为1.5到1.8,而液冷方案可以做到1.1以下,符合更低的碳足迹要求。

在技术路线上,液冷服务器主要分为浸没式液冷服务器、喷淋式液冷服务器和冷板式液冷服务器,不同的服务器和数据中心往往会根据基础设施的设计,采取不同的液冷方案,比如阿里主要采用浸没式,中科曙光、浪潮和华为等厂商主要采用冷板式液冷方案。目前的主流方案还是以浸没式和冷板式为主,喷淋式在国内外投入实践应用的都比较少。

浸没式液冷

浸没式液冷是一种将服务器组件整个浸入液体中的液冷方式,在浸没式液冷系统中,服务器组件会被放入专有非导电液体中,随后加热的液体再从组件中循环出来。

wKgaomZgPReAD6kCAALoImgAy_Y601.png
阿里云单相浸没式液冷 / 阿里巴巴


浸没式冷却又分为单相和双相两种,单相浸没式冷却是指冷却液保持液体状态不蒸发,在捕捉了浸入组件的热量后,液体仍需要通过冷却塔、冷却器或者现有的冷水机组进行冷却。而双相浸没式液冷所用的冷却液在较低温度下会蒸发,所以需要用冷凝管将蒸发的冷却液蒸汽冷凝回液态,而这些冷凝管通常位于机架的顶部。

以服务器液冷方案厂商Asperitas为例,他们采用了壳牌的浸没式冷却液S5X,这是一种碳氢化合物单相流体,具有极高的冷却效率和流动特性。这种单相流体本身不会蒸发,所以不需要加满,也不需要更换液体,只需要定期对冷却液的性能进行测试即可。

考虑到这类冷却液不少都是液体化合物,不少厂商也在担心其是否会带来一定的火灾隐患。然而,对于大部分浸没式液冷厂商采用的冷却液,在保证其高绝缘性、高流动性和高散热效率的同时,也会保证这类材料的高燃点,所以无需担心点燃的情况。

冷板式液冷

冷板式液冷则是采用液体作为传热介质,在冷板内部通道流动,从而实现热传递的非接触式液体冷却技术。这种方式对于整个服务器芯片等各个组件所需要的改动量较小,可操作性更强,所以也是目前更为成熟的液冷散热方案,在整个液冷服务器中的占比高达80%以上。

尽管在改善能效上,液冷技术提供了足够的优势,在各项方案成熟后也势必会得到大量普及。但基于水的冷却方案依然会消耗不少的水资源,尤其是对于一些水资源紧缺的环境而言。因此,如何控制好液冷方案的水循环就成了最大的挑战。

ZutaCore提供了一种闭环的无水液冷解决方案Hypercool,采用了高效的双相沸腾和冷凝工艺,将大量热量从处理器和服务器中转移走。这是一种直连芯片的冷却方案,也是目前芯片冷却方案中最高效的一种,将冷却剂直接施加到芯片上提取和分散热量。但ZutaCore的这套方案中并没有用到水,所以不用担心设备腐蚀之类的威胁。

wKgaomZgPSaAbMnFAAlQVpXTKE0338.png
无水冷板式液冷 / ZutaCore


据ZutaCore声称,这套液冷方案可以支持1500W以上功耗的处理器,且该方案具有可扩展性。在经过该方案改造后的数据中心中,可以支持100kW以上算力集群的冷却,而且这种热量再利用的设计,可以在任何气候条件下都能达到最低的PUE和最高的能效表现。

在近期戴尔举办的科技全球大会上,ZutaCore展示了基于这一方案打造的绝缘冷板,不仅可以直接适用于英伟达最新的GB200,也可以提供最高120kW的机架冷却功率。据了解,ZutaCore已经和戴尔、华硕、和硕和SuperMicro等行业巨头达成合作,并获得了相关服务器的认证。UNICOM Engineering将成为首个用到HyperCool方案的用户,他们将会把该液冷方案部署在戴尔的XE9680服务器上。

未来的液冷市场期望

从当下的趋势来看,冷板式液冷和单相浸没式液冷还是绝大多数数据中心会选择的方案,决心下血本改造或新建的数据中心,有一定可能会选择单相浸没式液冷。而追求尽可能最小改动就能实现降低能效的数据中心,则会选择更为成熟的冷板式液冷。在液冷服务器越来越普及的当下,受益的不仅是浪潮、戴尔、华为、中科曙光等厂商,上游的接头、CDU和冷却液厂商也将迎来新一波的营收增长。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    13

    文章

    10094

    浏览量

    90880
  • 液冷
    +关注

    关注

    5

    文章

    146

    浏览量

    5682
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    液冷服务器成为AI黄金赛道!华为力挺,两大国际芯片巨头下场

    2024年以来,全球AI液冷服务器快速增长,中国液冷服务器市场进展如何?液冷技术出现哪些主流路线?代表厂商的旗舰产品有哪些?本文进行汇总。
    的头像 发表于 11-27 09:22 5947次阅读
    <b class='flag-5'>液冷</b><b class='flag-5'>服务器</b>成为AI黄金赛道!华为力挺,两大国际芯片巨头下场

    液冷散热时代:AI服务器如何重构磁元件设计

    随着AI服务器功率密度的快速提升,传统的风冷散热方案在热管理方面逐渐面临挑战。在此背景下,液冷散热技术正加速应用于数据中心,特别是高算力的AI集群中。 这一散热方式的变革,并不仅仅是冷却介质的简单
    的头像 发表于 11-21 11:42 176次阅读
    <b class='flag-5'>液冷</b>散热时代:AI<b class='flag-5'>服务器</b>如何重构磁元件设计

    数据中心液冷服务器该配什么样的 UPS 不间断电源?

    在当今数字化飞速发展的时代,数据中心就像是整个数字世界的心脏,承载着海量的数据存储与处理任务。而液冷服务器作为数据中心的核心设备之一,因其高效的散热性能,正越来越广泛地被应用。不过,要保障液冷
    的头像 发表于 08-21 11:01 638次阅读
    数据中心<b class='flag-5'>液冷</b><b class='flag-5'>服务器</b>该配什么样的 UPS 不间断电源?

    新品 | 破局散热困境!捷智算5090 浸没式液冷服务器全新来袭!

    在算力需求呈爆发式增长的当下,服务器硬件适配困难与散热不畅这两大难题,一直困扰着许多用户。不过,曙光已现!捷智算全新推出的5090液冷浸没式服务器,带着硬核技术突破了难题。它究竟藏着哪些让行业瞩目
    的头像 发表于 08-06 17:12 1613次阅读
    新品 | 破局散热困境!捷智算5090 浸没式<b class='flag-5'>液冷</b><b class='flag-5'>服务器</b>全新来袭!

    曙光数创推出液冷数据中心全生命周期定制新服务

    在AI 算力爆发式增长的当下,液冷技术已成为数据中心突破散热瓶颈、支撑高密度算力的必选项。但液冷服务落地面临着多重挑战:服务器选型难匹配、设计院经验与
    的头像 发表于 06-13 14:45 1106次阅读

    高密度ARM服务器的散热设计

    高密度ARM服务器的散热设计融合了硬件创新与系统级优化技术,以应对高集成度下的散热挑战,具体方案如下: 一、核心散热技术方案 高效散热架构‌ 液冷技术主导‌:冷板式液冷方案通过直接接触CPU/GPU
    的头像 发表于 06-09 09:19 558次阅读
    高密度ARM<b class='flag-5'>服务器</b>的散热设计

    信创服务器:时间频率的领导

    信创服务器是当前市场上时间频率的领导。随着科技的不断发展,精准的时间同步对于各行各业的应用场景都变得越来越重要。无论是金融交易、电力系统、通信网络还是科学研究,都需要高精度的时间同步保障系统的正常
    的头像 发表于 05-29 14:59 833次阅读
    信创<b class='flag-5'>服务器</b>:时间频率的领导<b class='flag-5'>者</b>

    服务器和独立服务器的区别在哪?一文读懂如何选择

    面对云服务器与独立服务器的选择,许多人常因概念模糊而纠结。云服务器和独立服务器的区别在于资源分配方式、扩展性及成本结构,选择时需结合业务需求权衡利弊。本文将从两
    的头像 发表于 05-19 10:19 445次阅读

    RAKsmart液冷技术如何实现PUE&lt;1.2的绿色数据中心

    传统数据中心因依赖风冷技术,能源使用效率(PUE)普遍在1.5以上,导致大量电力被用于散热而非计算本身。面对“双碳”目标与可持续发展的紧迫需求,RAKsmart凭借其创新的液冷技术,成功将数据中心的PUE降至1.2以下,为行业树
    的头像 发表于 05-15 09:58 618次阅读

    国外bgp服务器多少钱?# 服务器

    服务器
    jf_57681485
    发布于 :2025年04月24日 14:19:00

    新加坡服务器延迟大吗?真相在这里#新加坡服务器 #服务器

    服务器
    jf_57681485
    发布于 :2025年04月18日 13:48:50

    NTP校时服务器 时钟同步服务器

    服务器
    jf_75250307
    发布于 :2025年03月19日 20:56:34

    AI服务器液冷散热如何实现动态平衡?

      随着AI大模型训练与推理需求的爆发式增长,高功率密度服务器的热管理正面临前所未有的挑战。当GPU集群功率突破20kW/柜时,传统风冷系统的散热效率已逼近物理极限,液冷技术凭借其单位体积散热
    的头像 发表于 03-06 17:32 998次阅读
    AI<b class='flag-5'>服务器</b><b class='flag-5'>液冷</b>散热如何实现动态平衡?

    首个液冷整机柜服务器行业标准发布,兰洋科技核心参编!

    近日,在工信部发布的2024年第28号文件中,由中国信通院牵头制定,超聚变、中国电信、中国联通、中国移动、兰洋科技等单位核心参编的《冷板式液冷整机柜服务器技术要求和测试方法》(标准编号YD
    的头像 发表于 12-16 14:30 898次阅读
    首个<b class='flag-5'>液冷</b>整机柜<b class='flag-5'>服务器</b>行业标准发布,兰洋科技核心参编!