0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

液冷技术新趋势-AI服务器微通道水冷板(MLCP)质量保证

海阔天空的专栏 来源:厂商供稿 作者:厂商供稿 2025-11-21 15:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

640 (55).jpg

生成式 AI 的高速发展推动算力需求持续攀升,进而带动芯片功耗显著上涨。英伟达下一代 Rubin/Rubin Ultra 芯片的功耗预计将大幅提升,从当前 GB300 芯片的 1400W 突破至 2000W 以上。然而,当前主流的单相冷板方案存在明显瓶颈,其散热能力上限约为 1500W,已难以满足 Rubin 系列算力芯片的散热需求。这一供需差推动液冷技术加速迭代,具备更强散热能力的两相式冷板与微通道水冷板Micro-Channel Liquid Cooling Plate(MLCP)为解决超高功耗芯片散热问题而指定的技术路径,正成为更具潜力的解决方案。

(来源WCCFTECH NVIDIA Might Switch Up Cooling Solutions With Next-Gen Rubin Ultra as It Battles Thermal Constraints)

当前液冷与MLCP液冷技术趋势

当前算力芯片主流液冷方案为单相冷板,其核心原理是使用高沸点水基冷却液,在换热过程中不发生相变。在材质与结构设计上,冷板基材以高导热性的铜为主和部分铝制,整体由热源对接面、内部流道及进出液结构构成;内部流道宽度通常在 0.1 毫米至数毫米之间,且设计翅片结构以提升散热效率。

但传统单相冷板方案存在三大明显局限:

  1. 热阻较高,多层热界面材料叠加会导致热阻累积,影响热量传导效率;
  2. 流道为毫米级尺寸,冷却液流速相对较慢,进而拉低整体换热效率;
  3. 难以实现芯片表面温度均匀分布,局部易出现高温点。

因此,尽管传统冷板方案的散热效率较风冷有显著提升,但面对 1500-2000W 乃至更高的散热需求时,其效率已显不足,无法完全满足高功耗芯片的散热要求。

(来源:数据中心液冷技术的应用研究进展)

与传统冷板相比,MLCP 通过精密蚀刻技术加工出微米级(10-1000 微米)的狭窄水道,而传统冷板的流道宽度通常在 1-3 毫米。MLCP的设计极大拓展散热面积,使冷却液与热源的接触面积较传统方案提升 10 倍以上,为高效散热奠定基础。

同时,微通道内冷却液的流动状态也发生了根本性改变。在微米级空间中,流体呈层流状态分布,热边界层厚度大幅减薄,热交换效率随之显著提高,其换热系数可达传统液冷方案的 2-3 倍,能更快带走芯片产生的高热量。

MLCP还有个核心优势是高度集成。传统散热要经过芯片、导热材料(TIM)、金属盖(IHS)、另一层导热材料(TIM),最后才到水冷板,一层一层的界面会让热阻堆起来。但 MLCP 技术把芯片金属盖(IHS)和水冷板做成了一个整体,中间的界面和导热材料都省掉了。这样一来,冷却液能更靠近芯片表面,热传递的路径短了一半还多,整体热阻也大大降低。

(来源:液冷产业链:微通道水冷版(MLCP)方案介绍)

但液冷板量产仍面临显著工艺挑战。微米级水道的加工精度要求极高,实际生产中,微米级水道的加工难度、液体渗透率的精准控制以及规模化生产的良率提升,都是需要突破的关键环节。若任一工艺环节出现偏差,都可能引发漏液、散热不均等问题,直接影响产品性能与可靠性。

尽管 MLCP 技术前景广阔,但目前仍处于 “测试验证期”,距离量产至少需要 3-4 个季度,核心瓶颈在于液体渗透与泄露:一次失误即 “百万损失”。因为MLCP 的冷却液直接接触芯片,一旦密封件老化或微通道破损,泄漏的液体可能瞬间摧毁价值数十万至数百万美元的服务器。在服务器 5-8 年的使用寿命中,如何保证密封材料的完整性、避免长期使用后的渗透风险,是生产商需突破的首要难题。

质量挑战1 翅片弯折

MLCP 微通道制造过程(如蚀刻、冲压、焊接)中的工艺控制不当,或组装时的外力冲击。内部翅片弯折会直接导致以下影响:

  1. 破坏微通道流道的均匀性,造成冷却液局部流速异常,降低换热效率,甚至引发芯片局部过热;
  2. 严重弯折可能堵塞部分流道,进一步加剧散热瓶颈,同时增加冷却液循环系统的压降,影响整体运行稳定性。
  3. ZEISS METROTOM蔡司高分辨率无损扫描技术,精准识别内部翅片的弯折位置与程度,避免常规检测遗漏的隐患。
    640 (38).png

▲图示为翅片弯折

质量挑战2**** 微通道堵塞

MLCP 的微通道宽度仅 50-150μm(约为传统流道的 1/10),直接承担芯片热量交换功能,堵塞会从散热性能、系统可靠性到成本控制形成连锁,形成以下负面影响:

  1. 散热效率骤降,触发芯片故障堵塞会压缩冷却液流通截面,导致局部流速异常、换热面积锐减,直接打破MLCP低至 0.03℃・cm²/W的低阻散热优势。堵塞区域的热量无法及时传递,会引发芯片局部过热,轻则触发降频、性能衰减,重则导致芯片烧毁;
  2. 系统压力失衡,加剧设备损耗微通道堵塞会导致冷却液循环阻力激增,迫使水泵负载升高以维持流量,不仅增加能耗,还会加速泵体老化;
  3. 长期可靠性存隐忧即使是微小堵塞,也可能成为杂质堆积的“核心”,在长期运行中逐渐扩大堵塞范围;同时,堵塞区域的局部高温会加速材料老化,增加通道腐蚀、开裂风险,缩短 MLCP 5-8 年的设计使用寿命。

ZEISS METROTOM蔡司高分辨率无损扫描技术,具备较大的行程,同等尺寸的工件可以实现更大的放大倍率,获取更高分辨的图像,即使是微小的堵塞也不会放过,精确定位堵塞区域。

640 (39).png

640 (40).png

图示为放大倍率逐渐增加,微通道堵塞

640 (41).png

蔡司拥有丰富的产品线包含显微镜,蓝光扫描仪,三坐标,工业CT,助力全面解决电子客户面临质量挑战与痛点。

640 (56).jpg

640 (57).jpg

640 (58).jpg

640 (59).jpg

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 蔡司
    +关注

    关注

    0

    文章

    170

    浏览量

    8156
  • AI服务器
    +关注

    关注

    3

    文章

    159

    浏览量

    5485
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    液冷服务器成为AI黄金赛道!华为力挺,两大国际芯片巨头下场

    2024年以来,全球AI液冷服务器快速增长,中国液冷服务器市场进展如何?液冷
    的头像 发表于 11-27 09:22 5954次阅读
    <b class='flag-5'>液冷</b><b class='flag-5'>服务器</b>成为<b class='flag-5'>AI</b>黄金赛道!华为力挺,两大国际芯片巨头下场

    液冷散热时代:AI服务器如何重构磁元件设计

    替换,它正驱动着服务器电源架构及内部磁性元器件的设计逻辑发生深刻变化,这种散热方式也对磁性材料提出更高的要求。本文将从产业现状出发,探讨液冷趋势如何重构电源与磁性元件的设计重心与技术
    的头像 发表于 11-21 11:42 177次阅读
    <b class='flag-5'>液冷</b>散热时代:<b class='flag-5'>AI</b><b class='flag-5'>服务器</b>如何重构磁元件设计

    台积电CoWoS平台通道芯片封装液冷技术的演进路线

    台积电在先进封装技术,特别是CoWoS(Chip on Wafer on Substrate)平台上的通道芯片液冷技术路线,是其应对高性能
    的头像 发表于 11-10 16:21 1868次阅读
    台积电CoWoS平台<b class='flag-5'>微</b><b class='flag-5'>通道</b>芯片封装<b class='flag-5'>液冷</b><b class='flag-5'>技术</b>的演进路线

    赋能电子质量保证,蔡司电子行业解决方案全攻略(手册下载)

    全球电子行业正以前所未有的速度增长,消费电子,通信电子以及汽车电子的增长引擎再次将新应用新趋势推向更广阔的领域。 在消费电子领域正迎来技术融合与体验升级的新浪潮,AI终端的爆发增长,AIPC以及
    的头像 发表于 10-30 10:52 262次阅读
    赋能电子<b class='flag-5'>质量保证</b>,蔡司电子行业解决方案全攻略(手册下载)

    液冷液冷技术的关键角色

    冷却液体与发热器件不直接接触,冷板式液冷便是其中典型代表。   冷板式液冷方案解析   冷板式液冷采用通道强化换热
    的头像 发表于 10-13 08:37 1.1w次阅读

    液冷服务器驱动,eSSD用上冷冷却技术

    电子发烧友网综合报道,近日,Solidigm宣布率先推出用于无风扇服务器环境的冷冷却企业级SSD(eSSD)。   SolidigmD7-PS1010E1.SSSD率先引入了单面直触芯片液冷
    的头像 发表于 09-28 09:09 6367次阅读
    <b class='flag-5'>液冷</b><b class='flag-5'>服务器</b>驱动,eSSD用上冷<b class='flag-5'>板</b>冷却<b class='flag-5'>技术</b>

    AI芯片冷却技术,正在成为关键

    ,旨在解决未来新一代GPU等芯片的散热问题。   MLCP的全称为Micro-Laminar Cold Plate,是一种高度集成的通道液冷解决方案。它源于NVIDIA对
    发表于 09-20 00:36 1611次阅读

    数据中心液冷服务器该配什么样的 UPS 不间断电源?

    在当今数字化飞速发展的时代,数据中心就像是整个数字世界的心脏,承载着海量的数据存储与处理任务。而液冷服务器作为数据中心的核心设备之一,因其高效的散热性能,正越来越广泛地被应用。不过,要保障液冷
    的头像 发表于 08-21 11:01 641次阅读
    数据中心<b class='flag-5'>液冷</b><b class='flag-5'>服务器</b>该配什么样的 UPS 不间断电源?

    激光焊接技术在焊接水冷工艺中的应用

    摩擦焊等存在诸多问题,难以满足现代工业对水冷质量焊接的需求。激光焊接技术凭借其独特的优势,在水冷
    的头像 发表于 05-27 15:14 515次阅读
    激光焊接<b class='flag-5'>技术</b>在焊接<b class='flag-5'>水冷</b><b class='flag-5'>板</b>工艺中的应用

    大功率AI服务器PSU的革新之路

    控制策略在交错TTP PFC中扮演着重要角色。它是如何从AI服务器电源发展趋势出发,凭借独特的技术优势,为AI
    的头像 发表于 03-10 15:07 1776次阅读
    大功率<b class='flag-5'>AI</b><b class='flag-5'>服务器</b>PSU的革新之路

    AI服务器液冷散热如何实现动态平衡?

      随着AI大模型训练与推理需求的爆发式增长,高功率密度服务器的热管理正面临前所未有的挑战。当GPU集群功率突破20kW/柜时,传统风冷系统的散热效率已逼近物理极限,液冷技术凭借其单位
    的头像 发表于 03-06 17:32 999次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>服务器</b><b class='flag-5'>液冷</b>散热如何实现动态平衡?

    铸就AI服务器质量动脉 – 高速背板连接新趋势(三)

    在这个AI技术日新月异的时代,AI服务器作为智能计算的强大引擎,正以前所未有的速度推动着各行各业的发展。而在这背后,每一个细微的组件都承载着保障系统稳定运行的重任。今天,就让我们一起走
    发表于 01-03 14:32 854次阅读
    铸就<b class='flag-5'>AI</b><b class='flag-5'>服务器</b><b class='flag-5'>质量</b>动脉 – 高速背板连接<b class='flag-5'>器</b><b class='flag-5'>新趋势</b>(三)

    铸就AI服务器质量动脉 – 高速背板连接新趋势(一)

    连接需具备极高的传输速率、稳定性和可靠性,以确保AI服务器内部及与其他设备间能够无缝、高效地交换海量数据,从而充分释放AI算力的潜能。因此,研发和生产满足这些要求的高速连接
    发表于 12-25 14:31 847次阅读
    铸就<b class='flag-5'>AI</b><b class='flag-5'>服务器</b><b class='flag-5'>质量</b>动脉 – 高速背板连接<b class='flag-5'>器</b><b class='flag-5'>新趋势</b>(一)

    铸就AI服务器质量动脉 – 高速背板连接新趋势(二)

    AI服务器算力潜能的密钥:攻克互联瓶颈,聚焦高速背板连接创新。 在数据洪流向56G、112G乃至224G的新纪元迸发,高速背板连接的角色跃升为核心舞台的璀璨明星。它们不仅是数据传输
    发表于 12-25 14:03 1006次阅读
    铸就<b class='flag-5'>AI</b><b class='flag-5'>服务器</b><b class='flag-5'>质量</b>动脉 – 高速背板连接<b class='flag-5'>器</b><b class='flag-5'>新趋势</b>(二)

    首个液冷整机柜服务器行业标准发布,兰洋科技核心参编!

    /T6049-2024)正式发布,该标准为首个液冷整机柜服务器领域的行业标准。随着AI、大数据、云计算等新一代信息技术发展,数据中心算力规模持续高速增长,能耗随之急剧扩张。
    的头像 发表于 12-16 14:30 898次阅读
    首个<b class='flag-5'>液冷</b>整机柜<b class='flag-5'>服务器</b>行业标准发布,兰洋科技核心参编!