0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

液冷技术新趋势-AI服务器微通道水冷板(MLCP)质量保证

海阔天空的专栏 来源:厂商供稿 作者:厂商供稿 2025-11-21 15:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

640 (55).jpg

生成式 AI 的高速发展推动算力需求持续攀升,进而带动芯片功耗显著上涨。英伟达下一代 Rubin/Rubin Ultra 芯片的功耗预计将大幅提升,从当前 GB300 芯片的 1400W 突破至 2000W 以上。然而,当前主流的单相冷板方案存在明显瓶颈,其散热能力上限约为 1500W,已难以满足 Rubin 系列算力芯片的散热需求。这一供需差推动液冷技术加速迭代,具备更强散热能力的两相式冷板与微通道水冷板Micro-Channel Liquid Cooling Plate(MLCP)为解决超高功耗芯片散热问题而指定的技术路径,正成为更具潜力的解决方案。

(来源WCCFTECH NVIDIA Might Switch Up Cooling Solutions With Next-Gen Rubin Ultra as It Battles Thermal Constraints)

当前液冷与MLCP液冷技术趋势

当前算力芯片主流液冷方案为单相冷板,其核心原理是使用高沸点水基冷却液,在换热过程中不发生相变。在材质与结构设计上,冷板基材以高导热性的铜为主和部分铝制,整体由热源对接面、内部流道及进出液结构构成;内部流道宽度通常在 0.1 毫米至数毫米之间,且设计翅片结构以提升散热效率。

但传统单相冷板方案存在三大明显局限:

  1. 热阻较高,多层热界面材料叠加会导致热阻累积,影响热量传导效率;
  2. 流道为毫米级尺寸,冷却液流速相对较慢,进而拉低整体换热效率;
  3. 难以实现芯片表面温度均匀分布,局部易出现高温点。

因此,尽管传统冷板方案的散热效率较风冷有显著提升,但面对 1500-2000W 乃至更高的散热需求时,其效率已显不足,无法完全满足高功耗芯片的散热要求。

(来源:数据中心液冷技术的应用研究进展)

与传统冷板相比,MLCP 通过精密蚀刻技术加工出微米级(10-1000 微米)的狭窄水道,而传统冷板的流道宽度通常在 1-3 毫米。MLCP的设计极大拓展散热面积,使冷却液与热源的接触面积较传统方案提升 10 倍以上,为高效散热奠定基础。

同时,微通道内冷却液的流动状态也发生了根本性改变。在微米级空间中,流体呈层流状态分布,热边界层厚度大幅减薄,热交换效率随之显著提高,其换热系数可达传统液冷方案的 2-3 倍,能更快带走芯片产生的高热量。

MLCP还有个核心优势是高度集成。传统散热要经过芯片、导热材料(TIM)、金属盖(IHS)、另一层导热材料(TIM),最后才到水冷板,一层一层的界面会让热阻堆起来。但 MLCP 技术把芯片金属盖(IHS)和水冷板做成了一个整体,中间的界面和导热材料都省掉了。这样一来,冷却液能更靠近芯片表面,热传递的路径短了一半还多,整体热阻也大大降低。

(来源:液冷产业链:微通道水冷版(MLCP)方案介绍)

但液冷板量产仍面临显著工艺挑战。微米级水道的加工精度要求极高,实际生产中,微米级水道的加工难度、液体渗透率的精准控制以及规模化生产的良率提升,都是需要突破的关键环节。若任一工艺环节出现偏差,都可能引发漏液、散热不均等问题,直接影响产品性能与可靠性。

尽管 MLCP 技术前景广阔,但目前仍处于 “测试验证期”,距离量产至少需要 3-4 个季度,核心瓶颈在于液体渗透与泄露:一次失误即 “百万损失”。因为MLCP 的冷却液直接接触芯片,一旦密封件老化或微通道破损,泄漏的液体可能瞬间摧毁价值数十万至数百万美元的服务器。在服务器 5-8 年的使用寿命中,如何保证密封材料的完整性、避免长期使用后的渗透风险,是生产商需突破的首要难题。

质量挑战1 翅片弯折

MLCP 微通道制造过程(如蚀刻、冲压、焊接)中的工艺控制不当,或组装时的外力冲击。内部翅片弯折会直接导致以下影响:

  1. 破坏微通道流道的均匀性,造成冷却液局部流速异常,降低换热效率,甚至引发芯片局部过热;
  2. 严重弯折可能堵塞部分流道,进一步加剧散热瓶颈,同时增加冷却液循环系统的压降,影响整体运行稳定性。
  3. ZEISS METROTOM蔡司高分辨率无损扫描技术,精准识别内部翅片的弯折位置与程度,避免常规检测遗漏的隐患。
    640 (38).png

▲图示为翅片弯折

质量挑战2**** 微通道堵塞

MLCP 的微通道宽度仅 50-150μm(约为传统流道的 1/10),直接承担芯片热量交换功能,堵塞会从散热性能、系统可靠性到成本控制形成连锁,形成以下负面影响:

  1. 散热效率骤降,触发芯片故障堵塞会压缩冷却液流通截面,导致局部流速异常、换热面积锐减,直接打破MLCP低至 0.03℃・cm²/W的低阻散热优势。堵塞区域的热量无法及时传递,会引发芯片局部过热,轻则触发降频、性能衰减,重则导致芯片烧毁;
  2. 系统压力失衡,加剧设备损耗微通道堵塞会导致冷却液循环阻力激增,迫使水泵负载升高以维持流量,不仅增加能耗,还会加速泵体老化;
  3. 长期可靠性存隐忧即使是微小堵塞,也可能成为杂质堆积的“核心”,在长期运行中逐渐扩大堵塞范围;同时,堵塞区域的局部高温会加速材料老化,增加通道腐蚀、开裂风险,缩短 MLCP 5-8 年的设计使用寿命。

ZEISS METROTOM蔡司高分辨率无损扫描技术,具备较大的行程,同等尺寸的工件可以实现更大的放大倍率,获取更高分辨的图像,即使是微小的堵塞也不会放过,精确定位堵塞区域。

640 (39).png

640 (40).png

图示为放大倍率逐渐增加,微通道堵塞

640 (41).png

蔡司拥有丰富的产品线包含显微镜,蓝光扫描仪,三坐标,工业CT,助力全面解决电子客户面临质量挑战与痛点。

640 (56).jpg

640 (57).jpg

640 (58).jpg

640 (59).jpg

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 蔡司
    +关注

    关注

    0

    文章

    203

    浏览量

    8270
  • AI服务器
    +关注

    关注

    3

    文章

    199

    浏览量

    5580
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI服务器PCBA加工技术解析:高算力时代的核心制造能力

    AI服务器PCBA加工 是AI服务器硬件制造的重要环节,也是支撑人工智能算力基础设施的重要技术能力。随着大模型训练和数据中心建设加速,
    的头像 发表于 04-16 22:57 248次阅读

    服务器发展趋势:迎接数字时代新变革

    在当今数字化浪潮中,服务器作为数字基础设施的核心,正经历着深刻而持久的变革。随着云计算、人工智能、边缘计算等新兴技术的崛起,服务器的发展呈现出诸多引人瞩目的趋势。01
    的头像 发表于 03-19 16:58 338次阅读
    <b class='flag-5'>服务器</b>发展<b class='flag-5'>趋势</b>:迎接数字时代新变革

    高端AI服务器液冷系统:压力传感的精度与稳定性选型逻辑解析

    随着AI技术的快速迭代,高端AI服务器(智算中心、大模型训练集群)的算力密度持续提升,液冷系统已成为保障其稳定运行的核心散热方案。压力传感
    的头像 发表于 03-12 12:46 872次阅读

    NTC温度传感液冷服务器散热故障的防线

    随着云计算、AI训练等高算力场景发展,液冷服务器因出色散热效率成为数据中心、AI计算中心的散热方案优选。温度作为影响液冷
    的头像 发表于 03-12 11:45 458次阅读

    液冷服务器温控揭秘,NTC温度传感的应用

    在人工智能爆发式增长的推动下,数据中心热管理正面临前所未有的挑战。为有效降低数据中心运行过程中的热功耗,液冷服务器应运而生。同时,为满足液冷环境下对CPU、GPU、电池模组等关键部件的实时温度监测需求,
    的头像 发表于 03-06 15:18 485次阅读
    <b class='flag-5'>液冷</b><b class='flag-5'>服务器</b>温控揭秘,NTC温度传感<b class='flag-5'>器</b>的应用

    英伟达通道液冷技术全解析:原理、工艺、优势与产业适配

    随着AI算力的爆发式增长,英伟达Rubin架构GPU等高端芯片的单芯片功耗已逼近2.2kW(2026年最新实测数据),局部热点热流密度最高可达650W/cm²,传统风冷彻底退场,单相液冷也逐渐捉襟见肘。
    的头像 发表于 02-14 08:19 2281次阅读
    英伟达<b class='flag-5'>微</b><b class='flag-5'>通道</b><b class='flag-5'>液冷</b><b class='flag-5'>板</b><b class='flag-5'>技术</b>全解析:原理、工艺、优势与产业适配

    液冷服务器系统架构设计案例分享

    服务器的全液冷,一般都需要液冷覆盖CPU、内存(DIMM)、硬盘(SSD)、电源、IO以及其他SOC的散热。今天给大家分享一款浪潮的全液冷
    的头像 发表于 01-27 15:33 943次阅读
    全<b class='flag-5'>液冷</b><b class='flag-5'>服务器</b>系统架构设计案例分享

    液冷重塑AI服务器电源?对材料器件有何要求

    随着AI服务器功率密度持续攀升,传统风冷方案正逐步逼近极限。单机柜功率从过去的二三十千瓦,快速跃升至如今的几百千瓦,对散热提出了极致要求。高热流密度使散热系统成为制约服务器性能释放的关键瓶颈。在这一背景下,
    的头像 发表于 12-13 16:46 2006次阅读
    <b class='flag-5'>液冷</b>重塑<b class='flag-5'>AI</b><b class='flag-5'>服务器</b>电源?对材料器件有何要求

    液冷服务器成为AI黄金赛道!华为力挺,两大国际芯片巨头下场

    2024年以来,全球AI液冷服务器快速增长,中国液冷服务器市场进展如何?液冷
    的头像 发表于 11-27 09:22 7739次阅读
    <b class='flag-5'>液冷</b><b class='flag-5'>服务器</b>成为<b class='flag-5'>AI</b>黄金赛道!华为力挺,两大国际芯片巨头下场

    液冷散热时代:AI服务器如何重构磁元件设计

    替换,它正驱动着服务器电源架构及内部磁性元器件的设计逻辑发生深刻变化,这种散热方式也对磁性材料提出更高的要求。本文将从产业现状出发,探讨液冷趋势如何重构电源与磁性元件的设计重心与技术
    的头像 发表于 11-21 11:42 1312次阅读
    <b class='flag-5'>液冷</b>散热时代:<b class='flag-5'>AI</b><b class='flag-5'>服务器</b>如何重构磁元件设计

    台积电CoWoS平台通道芯片封装液冷技术的演进路线

    台积电在先进封装技术,特别是CoWoS(Chip on Wafer on Substrate)平台上的通道芯片液冷技术路线,是其应对高性能
    的头像 发表于 11-10 16:21 3933次阅读
    台积电CoWoS平台<b class='flag-5'>微</b><b class='flag-5'>通道</b>芯片封装<b class='flag-5'>液冷</b><b class='flag-5'>技术</b>的演进路线

    赋能电子质量保证,蔡司电子行业解决方案全攻略(手册下载)

    全球电子行业正以前所未有的速度增长,消费电子,通信电子以及汽车电子的增长引擎再次将新应用新趋势推向更广阔的领域。 在消费电子领域正迎来技术融合与体验升级的新浪潮,AI终端的爆发增长,AIPC以及
    的头像 发表于 10-30 10:52 771次阅读
    赋能电子<b class='flag-5'>质量保证</b>,蔡司电子行业解决方案全攻略(手册下载)

    液冷液冷技术的关键角色

    冷却液体与发热器件不直接接触,冷板式液冷便是其中典型代表。   冷板式液冷方案解析   冷板式液冷采用通道强化换热
    的头像 发表于 10-13 08:37 1.5w次阅读
    <b class='flag-5'>液冷</b><b class='flag-5'>板</b>:<b class='flag-5'>液冷</b><b class='flag-5'>技术</b>的关键角色

    液冷服务器驱动,eSSD用上冷冷却技术

    电子发烧友网综合报道,近日,Solidigm宣布率先推出用于无风扇服务器环境的冷冷却企业级SSD(eSSD)。   SolidigmD7-PS1010E1.SSSD率先引入了单面直触芯片液冷
    的头像 发表于 09-28 09:09 7349次阅读
    <b class='flag-5'>液冷</b><b class='flag-5'>服务器</b>驱动,eSSD用上冷<b class='flag-5'>板</b>冷却<b class='flag-5'>技术</b>

    AI芯片冷却技术,正在成为关键

    ,旨在解决未来新一代GPU等芯片的散热问题。   MLCP的全称为Micro-Laminar Cold Plate,是一种高度集成的通道液冷解决方案。它源于NVIDIA对
    发表于 09-20 00:36 2218次阅读