0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI驱动产业革新 | 芯片散热从风冷到液冷

向欣电子 2024-07-27 08:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

一、芯片散热概览:功耗升级、散热技术持续革新

电子设备发热的本质原因就是工作能量转化为热能的过程。散热是为解决高性能计算设备中的热管理问题而设计的,它们通过直接在芯片或处理器表面移除热量来优化设备性能并延长使用寿命。随着芯片功耗的提升,散热技术从一维热管的线式均温,到二维VC的平面均温,发展到三维的一体式均温,即3D VC技术路径,最后发展到液冷技术。

二、主要散热技术:从风冷到液冷,冷板到浸没式

散热技术包括风冷与液冷两类。风冷技术中,热管与VC的散热能力较低,3D VC散热上限扩至1000W,均需搭配风扇进行散热,技术简单、便宜,

适用于大多数设备。液冷技术具备更高散热效率,包括冷板式与浸没式两类,其中冷板式为间接冷却,初始投资中等,运维成本较低,相对成熟,英伟达GB200 NVL72采用冷板式液冷解决方案;浸没式为直接冷却,技术要求较高,运营维护成本较高,曙光数创研发“1拖2”双相浸没液冷结构。

三、性能+TCO多重驱动,散热市场规模持续向上

AI大模型训推对芯片算力提出更高要求,提升单芯片功耗。芯片温度影响性能,当芯片工作温度近70-80℃ 时,温度每升高2℃,芯片性能会降低约

10%,故单芯片功耗增长进一步提升散热需求。此外,英伟达B200功耗超1000W、接近风冷散热上限;“双碳”+东数西算等政策严格数据中心PUE要求,液冷平均PUE低于风冷;TCO方面,相比风冷,冷板液冷的初始投资成本接近风冷,并且后续运行成本更低。

9994f692-4bac-11ef-817b-92fbcf53809c.png

1.1 芯片散热起源:电子设备发热的本质是工作能量转成热能

● 电子设备发热的本质原因就是工作能量转化为热能的过程。芯片作为电子设备的核心部件,其基本工作原理是将电信号转化为各 种功能信号,实现数据处理、存储和传输等功能。而芯片在完成这些功能的过程中,会产生大量热量,这是因为电子信号的传输 会伴随电阻电容、电感等能量损耗,这些损耗会被转化为热能。

● 温度过高会影响电子设备工作性能,甚至导致电子设备损坏。据《电子芯片散热技术的研究现状及发展前景》,如对于稳定持续 工作的电子芯片,最高温度不能超过85 ℃,温度过高会导致芯片损坏。

● 散热技术需要持续升级,来控制电子设备的运行温度。芯片性能持续发展,这提升了芯片功耗,也对散热技术提出了更高的要求。此外,AI大模型的训练与推理需求,要求AI芯片的单卡算力提升,有望进一步打开先进散热技术的成长空间。

99addb62-4bac-11ef-817b-92fbcf53809c.png

来源:CSDN,各公司官网,国海证券研究

1.2 散热技术原理:电子设备发热的本质是工作能量转成热能

99d88db2-4bac-11ef-817b-92fbcf53809c.png

资料来源:双鸿公告,飞荣达官网,国海证券研究所

99efc2de-4bac-11ef-817b-92fbcf53809c.png

资料来源:uanalyze,国海证券研究所

1.3 芯片散热革新:浸没式散热效果好,冷板式更为成熟

根据ODCC《冷板液冷服务器设计白皮书》,综合考量初始投资成本、可维护性、PUE 效果以及产业成熟度等 因素,冷板式和单相浸没式相较其他液冷技术更有优势,是当前业界的主流解决方案。

9a17d1de-4bac-11ef-817b-92fbcf53809c.png

资料来源:《冷板液冷服务器设计白皮书》,国海证券研究

9a315b86-4bac-11ef-817b-92fbcf53809c.png

2.1.1 热管:高效传热器件,适用大功率和空间小场景

9a431b32-4bac-11ef-817b-92fbcf53809c.png

来源:分析测试百科网,Tom's Hardware,兰洋科技,国海证券研究

2.1.2 VC:相比热管,具备更高的导热效率与灵活性

VC均温板,全称为Vapor Chamber,即真空腔均热板散热技术,是一种比热管更先进、更高效的导热元件, 尤其在处理高密度电子设备的热管理问题时表现出色。

相比热管,VC的导热效率与灵活度更强。铜的导热系数为401W/m.k,热管可以达到5000~8000 W/m‧k,而均 热板则可以达到20000~10000W/m‧k,甚至更高。热管是一维导热,受其形状显示。而均热板形状则不受限制, 可以根据芯片的布局,设计任意形状,甚至可以兼容处于不同高度的多个热源的散热。

9a656f70-4bac-11ef-817b-92fbcf53809c.png

2.1.2 3D VC:具备高效散热、均匀温度分布、减少热点优势

● 3D VC(三维两相均温技术):是利用热管与均温板蒸汽腔体贯通的散热技术。

● 3D VC具有“高效散热、均匀温度分布、减少热点”等解热优势,可满足大功率器件解热、高热流密度区域均温的瓶颈需求,也 可以保证获得更强的超频性能以及超频后的系统稳定性。

● 对比热管/均温板间导热,是把热量传递至二次组装的多根热管/均温板,存在接触热阻以及铜本身的热阻;而3D VC通过三维结 构连通下,内部液体相变、热扩散,直接、高效地将芯片热量传递至齿片远端散热。

2.1.3 风扇:与热管/3DVC/冷管等组合使用

9aae0050-4bac-11ef-817b-92fbcf53809c.png

2.1.4 机房空调:水冷空调相对风冷系统制冷效果好

9ad1b5fe-4bac-11ef-817b-92fbcf53809c.png

来源:前瞻产业研究院,LEDC,制冷百科,国海证券研究所

2.1.4 机房空调:氟泵系统与间接蒸发系统较为稳定

● 氟泵系统:一种用于制冷和空调设备中的循环系统,它通过泵送氟利昂或其它制冷剂来传递热量。主要优点是可以精确控制制冷 剂的流量和压力,从而提高系统的效率和稳定性。

● 间接蒸发系统:是一种利用水蒸发吸热原理来降低空气温度的空调系统,它与直接蒸发冷却系统不同之处在于,冷却的空气与蒸 发的水不直接接触。这种设计可以提供比直接蒸发冷却更为清洁和干燥的空气,适用于对湿度和空气质量有特殊要求的环境

9af6c470-4bac-11ef-817b-92fbcf53809c.png

来源:制冷百科,凯德利

9b14a6de-4bac-11ef-817b-92fbcf53809c.png

2.2 液冷:冷板式与浸没式液冷为主

● 服务器液冷分为直接冷却和间接冷却,直接冷却以浸没式为主,间接冷却以冷板式为主。

● 冷板式液冷的冷却液不与服务器元器件直接接触,而是通过冷板进行换热,所以称之为间接液冷。依据冷却液在 冷板中是否发生相变,分为单相冷板式液冷及两相冷板式液冷。

● 浸没式液冷是将整个服务器或其组件直接浸入液体冷却剂中的冷却方式

9b311fa8-4bac-11ef-817b-92fbcf53809c.png

来源:《冷板液冷标准化及技术优化白皮书》等

2.2.1 冷板式液冷:需改造服务器,渗透率逐渐提升

9b4bf670-4bac-11ef-817b-92fbcf53809c.png

2.2.1 冷板式液冷:英伟达GB200 NVL72使用冷板式液冷结构

9b6b9d68-4bac-11ef-817b-92fbcf53809c.png

2.2.2 浸没式液冷:液体浸泡服务器整体,技术要求高

9b90f676-4bac-11ef-817b-92fbcf53809c.png

2.2.2 单相浸没:实现服务器全液冷,技术难度较高

● 单相浸没液冷机柜:是将液冷服务器内置于Tank内部,CDU与Tank之间由管道链接,下部管道输送低温冷却介质到tank内,液 冷介质吸收了液冷服务器的热量,温度上升后流回CDU,热量由CDU带走。此种结构可实现服务器的全液冷,无风扇的设计使 功率密度更高,相比风冷PUE更低。但技术难度较高,渗透率相对较低。

● 阿里云布局浸没式液冷系统:2016年,阿里云发布首套浸没式液冷系统,于2017年完成浸没式液冷集群构建;2018年,建成首 个互联网液冷数据中心;2020年,打造中国最大规模的单相浸没式液冷数据中心暨全国首座5A级绿色液冷数据中心。

9bb83d3a-4bac-11ef-817b-92fbcf53809c.png

来源:Intel官网,《绿色节能液冷数据中心白皮书》,国海证券研究

2.2.2 双相浸没:技术要求较高,可大幅提升系统功率密度

● 双相浸没液冷服务器结构(以曙光数创技术为例):

● 1)“1拖2”单元结构:由中间CDM液冷柜和左右两侧计算机柜构成。两侧机柜内服务器产生的热量由中间CDM液冷机柜带走。中间液冷柜内集成CDM、循环管路等系统。此种结构可以大幅度提升系统功率密度,降低数据中心建设难度。

● 2)刀片式相变浸没腔:独立可插拔设计,完全解耦节点与节点之间的热循环路径,使得每一个节点都可以进行独立的插拔,方 便用户对单独的节点进行硬件升级或维护。

● 3)芯片强化沸腾散热设计:由于服务器内主芯片功率较高,芯片表面需要进行强化沸腾处理,以增加其表面的气化核心,增强 相变换热效率。曙光数创的浸没相变液冷数据中心基础设施产品对芯片采用了强化沸腾封装的方式,换热区域采用高密翅片来强 化沸腾界面的沸腾换热,最高可实现100W/c㎡以上的散热密度。

9bd40f38-4bac-11ef-817b-92fbcf53809c.png

来源:《绿色节能液冷数据中心白皮书

AI算力发展与政策PUE等驱动下,芯片级散热将从热管/VC转向更高效的3DVC与冷板,芯片级散热有望打开成长空间、迎量价齐升。

相关公司

1)芯片散热:曙光数创、飞荣达、中航光电、立讯精密、中石科技、思泉新材;

2)数据中心散热:英维克、高澜股份、申菱环境、佳力图、朗威股份、依米康、同飞股份、川润股份、润泽科技、科华数据、网宿科技;

3)服务器整机:浪潮信息、中科曙光、工业富联、华勤技术、紫光股份、中兴通讯、软通动力、神州数码、烽火通信、中国长城等。

9bf82dc8-4bac-11ef-817b-92fbcf53809c.png

来源:国海证券研究所

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    42023

    浏览量

    303094
  • 芯片散热
    +关注

    关注

    0

    文章

    13

    浏览量

    7787
  • 液冷
    +关注

    关注

    5

    文章

    189

    浏览量

    5809
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    蓝耘科技携手曙光数创打造智算中心风改液新标杆

    风冷技术主导数据中心存量机房的当下,席卷而来的高密算力与AI浪潮使传统风冷已触及散热边界,液冷已然成为数据中心绿色升级的必然路径。在这一趋
    的头像 发表于 05-09 15:38 318次阅读

    【技术贴】液冷散热新选择:艾为AW86320 深度解析:高压强驱 + 超低功耗

    5G与AI技术井喷式发展,设备算力需求激增,传统石墨烯、VC(VaporChamber)等被动散热已难敌高功耗发热。液冷散热驱动凭借主动温控
    的头像 发表于 04-28 19:03 283次阅读
    【技术贴】<b class='flag-5'>液冷</b><b class='flag-5'>散热</b>新选择:艾为AW86320 深度解析:高压强驱 + 超低功耗

    液冷系统的“感知层”:传感器如何保障散热可靠性与运行安全

    液冷技术正从数据中心走向储能、超算、高功率电力电子等众多领域。与传统风冷相比,液冷的热传输效率高出数倍,能够有效应对单芯片功耗突破300W的高密度
    的头像 发表于 04-21 15:53 344次阅读
    <b class='flag-5'>液冷</b>系统的“感知层”:传感器如何保障<b class='flag-5'>散热</b>可靠性与运行安全

    液冷关键部件与供应链:AI算力浪潮下的散热革新

    电子发烧友网报道(文/李弯弯)当下AI算力爆发功率攀升,液冷的需求从可选成为刚需。如谷歌新一代TPU v7单芯片功耗达980W,需100%液冷散热
    的头像 发表于 04-19 07:02 4858次阅读

    伟创力携手博通,推进下一代AI液冷解决方案落地

    系统实现规模化部署 。         散热成为AI算力的关键能力 在 AI 训练和推理需求不断增长的背景下,单颗 AI 芯片功耗已迈入多
    的头像 发表于 03-17 10:44 958次阅读
    伟创力携手博通,推进下一代<b class='flag-5'>AI</b><b class='flag-5'>液冷</b>解决方案落地

    英伟达微通道液冷板技术全解析:原理、工艺、优势与产业适配

    随着AI算力的爆发式增长,英伟达Rubin架构GPU等高端芯片的单芯片功耗已逼近2.2kW(2026年最新实测数据),局部热点热流密度最高可达650W/cm²,传统风冷彻底退场,单相
    的头像 发表于 02-14 08:19 2292次阅读
    英伟达微通道<b class='flag-5'>液冷</b>板技术全解析:原理、工艺、优势与<b class='flag-5'>产业</b>适配

    英伟达Rubin平台引入微通道冷板技术,100%全液冷设计

    在性能上实现了质的飞跃,更凭借全液冷架构彻底革新散热体系,为高功耗 AI 芯片提供了高效且可靠的温控解决方案。   Rubin 平台:
    的头像 发表于 01-19 07:15 1.7w次阅读
    英伟达Rubin平台引入微通道冷板技术,100%全<b class='flag-5'>液冷</b>设计

    液冷重塑AI服务器电源?对材料器件有何要求

    随着AI服务器功率密度持续攀升,传统风冷方案正逐步逼近极限。单机柜功率从过去的二三十千瓦,快速跃升至如今的几百千瓦,对散热提出了极致要求。高热流密度使散热系统成为制约服务器性能释放的关
    的头像 发表于 12-13 16:46 2013次阅读
    <b class='flag-5'>液冷</b>重塑<b class='flag-5'>AI</b>服务器电源?对材料器件有何要求

    电压放大器在芯片散热驱动液冷系统实验中的应用

    实验名称:面向电子芯片散热的压电驱动液冷系统集成实验研究 研究方向:针对高集成度电子芯片散热
    的头像 发表于 11-28 15:31 686次阅读
    电压放大器在<b class='flag-5'>芯片</b><b class='flag-5'>散热</b><b class='flag-5'>驱动</b><b class='flag-5'>液冷</b>系统实验中的应用

    液冷散热时代:AI服务器如何重构磁元件设计

    替换,它正驱动着服务器电源架构及内部磁性元器件的设计逻辑发生深刻变化,这种散热方式也对磁性材料提出更高的要求。本文将从产业现状出发,探讨液冷趋势如何重构电源与磁性元件的设计重心与技术路
    的头像 发表于 11-21 11:42 1322次阅读
    <b class='flag-5'>液冷</b><b class='flag-5'>散热</b>时代:<b class='flag-5'>AI</b>服务器如何重构磁元件设计

    关于散热风扇与散热风扇转子你了解多少?

    除手机、平板、IPTV机顶盒、C类ONU等终端类设备,由于设备及器件功耗较大,一般都需要通过强迫风冷进行散热,而且近几年冷板式液冷也得到越来越多的应用,浸没式液冷也进行相应的试点应用。
    的头像 发表于 10-28 08:28 1044次阅读

    AI芯片冷却技术,正在成为关键

    ,旨在解决未来新一代GPU等芯片散热问题。   MLCP的全称为Micro-Laminar Cold Plate,是一种高度集成的微通道液冷解决方案。它源于NVIDIA对AI
    发表于 09-20 00:36 2224次阅读

    液冷技术冷却液:AI算力浪潮下的创新引擎与产业图景

    电子发烧友网报道(文/李弯弯)当英伟达GB300芯片以1200W的单芯片功耗震撼业界,当谷歌TPU集群通过液冷技术实现40%能耗直降,一场由人工智能驱动
    的头像 发表于 08-25 07:43 1.5w次阅读
    <b class='flag-5'>液冷</b>技术冷却液:<b class='flag-5'>AI</b>算力浪潮下的创新引擎与<b class='flag-5'>产业</b>图景

    【技术贴】超低功耗黑科技!艾为AW86320 高压液冷驱动IC,散热新宠诞生

    5G与AI技术井喷式发展,设备算力需求激增,传统石墨烯、VC(VaporChamber)等被动散热已难敌高功耗发热。液冷散热驱动凭借主动温控
    的头像 发表于 06-20 18:51 1709次阅读
    【技术贴】超低功耗黑科技!艾为AW86320 高压<b class='flag-5'>液冷</b><b class='flag-5'>驱动</b>IC,<b class='flag-5'>散热</b>新宠诞生

    南芯科技推出190Vpp压电微泵液冷驱动芯片SC3601

    今日,南芯科技(证券代码:688484)宣布推出自主研发的 190Vpp 压电微泵液冷驱动芯片 SC3601,可在移动智能终端实现低功耗液冷散热
    的头像 发表于 06-18 17:20 1987次阅读