0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

后摩尔时代:芯片不是越来越凉,而是越来越烫

向欣电子 2025-07-12 11:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

智能手机、笔记本电脑、服务器,尤其是AI加速器芯片上,我们正在见证一个时代性的趋势:计算力不断攀升,芯片的热也随之“失控”NVIDIA的Blackwell架构GPU芯片,整卡TDP功耗超过1500W,而在消费领域,旗舰显卡RTX 5090也首次引入了液态金属这一更高效但成本更高的热界面材料(TIM)。


为什么芯片越来越热?它的热从哪里来?芯片内部每一个晶体管在开关动作时的能量损耗,汇聚成了最终“无处安放的热量”。随着晶体管数量的飞涨和面积不断压缩,我们正面临着一个关键指标的持续抬升:热流密度(Heat Flux Density)


虽然摩尔定律正在放缓,但芯片集成度却并未因此降低,尤其在台积电CoWoS、英特尔Foveros等先进封装技术的推动下,多芯粒堆叠和超高带宽互连正推动芯片走向前所未有的“热集中”时代。


那么,热是怎么产生的?过去这些年晶体管密度和热流密度如何变化?先进制程和封装是否会让芯片更热?这一期,我们来系统聊一聊。




01

热从哪里来?晶体管为什么发热


芯片之所以会发热,根源在于其内部成千上亿个晶体管在不断地“开”和“关”。在这个过程中,一部分电能不可避免地转化成热能。一个芯片中可能包含数十亿、甚至超过一万亿个晶体管。下图是当前常用的FinFET晶体管的结构,FinFET全称Fin Field-Effect Transistor,中文名叫鳍式场效应晶体管,是一种新的互补式金氧半导体晶体管1999年,胡正明教授及其团队成员成功制造出第一个p型FinFET,它的栅长度只有18nm,沟道宽度15nm,鳍的高度50nm。这些万亿晶体管被集成在芯片里每天“开关自如”,运行着从搜索推荐到AI训练的复杂任务。



但每当晶体管切换状态时,它就消耗能量并释放热量。这个过程中主要涉及两个方面的功耗来源:


(1)动态功耗:当晶体管从关闭状态切换到打开状态,或从打开切换到关闭状态时,内部的电荷重新分布或复合,产生能量损耗,并以热的形式释放出来。这种过程称为动态功耗,是芯片运行时最主要的热量来源。它可以近似表示为:它可以被近似地表示为:P = α · C · V² · f;其中:α 是活动因子(代表多少晶体管在同时工作);C 是负载电容;V 是电压;f 是频率。可以看到,电压越高、频率越高,芯片的动态发热就越严重这也是为何芯片“超频”时温度急剧上升



(2)静态功耗:即使不工作也会漏电。即便晶体管处于“静止状态”,也仍有微弱电流泄漏,形成所谓的“静态功耗”,其来源包括:亚阈值漏电流(Subthreshold leakage)、闩锁电流(Gate leakage)、PN结反向偏置漏电(Junction leakage)。随着晶体管尺寸不断缩小,漏电流显著增加,成为芯片发热的“隐性杀手”这也是当前制程演进中越来越难压低功耗的原因之一。


电能在晶体管工作中损耗后,大部分以热能的形式散发。这种能量转换不可逆,最终导致芯片温度升高。也就是说,不论是开关还是静止状态,晶体管都会发热,只是程度不同。




02

晶体管密度提升,热流密度同步飙升


1965年,英特尔创始人之一的戈登·摩尔提出了经典的摩尔定律, “每18个月性能提升一倍,价格降低一半”。过去几十年间,摩尔定律推动芯片性能飞速发展,这背后依赖的是制造工艺的不断进步,使晶体管的尺寸越来越小、密度越来越高。但随之而来的,是一个不可忽视的问题——热流密度的快速上升。



早期节点(比如130nm、90nm)时,晶体管密度和功耗提升是相对线性的,但进入65nm之后漏电流的急剧上升让静态功耗成为了大问题。虽然工艺不断推进,但功耗墙(Power Wall)逐渐显现。


0971fb0a-5ecf-11f0-9cf1-92fbcf53809c.jpg

图3. 晶体管发展历史(图源:桔里猫)


与此同时,为了追求性能,芯片主频也不断升高——这意味着单位时间内的动态功耗暴增。而晶体管越密、芯片面积增长受限,结果就是:单位面积上的热功耗密度不断上升,热管理难度迅速加剧。


这里我们要明确两个概念:功耗(Power):整个芯片的总能耗,单位是瓦(W);热流密度(Power Density):单位面积上的功耗,单位是W/cm²或W/mm²。举个简单的例子:一块100W的CPU,面积为2cm²,则热流密度为50 W/cm²。


制程节点晶体管密度功耗密度主频(GHz)
90nm~10M<30~3
45nm~100M~80~3.5
7nm~1000M>100~3.5-4


特别在7nm及之后,即使主频不再大幅提升,但密度和功耗依旧在上涨,热流密度成为设计瓶颈。如A100/A800 TDP是400W,芯片热流密度 50W/cm²;H100/H800 TDP是700W,热流密度87.5W/cm²,当下芯片热流密度已经远超风冷极限。
09842014-5ecf-11f0-9cf1-92fbcf53809c.jpg

图4. Intel晶体管发展计划


早在20年前,英特尔前CTO和CEO帕特·盖尔辛格就放话说,如果芯片耗能和散热的问题得不到解决,当芯片上集成了2亿个晶体管时,就会热得像“核反应堆”,2010年时会达到火箭发射时高温气体喷射的水平,而到2015 年就会与太阳的表面一样热。



英伟达B200芯片则达到了2080亿晶体管,功耗高达1000W+。如果按单位面积换算,芯片的热流密度早已超过核反应堆冷却板、钢铁冶炼炉,逼近火箭喷嘴


03

GAA与先进封装:热流密度会再度飙升吗?


3.1从FinFET到GAA,热管理走入“精细博弈”

摩尔定律放缓后,热流密度会下降吗?在摩尔定律不断逼近物理极限的背景下,晶体管结构也在经历代际更替。FinFET(鳍式场效应晶体管)已经在10年内主导了芯片工艺的主流。但从2025年台积电N2、Intel18A以及三星SF2最新的产品架构看,几家头部大厂都开始转型GAA(全环绕栅极)晶体管


09a32c02-5ecf-11f0-9cf1-92fbcf53809c.png

09b2086c-5ecf-11f0-9cf1-92fbcf53809c.png

图6. 从平面晶体管到FinFET再到GAA晶体管的转变(图源:Lam Research)


GAA的优势在于能更有效地控制漏电流、提升开关性能,是功耗控制的一大利器。但这项结构创新也带来了新的热挑战:

GAA晶体管单元结构更复杂、更精密,单位体积内的功耗密度更高

多根纳米片堆叠形成通道,栅极完全包覆,热扩散路径更短、更局限

晶体管栅长进一步缩小,亚阈值泄漏和量子穿隧效应成为主要发热来源。

总结:GAA让“每一个晶体管”都更高效了,但也更热了。



3.2 先进封装:热不再是“平均值”,而是“热点集中”与GAA晶体管技术几乎同步推进的,还有近年来蓬勃发展的先进封装技术台积电的CoWoS、英特尔的Foveros、三星的I-Cube,都试图将多个芯粒(chiplets)以2.5D或3D方式进行堆叠、集成,提升带宽、降低延迟。但热管理难度也随之翻倍:

热点集中:AI芯片、HPC芯片往往在中间集成一颗大算力芯粒,形成局部极端高温区域;

热路径增长:上下堆叠的芯片彼此遮挡,芯片底部的热量更难传导到外部;

材料不匹配:封装中的TIM(热界面材料)、载板、芯粒之间存在热膨胀系数差异,导致界面热阻增大。

在B200这类AI芯片中,一颗核心芯粒+多颗HBM堆叠组成的“热岛”,不仅考验散热能力,也正在倒逼产业链重新设计整个热结构。


进入先进封装时代后多个高功耗芯片裸片被集成到同一封装基板上,在空间不变的情况下,热源集中度进一步提高,热流密度陡增。如果在先进封装中,热源面积被进一步“压缩”。这意味着传统的风冷方式可能无法满足需求,必须引入液冷、热管、3D冷却、甚至微射流等更激进的热管理方案。台积电已经开始在晶圆上尝试微射流的液冷方案,感兴趣的同学可以看上一期的文章。

AI芯片热到极限?CoWoS封装里藏着怎样的“散热”难题


04

结语与讨论:热管理,正在变成芯片设计的“第一门槛”?


曾经热设计是最后一公里的工程问题。而今天,在GAA+3D封装加持下的先进芯片,热设计已然走到产品开发的最前沿。


很多人以为,摩尔定律趋缓、频率不再提升,芯片的热密度问题应该会“缓一缓”。但事实上,进入3D异构集成时代后,热问题从“全局扩散”转向“局部灾难”

提问:面对GAA与先进封装的双重推进,下一代热管理材料和冷却技术该如何跟上?欢迎大家在评论区分享你的看法同时留下你感兴趣的话题?



参考资料[1] 芯片热量如何产生的?,大米的老爹;[2] 芯片功耗是否都转换为热量,百科;[3] 一文了解晶体管发展历程,半导体全解;[4] FinFET交棒GAA?关于GAA制程技术必须知道的事,EDN电子技术设计;

[4]半导体制程从180nm到14nm技术演进总结,半导体小马;

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    462

    文章

    53529

    浏览量

    458825
  • 晶体管
    +关注

    关注

    78

    文章

    10245

    浏览量

    146209
  • 后摩尔时代
    +关注

    关注

    0

    文章

    13

    浏览量

    9317
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Windows 在工厂里为什么越来越少见?答案只有两个字:Linux

    现场的格局正在反转——从边缘计算机、物联网网关、储能控制器到机器人控制系统,越来越多的设备在用同一个内核: Linux 。 这不是潮流,而是技术必然。 一、工业现场的“刚需”:稳定比漂亮更重要 工业系统不同于办公电脑。它要在高温
    的头像 发表于 11-06 16:50 426次阅读

    FPGA技术为什么越来越牛,这是有原因的

    最近几年,FPGA这个概念越来越多地出现。例如,比特币挖矿,就有使用基于FPGA的矿机。还有,之前微软表示,将在数据中心里,使用FPGA“代替”CPU,等等。其实,对于专业人士来说,FPGA并不陌生
    的头像 发表于 08-22 11:39 3810次阅读
    FPGA技术为什么<b class='flag-5'>越来越</b>牛,这是有原因的

    PCB为啥现在行业越来越流行“浅背钻”了?

    我们来考虑背钻和不背钻的影响,背钻留下的stub是10mil,模型的示意图如下所示: 然后从结果上看差异是非常明显的,TDR阻抗差异超过10个欧姆,回波损耗也差了接近10个dB。说明背钻工艺对过
    发表于 08-18 16:30

    摩尔时代破局者:物元半导体领航中国3D集成制造产业

    在全球半导体产业迈入“摩尔时代”的背景下,传统制程微缩带来的性能提升逐渐趋缓,而先进封装技术,尤其是2.5D/3D堆叠封装,正成为延续芯片性能增长的关键路径。 据Yole数据显示,2022年全球
    的头像 发表于 08-04 15:53 741次阅读
    <b class='flag-5'>后</b><b class='flag-5'>摩尔时代</b>破局者:物元半导体领航中国3D集成制造产业

    LED芯片亮,发热量越大,还是芯片暗,发热量越大?

    LED芯片亮,发热量越大,还是芯片暗,发热量越大?遇到这个问题,相信很多人都会认为是芯片
    的头像 发表于 07-21 16:16 686次阅读
    LED<b class='flag-5'>芯片</b><b class='flag-5'>越</b>亮,发热量越大,还是<b class='flag-5'>芯片</b><b class='flag-5'>越</b>暗,发热量越大?

    芯片的验证为何越来越难?

    本文由半导体产业纵横(ID:ICVIEWS)编译自semiengineering过去,仿真曾是验证的唯一工具,但如今选择已变得多样。平衡成本与收益并非易事。芯片首次流片成功率正在下降,主要原因
    的头像 发表于 06-05 11:55 729次阅读
    <b class='flag-5'>芯片</b>的验证为何<b class='flag-5'>越来越</b>难?

    高速PCB板的电源布线设计

    随着集成电路工艺和集成度的不断提高,集成电路的工作电压越来越低,速度越来越快。进入新的时代,这对于PCB板的设计提出了更高的要求。本文正是基于这种背景下,对高速PCB设计中最重要的环
    发表于 04-29 17:31

    概伦电子芯片封装连接性验证工具PadInspector介绍

    当今时代人们对产品性能要求越来越高,SoC设计也随之变得越来越复杂,由此导致SoC内模块数量呈指数级增长。不同于传统设计方法,芯片封装设计中的l/O pad配置规划和封装连接性验证流程
    的头像 发表于 04-22 09:59 711次阅读
    概伦电子<b class='flag-5'>芯片</b>封装连接性验证工具PadInspector介绍

    当我问DeepSeek:为什么传感器技术越来越重要

    为什么传感器技术越来越重要 我们一起来看看     DeepSeek是怎么说的 为什么传感器技术越来越重要?   传感器:数字世界的感官,智能
    的头像 发表于 03-01 15:58 668次阅读

    新能源汽车中越来越重要的低边开关

    电子发烧友网报道(文/梁浩斌)随着如今电动汽车的智能化程度加深,车上的电器设备不断增多,低压系统中的负载也在增大,汽车低压系统从传统的12V电压开始往48V发展,这对各种应用的开关控制产生了更高要求。之前我们曾经介绍过高边开关的应用场景以及汽车应用的需求情况,那这一篇文章就来介绍一下同样不可或缺的低边开关。   高低边实际上是形容器件使用在电源和负载之间相对位置的关系,高边开关顾名思义,是应用于电源正极和负载之
    的头像 发表于 02-28 00:09 2530次阅读

    静脉识别在各个领域越来越得到认同了

    发表于 02-26 18:09

    帝奥微推出DCDC降压电源模块DPM6101/03

    近年来,随着科技的飞速发展及新能源的大面积普及,电子设备在各种行业的不同应用中发挥着越来越重要的作用。目前对于很多产品及设备而言,其被赋予和集成的功能越来越丰富,因此配备的主控芯片算力越来越
    的头像 发表于 01-20 15:25 1310次阅读
    帝奥微推出DCDC降压电源模块DPM6101/03

    其利天下技术开发|目前先进的芯片封装工艺有哪些

    先进封装是“超越摩尔”(MorethanMoore)时代的一大技术亮点。当芯片在每个工艺节点上的微缩越来越困难、也越来越昂贵之际,工程师们将
    的头像 发表于 01-07 17:40 2141次阅读
    其利天下技术开发|目前先进的<b class='flag-5'>芯片</b>封装工艺有哪些

    这类视频看多了生意反而会越来越差?

    行业资讯
    芯广场
    发布于 :2024年12月11日 18:51:25

    ADS1230输出开始时稳定一段时间,随后开始减小,并且减小越来越快,是哪里的问题?

    如题,开始上电,ADS1230输入端输入稳定的毫伏信号,输出显示正确无跳变,维持这个输入信号不变,随着时间推移,输出显示开始变化,并且变化越来越快,最后减小到接近零。测输入端的毫伏信号没有变化,而cap两端由几百毫伏变成了接近零。请问这是输入电路有问题,还是芯片损坏了,
    发表于 12-06 07:44