0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

越来越“热”的芯片,如何降温?

jf_78421104 来源:Cadence楷登 作者:Cadence楷登 2024-09-27 15:59 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

前言

2024 年,AI 的“狂飙突进”势头不减,继 ChatGPT 之后,文生视频大模型 Sora 的推出更是让人们看到 AI 的无限可能。然而,随之而来的能耗问题也不容忽视。国际能源署(IEA)《Electricity 2024——Analysis and forecast to 2026E》的报告,ChatGPT 每响应一个请求需要消耗 2.9 瓦时,这相当于一个 5 瓦的 LED 灯泡亮 35 分钟。考虑到每天 90 亿次搜索,这将在一年内额外消耗近 10 太瓦时的电力,相当于一座小型核电站一年的发电量。而这些能源消耗的“罪魁祸首”之一,就是支撑 AI 运行的芯片。为了保证芯片的高效运行,庞大的数据中心往往需要消耗大量的电力进行冷却。根据 IEA 的报告,数据中心的电力需求主要来自计算和冷却两个方面,两者各占总电力需求的 40%左右。预计到 2026 年,全球数据中心、加密货币和人工智能的电力消耗将在 620 至 1,050 TWh 之间变动。

wKgZomb2ZTmAYJW7AASgfCisHZg369.png

来源:IEA《Electricity 2024 - Analysis and forecast to 2026》

近年来,为了满足 5G、AI、汽车电子等新兴市场不断增长的算力需求,芯片的集成度不断提高,相应的功耗也随之增加。功耗增加会产品热量,当热度达到一定程度,芯片轻则宕机,重则损毁。一个直观的生活案例,这就好比我们的手机,过热会直接死机。因此芯片散热已是当今工程师的“必修课”。但为了满足便携性和美观性需求,电子设备的尺寸又必须不断减小,这就导致给散热系统留下的空间愈发有限。如何高效散热,已成为整个行业亟待解决的关键问题。

01 电子系统散热:日益严峻的挑战

随着芯片制程的不断微缩,大大加剧了散热困境。按照传统散热经验,芯片的散热密度存在物理极限,每平方毫米芯片的散热能力约为 1 瓦。目前行业内的发展趋势是,进入 10纳米以下,英特尔AMD 等芯片巨头纷纷采用均热片来解决发热问题。3 纳米和 2 纳米甚至是埃米时代的来临,散热将是头等大事。

在人工智能浪潮的推动下,下一代 AI 芯片,其功耗甚至超过 1 千瓦。面对如此高功耗,液冷技术成为必要的降温选择。然而,设备越热,其冷却成本也随之增加。CDCC的统计数据显示,数据中心的制冷系统在资本支出(CAPEX)中占 20-25%,在运营支出(OPEX)中的电力成本更是占了 40%。

功耗曾经被视为软性指标,但现在已成为芯片设计中的重要考量因素。过高的热量带来的不良影响不容忽视:

性能下降:过高的温度会导致芯片性能下降,甚至出现死机、蓝屏等故障。

可靠性降低:高温会加速电子元件的老化,缩短设备的使用寿命。

安全性隐患:极端情况下,过热可能引发火灾等安全事故。

能源浪费:过多的电力消耗不仅增加了运营成本,还加剧了能源危机。

热量不仅会影响单个电子元件的性能,还会对整个电子系统的可靠性造成威胁。以现代汽车为例,在汽车电动化、智能化和网联化的发展趋势下,车内集成了成百上千个电子元件,这些元件之间相互作用产生的热量和振动,会形成复杂的热应力和机械应力场,影响设备的稳定性和可靠性。

面对日益严峻的散热挑战,以及对芯片性能提升的孜孜以求,如何在保证芯片性能的前提下,有效解决散热问题,是摆在业界面前的一项紧迫任务。

EDA 的角度来看,要实现精准的热分析面临着诸多挑战。首先,热量在芯片内的传播路径复杂多样,需要考虑不同材料的热导率、界面热阻等因素。其次,对于 3D-IC 等先进封装技术,需要考虑不同层次之间的热传导和散热路径,这增加了分析的复杂性和计算的负担。此外,由于热仿真的精度要求高,需要考虑如何在保证计算效率的同时,不影响分析结果的准确性。

然而,当前市场上的热分析工具往往是零散的且功能单一,工程师需要同时使用多个不同的软件和方法来完成散热设计,这增加了工程开发周期和成本,同时降低了设计的效率和一致性。传统的电子散热设计和分析工具已显得力不从心。

因此,电子行业亟需要创新的方法和工具来为芯片“降温”。这种解决方案应具备以下特点:

早期评估:在设计初期就对热解决方案进行评估,积极利用数字孪生等创新技术,避免后期返工。通过采用“左移”开发策略,即在设计早期引入热分析,我们可以更早地发现并解决潜在的热问题,从而提高产品的可靠性。

全局入手:将整个电子系统作为一个整体进行热分析,考虑各组件之间的相互作用。

统一平台:提供一个集成的设计环境,涵盖热仿真、流体仿真等多种分析功能。

02 Cadence Celsius Studio:开启散热设计新时代

今年初,Cadence 以其一贯的创新精神,推出了一款真正的系统级热分析工具——Cadence Celsius Studio,它结合有限元分析(FEA)与计算流体力学(CFD)技术,为电子行业日益严峻的散热问题提供了一套全面的解决方案。作为业界首个将 AI 技术与热设计深度融合的综合性平台,Celsius Studio 打破了传统热分析工具的局限,将电热协同仿真、电子元件冷却和热应力分析整合到一个综合的平台,引领电子系统热设计迈向一个全新的智能化时代。

Cadence Celsius Studio 实现了多项突破

01 真正的热系统分析

在 Cadence Celsius Studio 中,热和应力的建模是通过有限元分析(FEA)来完成的,通过精细到粗略的网格设计,可以满足广泛的精度需求。在 Cadence Celsius EC Solver 中,工程师可以通过建模对流和/或主动冷却(如风扇等),来实现散热分析。

02 AI 驱动,实现设计优化

当今的高性能电子系统要求设计人员考虑 SI、PI 和热完整性以及电磁干扰和兼容性(EMI/EMC)等问题,多物理场分析变得至关重要。Celsius Studio 中所搭载的 Cadence Optimality Intelligent System Explorer,是一款 AI 驱动的多物理场优化软件,它突破了传统人力密集型优化流程的限制,用 AI 驱动的技术取代了传统的设计-测试-优化循环的交互流程,可对整个设计空间进行快速高效的探索,锁定理想设计。

人工智能技术的引入,为电子设计自动化带来了革命性的变革。Celsius Studio 不仅能帮助工程师在设计早期阶段发现热问题,还可提供分析和设计洞察,预测潜在的热问题,并提供智能化的优化建议,尽可能减少机械工程团队的后期设计迭代,缩短电子系统的开发迭代周期。Celsius Studio 专为大规模并行执行而设计,经过生产验证,其可在不牺牲精度的前提下,与手动、详尽、强力的参数表研究相比,生产力平均提高 10 倍。

计算流体动力学(CFD)是多物理系统分析的一个方面,它使用数值模型模拟流体的行为及其热力学特性。

03 打通电气工程师和机械工程师的“鸿沟”

随着 PCB 机械外壳尺寸日益减小以及 PCB 本身复杂性的增加,电气和机械工程师之间的协作对于芯片和系统的热分析和优化愈发重要。从电路板的轮廓到最终布局和布线,双方必须掌握相同的信息,彼此同步进行,并消除过程中的冗余。

为了进行这种分析,ECAD(电子计算辅助设计)+ MCAD(机械计辅助设计)的协作必不可少。MCAD 和 ECAD 之间的无缝集成曾经是导致分析速度慢的主要障碍之一。在 Celsius Studio 中,Cadence内部的专家简化了 MCAD和 ECAD模型的导入过程,将之前几天的工作量大大缩短到几乎无感知的时间,使得电路板和机架内的热、应力和冷却分析变得更加高效和简便。

Celsius Studio 平台既面向电气工程师,也可以满足机械工程师的需求。对于电气工程师,Celsius Thermal Solver 可进行芯片/SoC 性能/热分析、封装和 PCB 的电热协同仿真,以及在兼顾热影响的同时进行封装/PCB 的元件摆放。对于热工程师,Celsius Electronics Cooling 提供了电子元件冷却散热分析,可通过添加散热器、风扇、通风口来缓解潜在的热问题。

04 多平台无缝集成,众人拾柴火焰高

Celsius Studio 的强大之处在于,可以与 Cadence 的多种实现平台无缝集成,包括 Allegro X Design Platform(用于电路板设计)、AWR Design Environment(用于微波 IC)、Virtuoso System Design Platform(用于定制/模拟电路)和 Innovus Implementation System(用于数字电路),芯片散热是一个复杂的工程性问题。Cadence 正在集结过往几十年的经验,将更多的工具整合在一起,助力热分析更加便捷。

这些多工具的见解可指导电源整体热和应力分析以及热量减少策略、布局优化以及热通孔和温度传感器布局,让电气和机械/热工程师可以在同一个环境中对设计装配流程执行多阶段分析,解决单个封装上多晶粒堆叠的 3D-IC 翘曲问题,无需对几何体进行简化或转换。

Celsius Studio 正在成为电子行业解决热设计难题的首选工具,帮助企业提高产品竞争力,加速产品创新。

通过采用 Celsius Studio,三星半导体在设计早期阶段即获得了准确的热分析结果,显著提升了 3D-IC 和 2.5D 封装的设计效率,将产品开发周期缩短了 30%。

BAE Systems 利用 Celsius Studio 在 MMIC 设计周期内实现了快速、准确的热分析,大幅提升了 RF 和热功率放大器的性能。

Celsius Studio 帮助 Chipletz 的设计团队能够及早获取详细信息,解决散热问题,并显著缩短了周转时间。在 Chipletz 工程团队开发复杂设计时,能够多次高效且详细地运行 3D-IC 和 2.5D 封装的热仿真。

总的来说,Cadence的 Celsius Studio为芯片、封装、电路板和终端系统提供全方位的热分析和优化提供了一种独辟蹊径的做法

结语

Cadence Celsius Studio 的推出,为当今电子行业的发展带来了全新的机遇。通过将人工智能与传统仿真技术相结合,Celsius Studio 将帮助工程师克服日益严峻的散热挑战,加速创新产品的上市。通过提供精确的热仿真和高效的设计优化功能,Celsius Studio 将成为电子工程师的得力助手,助力他们设计出更高性能、更可靠的电子产品。

关于 Cadence

Cadence 是电子系统设计领域的关键领导者,拥有超过 30 年的计算软件专业积累。基于公司的智能系统设计战略,Cadence 致力于提供软件、硬件和 IP 产品,助力电子设计概念成为现实。Cadence 的客户遍布全球,皆为最具创新能力的企业,他们向超大规模计算、5G 通讯、汽车、移动设备、航空、消费电子、工业和医疗等最具活力的应用市场交付从芯片、电路板到完整系统的卓越电子产品。Cadence 已连续十年名列美国财富杂志评选的 100 家最适合工作的公司。如需了解更多信息,请访问公司网站 www.cadence.com。

来源:微信-Cadence楷登

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    462

    文章

    53567

    浏览量

    459374
  • Cadence
    +关注

    关注

    68

    文章

    1000

    浏览量

    146230
  • AI
    AI
    +关注

    关注

    89

    文章

    38184

    浏览量

    296965
  • 数字孪生
    +关注

    关注

    4

    文章

    1619

    浏览量

    13744
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    FPGA技术为什么越来越牛,这是有原因的

    最近几年,FPGA这个概念越来越多地出现。例如,比特币挖矿,就有使用基于FPGA的矿机。还有,之前微软表示,将在数据中心里,使用FPGA“代替”CPU,等等。其实,对于专业人士来说,FPGA并不陌生
    的头像 发表于 08-22 11:39 3842次阅读
    FPGA技术为什么<b class='flag-5'>越来越</b>牛,这是有原因的

    PCB为啥现在行业越来越流行“浅背钻”了?

    高速先生成员--黄刚 毫无疑问,信号速率已经是灰常灰常高了,过孔对信号质量的影响在以往文章中已经分享过太多太多。过孔一身都是坑,其中最大的那个就是它的stub影响。一个有stub的过孔衰减的上限可能是大家想象不到的,1dB,5dB,10dB,20dB甚至更大都有可能。 So,一套专门为提升有stub的过孔性能的加工工艺就应运而生了,那就是背钻,简单的流程就像下面这样了。 当然,我们也知道,本身常规的板子是不需要背钻的,突然增加这样一个工艺流程,加钱是难免的事情。因此精明的硬件朋友们就学会了根据高速信号速率的不同来决定是否需要背钻和哪些层背钻,哪些层就不用背钻了。简单定性来说就是,速率低就能允许过孔的stub长,速率高就需要stub短,当然高速先生在很多场合上也大概把速率和stub长度的关系量化过,还不知道的粉丝可以去问问身边知道的同事了,哈哈。 由于多一层背钻,就要多花一层的钱,所以大多数客户都会觉得在不算非常高的速率下,例如25Gbps左右,可能超过25mil以上stub的过孔才会去背钻。例如下面的连接器过孔案例,在这一层出线层的情况下,过孔stub是25mil。 这个时候我们来考虑背钻和不背钻的影响,背钻后留下的stub是10mil,模型的示意图如下所示: 然后从结果上看差异是非常明显的,TDR阻抗差异超过10个欧姆,回波损耗也差了接近10个dB。说明背钻工艺对过孔性能的改善帮助很大很大。。。 从上面的结果能看到,25mil不背钻结果当然不是很好,背钻之后哪怕剩下10mil其实结果都能接近完美了,看起来的确和我们想象的一样,如果本身就只有10mil的stub,那还背钻个啥,又省钱又不会为难板厂,一举两得! 那问题来了,如果真的只有10mil的stub的话,到底值不值得背钻呢?那我们把上面那个模型的走线层换到更靠下的层去走,过孔的stub就10mil出头的样子,如下所示: 在不背钻的情况下,仿真得到的TDR阻抗结果是85欧姆左右,感觉还行啊,能接受! 这个时候我们来硬要板厂帮我们做背钻,本来是10mil出头,让板厂钻掉几个mil,保证最后是8mil的stub,就像下面这个动图展示的背钻过程一样! 最后做出来的这个效果就是背钻后剩下8mil stub的模型了。 无非也只是少了3mil左右的stub,能比不背钻好多少,能差出0.5欧姆都顶天了吧。这下恐怕要让大家失望了,背钻后过孔的阻抗从不背钻的85欧姆左右提升到快接近90欧姆了,足足差不多有5欧姆的提升!!! 这。。。就有点惊掉下巴了啊,就差几个mil的stub,能差出快5欧姆的情况?中间是不是有什么误会啊? 误会可能没有,认知不同是有的。我猜你们认为的只差3个mil的stub长度说的是下面这种情况,那就是把底层焊盘去掉,仅减小过孔stub长度的这个模型吧? 的确如你们之前想象的一样,如果只减小过孔stub长度的话,8mil的stub和10mil多的stub对过孔阻抗的影响的确微乎其微,可能0.2欧姆都没有! 从三者回波损耗的结果对比也能看到几个结论:不背钻的影响在25Gbps之前性能差别的确不大,但是在25Gbps之后其实恶化是很厉害的。哪怕只钻掉焊盘,不减小过孔stub的改善也是非常明显的,还有就是从结果来看,单纯只差几个mil的stub影响是非常小的哈。 这种小于10mil的过孔stub的背钻我们在PCB加工行业内就称为浅背钻,如下图所示,浅背钻主要就是为了去掉底层焊盘的影响,其次才是希望让stub再短几个mil。 最后总结下哈:这个地方的影响无论是从SI性能还是加工方面看,都很容易被忽略,尤其当我们的通道走到了像112Gbps以上的超高速率下,影响是不小的。同时对于板厂加工也是会增加一丢丢难度,毕竟要钻的过孔深度很短,一不留神就钻过了或者压根没钻到,所以也需要对PCB板厂的加工能力有一定的要求哈。我们板厂去做这个事情当然没有问题,关键是在于各位硬件或者PCB设计,包括SI的小伙伴们有没有意识到这个地方对高频的影响,从而找我们的板厂去做这个浅背钻而已! 问题:大家对自己产品的过孔要不要去做背钻工艺,都是怎么考虑的啊? 关于一博: 一博科技成立于2003年3月,深圳创业板上市公司,股票代码: 301366,专注于高速PCB设计、SI/PI仿真分析等技术服务,并为研发样机及批量生产提供高品质、短交期的PCB制板与PCBA生产服务。致力于打造一流的硬件创新平台,加快电子产品的硬件创新进程,提升产品质量。
    发表于 08-18 16:30

    LED芯片亮,发热量越大,还是芯片暗,发热量越大?

    LED芯片亮,发热量越大,还是芯片暗,发热量越大?遇到这个问题,相信很多人都会认为是芯片
    的头像 发表于 07-21 16:16 717次阅读
    LED<b class='flag-5'>芯片</b><b class='flag-5'>越</b>亮,发热量越大,还是<b class='flag-5'>芯片</b><b class='flag-5'>越</b>暗,发热量越大?

    后摩尔时代:芯片不是越来越凉,而是越来越

    1500W,而在消费领域,旗舰显卡RTX5090也首次引入了液态金属这一更高效但成本更高的界面材料(TIM)。为什么芯片越来越?它的
    的头像 发表于 07-12 11:19 1200次阅读
    后摩尔时代:<b class='flag-5'>芯片</b>不是<b class='flag-5'>越来越</b>凉,而是<b class='flag-5'>越来越</b>烫

    这些颠覆想象的降温黑科技

    当柏油路面蒸腾起扭曲的热浪,空调外机发出不堪重负的轰鸣,传统降温方式正在遭遇前所未有的挑战。但在这个万物皆可智能的时代,科技早已为我们开辟了全新的清凉赛道。从穿戴在身上的 “随身空调”,到能感知环境的智能家居,这些颠覆想象的降温黑科技,正重新定义人类与高温对抗的方式。
    的头像 发表于 07-07 12:45 971次阅读

    芯片的验证为何越来越难?

    本文由半导体产业纵横(ID:ICVIEWS)编译自semiengineering过去,仿真曾是验证的唯一工具,但如今选择已变得多样。平衡成本与收益并非易事。芯片首次流片成功率正在下降,主要原因
    的头像 发表于 06-05 11:55 746次阅读
    <b class='flag-5'>芯片</b>的验证为何<b class='flag-5'>越来越</b>难?

    机器人主控芯片平台有哪些 机器人主控芯片一文搞懂

    AI芯片在人形机器人中的应用越来越广泛。这些AI芯片专门设计用于执行人工智能算法,如深度学习、机器学习等。
    的头像 发表于 04-25 16:26 5978次阅读
    机器人主控<b class='flag-5'>芯片</b>平台有哪些  机器人主控<b class='flag-5'>芯片</b>一文搞懂

    VirtualLab Fusion应用:透镜引起焦点偏移的研究

    摘要 随着材料加工技术的发展,高功率激光光源的应用越来越广泛。这在光学系统的各个元件中产生大量的热量,可能引入各种光学效应,如透镜效应,它将改变透镜的焦距。在这个用例中,我们演示了由聚焦透镜
    发表于 03-12 09:43

    红外成像技术:畜牧业高效健康监测的解决方案

    红外成像技术,作为现代科技的杰出代表,正在畜牧业中发挥着越来越重要的作用。这项技术通过捕捉物体发出的红外辐射,生成反映物体表面温度分布的图像,为畜牧业的健康监测提供了全新的视角和解决方案。
    的头像 发表于 03-03 15:13 673次阅读
    红外<b class='flag-5'>热</b>成像技术:畜牧业高效健康监测的解决方案

    当我问DeepSeek:为什么传感器技术越来越重要

    为什么传感器技术越来越重要 我们一起来看看     DeepSeek是怎么说的 为什么传感器技术越来越重要?   传感器:数字世界的感官,智能时代的基石…… 在这个数字化的世界里,
    的头像 发表于 03-01 15:58 682次阅读

    静脉识别在各个领域越来越得到认同了

    发表于 02-26 18:09

    红外成像为光伏产业的健康发展保驾护航

    随着全球对可再生能源需求的不断增加,太阳能光伏产业得到了快速发展。然而,光伏系统的运行和维护也面临着一系列挑战,其中斑问题和设备故障是较为突出的难题。红外成像技术作为一种高效、非接触式的检测方法,在光伏检测中发挥着越来越重要
    的头像 发表于 02-26 11:05 783次阅读
    红外<b class='flag-5'>热</b>成像为光伏产业的健康发展保驾护航

    功率器件设计基础(十三)——使用系数Ψth(j-top)获取结温信息

    设计基础系列文章会比较系统地讲解热设计基础知识,相关标准和工程测量方法。驱动IC电流越来越大,如采用DSO-8300mil宽体封装的EiceDRIVER1ED3241M
    的头像 发表于 01-20 17:33 1923次阅读
    功率器件<b class='flag-5'>热</b>设计基础(十三)——使用<b class='flag-5'>热</b>系数Ψth(j-top)获取结温信息

    熔焊接温度分析仪的精准应用与优势探析

    熔焊接技术在现代工业生产中扮演着至关重要的角色,特别是在塑料加工、管道连接等领域。随着科技的发展,熔焊接温度分析仪作为确保焊接质量的关键设备,其应用越来越广泛。本文将探讨熔焊接温
    的头像 发表于 01-04 08:20 1256次阅读

    这类视频看多了生意反而会越来越差?

    行业资讯
    芯广场
    发布于 :2024年12月11日 18:51:25