0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

行业资讯 I 数据中心爆炸式增长的背后,如何解决散热问题?

深圳(耀创)电子科技有限公司 2022-04-16 15:07 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2e17a7f0-bce0-11ec-82f6-dac502259ad0.png

行业里存在这样一种说法:全世界的数据中心消耗了大量的能源——事实也确实如此。具体消耗量因来源(和数据中心)而异,但大致上一个数据中心可以消耗 100 兆瓦;该数目来自 Energy Innovation (EI) 的报告《数据中心到底用了多少能源?(How Much Energy Do Data Centers Really Use?) 》。

下方饼图也出自这份报告,报告中表示,粗略来看,全世界一半的电力用于运行数据中心的设备,另一半用于将电力输送到建筑内并将热量排出。

2e2c45b6-bce0-11ec-82f6-dac502259ad0.png

一个很好的例子是位于美国俄勒冈州达尔斯市的谷歌数据中心——因为那里曾建有铝冶炼厂。铝是利用大量的电力从铝土矿中提炼出来的,所以冶炼厂总是位于发电厂附近,如水电大坝。俄勒冈州的铝冶炼厂关闭了,因此有大量的电力可用,所以谷歌在那里建立了数据中心。另外,该数据中心位于哥伦比亚河上,这为冷却提供了一个取之不尽的冷水来源。这是我所知道的“熊彼特创造性破坏理论”最好的例子之一:20 世纪的铝冶炼厂被 21 世纪的超大规模数据中心所取代。

全球数据中心的电力增长幅度是多少?

既然全球各地都在建造越来越多的数据中心,那么可以假设,数据中心的总耗电量正在快速增长。一些推测性的图表显示整个世界的电力供应将用于为数据中心(或比特币矿工)供电:

随着全球互联网用户数量的增长,市场对数据中心服务的需求也在增加,这引起了人们对数据中心能源使用增长的担忧。2010 年至 2018 年间,全球 IP 流量(在互联网上传输的数据量)增加了 10 倍以上,而同时全球数据中心的存储容量也增加了 25 倍。在同一时期,全球服务器上运行的计算实例数量(托管的总应用数)增加了 6 倍以上。

——Energy Innovation (EI) 报告

但事实证明,担忧这些问题的人对半导体EDA、摩尔定律以及使芯片的功耗越来越低的解决方案一无所知。目前,全球数据中心的总耗电量约为 200TWh/年,但其实这与十年前没有什么不同。以下内容来自 EI 报告:

2e46fabe-bce0-11ec-82f6-dac502259ad0.png

然而,从自下而上的角度来看,新的结果表明情况并非如此:尽管在过去十年中,信息服务的需求快速增长,但在 2010 年至 2018 年间,全球数据中心的能源使用可能只增加了 6%。

……

2018 年全球数据中心消耗了约 205 太瓦时 (TWh),占全球电力使用的 1%,这一发现与先前基于外推法的估算数据形成了鲜明的对比——此前估计在过去十年内,数据中心的能源使用迅速上升。

——Energy Innovation (EI) 报告

从某种意义上说,这是很了不起的。另一方面,在 2010 年至 2018 年间,半导体工艺技术经历了几个节点:2010 年时28nm 还没有问世,然后到 2018 年时 7nm已然诞生。每前进一个节点都会使功耗降低约 30%,这意味着同样的功能,2018 年的功耗约为 2010 年的 15%。因此,即便互联网流量、数据中心、云计算经历了爆炸式增长,使用的电力仅占全球电力总量的 1%。

测算功耗

2010 年至今的另一个变化是,我们在设计芯片时可以使用更好的工具来测算功耗。曾经除了凭感觉判断,我们只能使用 Excel 表格来测算功耗。2010 年之前,这几乎是芯片设计师、服务器设计师和整个数据中心设计师的唯一工作方式。这个方法通常会导致非常悲观的设计,因为大家无法承受芯片过热熔化,或者整个机架过热的后果。

当然,这个问题需要一层一层入手,彼此嵌套。一个数据中心由一排又一排的机架组成。每个机架通常包含大量的服务器,并在顶部配有路由器。这些服务器通常被称为“披萨盒”,因为其大小和形状大致如此,并且用处理器GPU 和其他芯片取代了意大利香肠。这些是所有热量的来源。因此,要想提高机架(乃至整个数据中心)功耗估算数据的准确性,就要从准确计算每个芯片的耗散功耗入手。

Voltus 和 Celsius

Cadence Voltus IC Power Integrity Solution 和 Celsius Thermal Solver可以在这方面发挥重要作用,深入了解请阅读文章《免费下载 I 如何在芯片的热分析中实现2+2=5?》。

Voltus 主要用于计算芯片上各处的 IR 压降,并同时生成 Voltus 热模型 (Voltus Thermal Models ,VTM)。VTM 模型包含裸片上的材料特性、金属密度(因为金属既导热又导电)、动态功耗信息以及与温度有关的泄漏功耗。

以上只是一个起点;芯片装在封装里,封装又装在电路板上——因此,芯片产生的一些热量是分散的,因为封装和电路板在传导信号的同时也在传导热量。同时其周边还有其他重要的热源,如散热器、热管、风扇等等。此时 Celsius Thermal Solver就派上了用场,它是 Cadence推出的业内首款用于完整电热协同仿真系统分析的热求解器,由两个不同的基础求解器组成:一个基于有限元方法 (FEM),用于处理通过电路板的传导及辐射热;另一个基于计算流体力学 (CFD),用于处理与流体有关的一切,通常是气流,但也包括水冷所涉及的流体(或实际上通常使用的其他流体)。

经过生产验证,Celsius Thermal Solver的大规模并行架构可在不牺牲精度的前提下,提供比传统解决方案加快10倍的性能。

同时,Celsius Thermal Solver 可以和Voltus工具无缝集成、协同工作,对“披萨盒服务器”进行非常精确的分析;然后将这些数据相加,得到一整个机架的数据;再将机架数据相加,得到一整个数据中心的数据。同时,这种分析也可用于决定在哪里放置风扇、挡板和散热器等部件。

下图显示了通过Voltus 和 Celsius的热分析而发现的“比萨盒服务器”中的问题:

2e76221c-bce0-11ec-82f6-dac502259ad0.jpg

2e8b2fb8-bce0-11ec-82f6-dac502259ad0.png

如果想进一步了解Voltus 和 Celsius 之间1+1>2的热分析,欢迎点击下图下载白皮书《使用 Celsius Thermal Solver 对 3D-IC 进行热和应力分析》,该白皮书详细讲述了Voltus 和 Celsius的协同工作流程:

2e9ae390-bce0-11ec-82f6-dac502259ad0.png

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7315

    浏览量

    93998
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    行业资讯 I 火爆的“内存接口芯片”

    大模型训练与推理需求的爆发,点燃了AI数据中心的建设热潮。AI服务器的需求增长不仅掀起了GPU/ASIC算力芯片、光模块等组件的迭代狂潮,同时也推动了对更大容量、更高带宽系统主内存的需求。在此背景下
    的头像 发表于 10-31 16:28 2688次阅读
    <b class='flag-5'>行业资讯</b> <b class='flag-5'>I</b> 火爆的“内存接口芯片”

    鑫澈导热与屏蔽方案助力AI数据中心高效散热

    随着AI数据中心持续扩张,高功率密度AI芯片带来过量热负荷与电磁干扰问题,散热与电磁屏蔽已成为影响系统稳定与能效的核心挑战。
    的头像 发表于 10-11 09:34 385次阅读

    技术资讯 I 数据中心能否承受高温运行?

    通常,当我们讨论面向数据中心的数字孪生软件时,会重点介绍工程师如何运用基于物理原理的仿真技术,通过我们的数据中心软件建立复杂热力学模型,为IT设备寻找高效的冷却方案。但从提高效能和节约成本的角度出发
    的头像 发表于 09-19 15:55 349次阅读
    技术<b class='flag-5'>资讯</b> <b class='flag-5'>I</b> <b class='flag-5'>数据中心</b>能否承受高温运行?

    改善数据中心散热效果:实现性能与需求的相匹配,从而提高可用性、可靠性和效率

    摘要在过去几年中,数据中心的数量每年增长10%到30%,因此企业逐步重视优化数据中心散热效果,以期提高效率,更好地匹配性能以降低能耗,最大限度地提高性能并重用浪费的能源。领先的
    的头像 发表于 09-03 15:59 316次阅读
    改善<b class='flag-5'>数据中心</b><b class='flag-5'>散热</b>效果:实现性能与需求的相匹配,从而提高可用性、可靠性和效率

    Molex莫仕PCIe解决方案如何塑造数据中心格局

    随着人工智能(AI)、机器学习(ML)和云计算的发展,数据中心不得不面对爆炸增长数据,压力不断增长
    的头像 发表于 08-14 09:59 2390次阅读
    Molex莫仕PCIe解决方案如何塑造<b class='flag-5'>数据中心</b>格局

    中型数据中心中的差分晶体振荡器应用与匹配方案

    中型数据中心的定义与特点 中型数据中心通常服务于中大型企业、科研机构或地方行业节点,具备50至200个机柜,部署多台服务器、交换设备、存储系统与光通信链路等,强调高带宽、低延迟与高可用性。关键设备
    发表于 07-01 16:33

    曙光数创推出液冷数据中心全生命周期定制新服务

    在AI 算力爆发式增长的当下,液冷技术已成为数据中心突破散热瓶颈、支撑高密度算力的必选项。但液冷服务落地面临着多重挑战:服务器选型难匹配、设计院经验与液冷需求脱节、液冷与传统暖通理念冲突、行业
    的头像 发表于 06-13 14:45 1108次阅读

    英特尔引领液冷革新,与壳牌共筑数据中心高效冷却新范式

    打造业界领先的浸没液冷解决方案,为数据中心用户在AI时代构建可持续、高效液冷的发展路径。 在AI和计算能力飞速发展的当下,数据中心对强大基础设施的需求持续增长,随之而来的
    的头像 发表于 05-16 10:14 461次阅读

    数据中心液冷技术和风冷技术的比较

    近年来,随着数字经济的蓬勃发展,数据中心建设规模不断扩大,导致机房单位面积功耗居高不下,对数据中心散热制冷技术提出了更高的要求。同时,根据国家对数据中心的节能要求,全国范围内新建
    的头像 发表于 05-09 09:41 2820次阅读
    <b class='flag-5'>数据中心</b>液冷技术和风冷技术的比较

    适用于数据中心和AI时代的800G网络

    随着人工智能(AI)技术的迅猛发展,数据中心面临着前所未有的计算和网络压力。从大语言模型(LLM)训练到生成AI应用,海量数据处理需求推动了网络带宽的快速增长。在此背景下,800G网
    发表于 03-25 17:35

    优化800G数据中心:高速线缆、有源光缆和光纤跳线解决方案

    的三大主流布线解决方案——高速线缆(DAC)、有源光缆(AOC)和光纤跳线,并分析它们如何提高性能并支持现代数据中心不断增长的需求。 800G数据中心高速线缆和有源光缆解决方案 高速线缆(DAC
    发表于 03-24 14:20

    施耐德电气如何助力数据中心行业平衡能耗与算力

    随着AI大模型井喷快速发展,数据中心行业正处于通用算力向智能算力的革新期。高功率密度需求、高散热需求下,传统数据中心基础设施也继续一次“新
    的头像 发表于 03-24 11:29 697次阅读

    Cadence颠覆AI数据中心设计

    日前举办的英伟达 GTC 2025 开发者大会汇聚了众多行业精英,共同探讨人工智能的未来。而人工智能正在重塑全球数据中心的格局。据预测,未来将有 1 万亿美元用于 AI 驱动的数据中心升级。然而
    的头像 发表于 03-21 15:43 868次阅读

    数据中心发展与改造

    全球多数数据中心基础设施已超六年,能耗高而效率低。随着AI的发展,企业正致力于整合与提升能效的现代化改造。同时数据中心呈现规模化、高密化、绿色化发展趋势。19821800313 一、目前数据中心
    的头像 发表于 02-28 16:50 744次阅读
    <b class='flag-5'>数据中心</b>发展与改造

    1.2亿订单背后数据中心储能采购起量

    支撑性电源的依赖。   近日,南都电源中标某全球最大软件公司的数据中心锂电设备采购项目,中标金额约1.2亿元人民币。该项目位于美国,人工智能的蓬勃发展带动美国数据中心需求急剧增长。   南都电源作为最早进入
    的头像 发表于 02-28 13:30 674次阅读
    1.2亿订单<b class='flag-5'>背后</b>,<b class='flag-5'>数据中心</b>储能采购起量