随着《新一代人工智能发展规划》进入第二阶段实施,我国人工智能产业正进入快速跃升期。
2024年,人工智能核心产业规模从180亿元跃升至6000亿元,企业数量突破4700家。
其中,算力无疑是支撑一切的核心基石。相关预测显示,在未来五年内,将有约60%的新增数据中心容量专门用于满足AI工作负载的需求。随着算力需求呈指数级增长与快速迭代,单集群算力规模已成功突破万卡级别,单机柜功率密度更是攀升至40-100kW新高度,数据中心的设计标准正在被重新定义。
电力系统作为核心承载环节,正面临前所未有的挑战,而UPS(不间断电源)作为保障电力连续性与安全性的关键设备,其角色与技术形态亦需随之演进:
1UPS需要满足兆瓦级的电力供给需求;
2更需在空间利用效率、功率密度极限、动态响应能力和系统可靠性等多个维度实现新突破;
以保障高性能、高可用、高能效的智算中心运行环境。
本期《数据中心·Future Talk》,来自
空港智算中心运营总经理、上海嘉唐副总 占冰强
北京超级云计算中心技术专家 郭跃
施耐德电气关键电源系统业务产品经理 连博
围绕AI驱动下的算力飞跃,智算中心电力保障如何成为发展的关键话题展开深入讨论,揭示电力保障如何助力智算中心实现高效、稳定与可持续发展。
AI时代的算力革命
能效与成本的平衡之道
由于人工智能的发展不断推高算力需求,我国智能算力发展速度远超预期。
中国信息通信研究院人工智能研究中心副总工程师王蕴韬看到AI对于算力发展带来了四个显著变化:
1硬件层面:不同AI应用场景对硬件架构提出了适配异构硬件环境、硬件热插拔等更多样化的需求。而且硬件架构需要具备更强的灵活性与快速部署能力,以适应高频更新的AI算法和任务。
2网络层面:随着大模型训练与推理任务日益复杂,传统的全连接网络架构已难以支撑多任务、多层级并发计算的需求。要求网络实现环形连接,具备分层调度与高速通信能力,从而确保整体算力利用率。
3软件层面:面对大模型在多场景、多应用中的广泛部署,现有系统需要进行调整与优化,以更好地满足不断增长的新需求。软件定义数据中心的发展变得尤为重要,特别是在资源切片与动态调度方面,已成为现实且紧迫的话题。
4电力层面:由于硬件架构的多样化以及软件环境的差异,电力需求呈现出高度不确定性和差异性。这对供电系统在热插拔支持、模块化设计,以及对电力消耗的动态预测、实时感知与自适应调节能力等方面,均提出了更高的要求。
具体到智算中心的运营,随着算力的变化,能效也需要进一步达到平衡。空港智算中心运营总经理、上海嘉唐副总经理占冰强表示,成本控制是当前智算中心最关注的核心问题。
一方面需要关注电力成本,另一方面则通过引入高端芯片,在相同功耗下提升单位算力,从而实现整体运营成本的有效降低。
为了向用户提供更加稳定高效的算力服务,北京超算从资源调度、散热设计、运维韧性和成本优化四个维度着手,构建差异化的高效稳定运营体系。北京超级云计算中心技术专家郭跃指出,借助基于地域特性的动态负载调度,结合极简架构和自然能源实现散热管理最大化,同时通过韧性设计保障极端环境下的运行稳定,并在电力成本控制与商业模式创新方面持续探索。
“AI工作负载具备高密度、高能耗、工作负载波动大等特性,要求智算中心在适应增长的同时确保供配电的韧性与可靠性,并平衡经济效益与环境保护。”施耐德电气关键电源业务产品经理连博表示。面对AI驱动下持续扩张的算力需求,不仅需要更多,还需要更优质的电力资源,同时电力系统本身也必须适配AI的多变特性与高效运行标准。
智算中心的电力革命
UPS的关键角色与创新突破
根据国际能源署(IEA)发布的数据,2024年全球数据中心的用电量已达到415太瓦时,占全球总用电量的1.5%。随着AI训练与推理任务的快速增长,这一数字预计到2030年将超过945太瓦时,几乎翻倍。
如此庞大的需求无疑对能源供应提出了多维度的挑战。王蕴韬认为当前智算中心面临的电力挑战可以从四个方面思考和应对:
1传统安全问题,AI服务器具备高功率、高密度的特性,运行过程中涉及大量大电流场景;
2能量转化效率,在兆瓦级功耗已成为智算中心常态的背景下,电力系统的转化效率需维持在97%以上;
3AI应用场景的不确定性,传统“土建+电改”模式已难以满足快速部署与多样化扩展的需求,供电系统需要通过模块化设计和改造,适应不断变化的应用场景;
4模型训练的新要求,大模型训练周期长、任务复杂,对供电系统的连续性与稳定性提出更高标准。
在应对这些挑战的过程中,用户正将关注重点聚焦在功耗控制与电力优化。占冰强认为,智算中心在建设与运维过程中高度重视SLA(服务等级协议),尤其对供电连续性与系统稳定性提出严格要求。
为降低电力开支,不少智算中心正在探索将新能源引入传统供电体系,实现成本与可持续性的双重优化。
在运营层面,液冷技术正逐步成为提升机房效率的关键手段,相较于传统风冷方式,液冷有助于提高单柜设备部署密度,减少空间浪费,并降低对空调系统的依赖,从而有效优化PUE水平,提升整体能效与资源利用率。
“电力供应已从传统的‘稳定即可’升级为‘高连续、高密度、高智能’的新型需求体系。”郭跃指出。AI用户对电力的需求变化主要体现电力连续性、电力密度、电力智能化几大维度,所以在UPS的选择上也要重点去考虑这些问题,因为一旦出现中断,可能不仅仅是简单经济赔偿,更可能导致关键业务中断、服务不可用,造成难以挽回的损失。
施耐德电气关键电源系统业务产品经理连博:作为全球首台三相UPS的缔造者和模块化理念的开创者,施耐德电气在UPS领域拥有将近半个世纪的深厚积淀。
Galaxy VXL作为其最新一代兆瓦级UPS产品,覆盖500至1250 kW(400V)功率范围。该产品集高密度、模块化、可扩展及冗余设计于一体,具备卓越的空间利用率、领先的功率密度和出色的安全性能。
Galaxy VXL全面适配各类AI应用场景,不仅在功率密度和空间优化上实现突破,还专门针对AI负载做了适配性设计:
1Galaxy VXL通过专利技术获得了97.5%,最高至99%的整机效率;
2获得TÜV的在线插拔认证,在保证设备本身高效、安全、可靠的前提下,可显著提升用户运维效率和运维安全;
3通过采用多极传导创新设计,专注解决高密度设计带来的散热难题,使得该机型可以在0-50摄氏度工况下正常工作。
4......
将“高安全可靠”贯穿于产品的全生命周期,确保系统稳定运行。
电力保障的进化革命
绿色驱动下的可持续发展
随着AI算力不断跃升,电力保障、能效与低碳管理,正成为智算中心未来发展的三大核心命题。
智算中心需要构建绿色碳足迹的全生命周期追踪能力建设,这应涵盖包括UPS在内的所有设备从原材料选取、制造、运输、运维直至回收的全过程。
此外增加新能源的使用可以进一步达到可持续的目标,需要注意光伏和风能等新能源虽然具备环保优势,但其波动性和不确定性对稳定供电提出了严峻挑战。因此,实现能源的动态保障和匹配,确保供电的可靠性和灵活性,是未来发展的重要探讨方向。
未来,UPS及相关设备应向着高度模块化和可扩展性进行设计,以满足AI带来的多变需求和不确定性。王蕴韬指出,UPS的整体架构及设备细节设计必须兼顾高性能与高可靠性,确保其在智能算力时代具备更强的竞争力和适应能力。
占冰强也有着同样的看法,他看到,未来电力保障上有很多优化空间。由于全国各地电价差异及昼夜波动,合理调度不同区域的算力资源,实现错峰用电,能够显著降低能源成本,提升运维效率。同时,随着智算中心对PUE指标要求日益严格,液冷技术逐渐成为趋势,但液冷机柜适配及冷却液技术仍需进一步突破。此外,单机柜功率需求不断增长,推动机柜设计向更高功率密度发展。
整体看来,电力供应的稳定性、效率和调度灵活性,是智算中心未来优化的核心方向。郭跃认为,在高密度、高能耗的AI场景中,如何以更清洁、更稳定的方式提供电力,已成为影响算力部署效率和持续性的核心因素。
1一方面,海底数据中心等新型部署方式,借助海洋环境助力降温并提升能源利用效率,为绿色供电提供了新解法。
2另一方面,借助“东数西算”带来的区域电力优势,通过在电价较低、能源资源丰富的地区部署数据中心,不仅降低了运营成本,也提升了整体电力保障能力。
在可持续发展领域深耕多年的施耐德电气,一直致力于打造绿色可持续发展的产品。连博表示,以V系列UPS为代表,Galaxy VS和VXL产品均已入选国家工信部绿色制造名单。而且VXL在延续绿色设计理念的基础上,全面采用可回收、低碳足迹的原材料,每年可减少超2吨原材料使用,相当于将碳排放减少约34%。
面对AI驱动的快速变革,数据中心的电力系统正从传统的“幕后支撑”跃升为智算时代的“关键使能”力量。UPS等关键设备的持续进化,不仅代表技术层面的重大突破,更是推动数字经济与绿色低碳转型的关键契机,这一进化为全球智能算力的安全、高效与可持续运行提供了坚实的能源底座,并有力支撑未来发展目标的实现。
-
电力系统
+关注
关注
18文章
3955浏览量
57849 -
AI
+关注
关注
89文章
38085浏览量
296325 -
人工智能
+关注
关注
1813文章
49734浏览量
261396
原文标题:从AI崛起到智算中心腾飞,电力保障如何重新定义未来?
文章出处:【微信号:施耐德电气,微信公众号:施耐德电气】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
不间断电源(UPS):电力保障的“最后一道防线”
优比施UT-3KVA UPS电源深度评测:企业级电力保障的“全能选手”
英威腾为智慧安防基地提供零中断电力保障
380V三相电UPS电源:工业级电力保障的终极解决方案
聚焦冠坤台系电容:如何为汽车电子设备提供 “长效电力保障”
施耐德电气Galaxy VXL UPS助力智算中心发展
广州邮科通信电源:220V交流输入,48V50A直流输出,强大电力保障
简单认识安森美AI数据中心电源解决方案
实验室智慧配电房建设方案:打造安全高效的电力保障
会展中心电力智慧系统方案:打造安全高效的能源中枢
DeepSeek推动AI算力需求:800G光模块的关键作用
7×24小时稳定守护:AMC100保障数据中心电力零中断

智算中心电力保障如何成为发展的关键
评论