0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI高能耗和难散热问题如何突破?

向欣电子 2025-05-27 14:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着AI技术的广泛应用,从智能手机自动驾驶汽车,从智能家居工业自动化AI供电芯片的需求量正呈爆炸式增长。它不仅为AI系统提供稳定的电力供应,确保系统的正常运行,而且还肩负着节能减排、降低能耗的重任。然而随着算力需求的提升,AI设备的能耗、散热等问题凸显,这无疑给AI供电芯片带来了新的挑战,如何实现高效率、低功耗、持续稳定的供电成为了业界关注的焦点。

能耗“突飞猛进”:算力比拼加速,能耗日益攀升

算力核心设备由传统的CPUGPU的转移,不仅提升了计算效率,更使得复杂的数据处理和深度学习模型得以实现。然而,高性能往往伴随着高能耗。在追求更快计算速度的同时,GPU的能耗也在不断上升,给数据中心和服务器带来了巨大的能源压力。荷兰数据科学家Alex de Vries在专注能源研究的学术期刊《Joule》上发表的一项研究显示,按照当前趋势,到2027年,整个人工智能行业每年将消耗85至134太瓦时的电力(1太瓦时=10亿千瓦时)。

散热“力不从心”:高性能AI芯片的烫手难题

高性能的AI芯片在运行过程中会产生大量热量,如果不能及时有效地散热,不仅会影响设备的稳定运行,还可能缩短其使用寿命,制约AI算力的进一步增长。未来,单颗高性能AI芯片的热设计功耗将突破1000W,达到了传统风冷散热的极限。因此,各大公司纷纷投入研发,探索更有效的散热解决方案,例如行业巨头们正在推进的液冷技术等。

可靠性“摇摆不定”:大模型训练,AI芯片一损俱损

AI应用对芯片的性能与可靠性要求非常高。为了完成一个大模型的训练任务,通常需要几千张甚至几万张计算卡进行级联,提供充足的算力。如果有一张卡出了问题,那么整个大模型的训练都会受到影响。如何定位到失效的板卡也是非常费时费力的工作,严重影响训练的效率。

MPS AI电源解决方案的四大突破,助力化解上述难题

MPS深耕计算领域多年,从笔记本、台式机到自动计算平台,再到数据中心服务器,与各大平台都有紧密的合作。随着传统数据中心通过集成AI技术来实现智能化升级,MPS也在快速迭代电源方案,为行业和客户提供高品质、可靠的AI电源解决方案,适用于AI 推理卡、训练卡、边缘计算设备、超算服务器等各类应用场景。

8a27ddfe-3ac2-11f0-986f-92fbcf53809c.png图1:MPS AI硬件电源解决方案

8a3e4972-3ac2-11f0-986f-92fbcf53809c.png图2:MPS典型AI电源应用

突破一:体量更紧凑、功率密度更高、配电损耗更低

MPS的AI电源方案采用创新设计,体量更紧凑,配电损耗更低,使数据中心在给定机柜范围内的计算能力得以提升。

相比竞争对手的方案,MPS的功率转换技术在主板上占用的空间更小,这样所有处理器能更紧密地结合为一体,在更小的空间内实现更强的计算能力。下图是MPS新型开放式框架电源模块Intelli-Module的3D概念图,展现了高度集成的数字多相电源模块。

8a51ad64-3ac2-11f0-986f-92fbcf53809c.png图3:高度集成的Intelli-Module

MPS 专注改善数据中心的功率密度,因为数据中心面临着人工智能等新计算应用的更大功率需求。以创新手段提升功率密度意味着减小配电损耗,从而降低数据中心的总运营成本、单次计算输出的总成本以及碳排放。而机柜数量减少后,数据中心的物理占用空间也能最大限度地缩减。

130A、两相、非隔离式降压电源模块MPC22167-130是MPS Intelli-Module系列的最新产品,它将 DrMOS、电感和其他无源元件集成到单个封装中,不仅占位面积小,功率密度还提高了2.5 倍。而且,它允许将多相稳压器(VR)放置在更靠近处理器的位置,从而减少了配电网络 (PDN) 的损耗(见图4)。

8a68442a-3ac2-11f0-986f-92fbcf53809c.png图4: Intelli-Module 与 DrMOS 的占板面积比较

多个 MPC22167-130 器件可与第一级电源模块配合使用,以支持端到端的电源解决方案,同时能够满足AI 处理器的高功率要求。下图展示了采用 MPC22167-130 实现的参考设计示例。

8aaff572-3ac2-11f0-986f-92fbcf53809c.png图5:具有 48V 输入和 0.8V 输出的 2000A OAM 外形规格参考设计

该参考设计可应用于OAM 形态的 AI 处理器,它采用 MPC22167-130 支持 2000A 的最大输出电流 (IOUT),其中第二级方案的设计采用了MPC22167-130 与 数字16 相控制器MP2891的组合方案。

突破二:电源转换效率更高、顶部散热设计兼容液冷

为了解决高功率密度电源模块中的散热问题,MPS多管齐下:一方面优化内部结构和器件设计,提升电源转换效率,降低功耗,同时减少热量产生,确保设备稳定运行;另一方面,将模块做成顶部散热,方便散热器的设计;不仅如此,器件还能兼容液冷的应用,借助液冷增强服务器散热效果,从而进一步发挥电源的极致性能,使单机柜功率大幅提升。

8adea84a-3ac2-11f0-986f-92fbcf53809c.png图6:MPS磁芯设计对电源模块效率的影响

突破三:严密的仿真计算、严格的出厂测试

AI芯片批量的一致性和可靠性是非常重要的,没有多年的经验积累和严格的市场检验,是磨砺不出好的AI电源的。MPS在设计阶段,会通过仿真和理论计算,确定所有器件的工作条件,从而选取合适的电子器件。采用高电流等级、高耐压的电子器件,内部电感为MPS专利设计,饱和电流高。而在研发阶段,MPS则采用不同批次的模块产品进行可靠性实验,出厂前会逐项测试模块电气性能及参数,最后还会进行老化测试及前后参数对比分析。

8afb9504-3ac2-11f0-986f-92fbcf53809c.png图7: MP2891 和MPC22167-130 的 SIMPLIS 模型

8b1f09bc-3ac2-11f0-986f-92fbcf53809c.png图8:SIMPLIS 仿真与实验室测量的比较,误差仅为 5mV

突破四:实用的仿真工具、专业的技术支持、灵活的供应链管理

MPS能够提供很多好用的前期评估工具,如PDN仿真工具、仿真模型、灵活的GUI等,在前期和后期都能协助客户更方便地进行方案测试,确保精准落地。

8b4485a2-3ac2-11f0-986f-92fbcf53809c.png图9:由 MPS 支持的用户测试可视化界面(GUI)

同时,MPS的工程师也将全程提供专业的技术支持,帮助客户及时解决实际应用中遇到的难题。另外,MPS采用供应链multi-source管理,提高供应链的灵活性和自主性,优化生产工艺,以保证充足的产能,支撑AI对芯片大规模用量的需求。

MPS 电源方案,助力每一个人工智能(AI)硬件系统!

MPS 的AI电源解决方案提高了数据中心的计算能力,创新型电源架构方法增大了每个机柜的功率密度,减小了服务器的配电损耗,在提升AI算力的同时有效降低能耗,从而助力节省能源和降低运行成本。另外,兼容液冷应用的设计、芯片的一致性与可靠性保障、便捷好用的仿真工具、专业及时的技术支持、灵活自主的供应链等众多优势,也能够让客户在设计方案时更省时、更安心!


以上部分资料转载“车乾6G”网络平台,文章仅仅用于交流学习版权归原作者。如有侵权,请告知立删。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 散热
    +关注

    关注

    4

    文章

    618

    浏览量

    33359
  • AI
    AI
    +关注

    关注

    91

    文章

    41101

    浏览量

    302580
  • 供电芯片
    +关注

    关注

    0

    文章

    14

    浏览量

    5553
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    近20年来最大突破!中国科研团队攻克芯片散热难题

    电子发烧友网报道(文/李弯弯)当今科技飞速发展,芯片作为电子设备核心部件,性能提升推动各领域进步,但散热问题长期制约其性能突破。随着人工智能大模型和高性能计算爆发式增长,芯片功耗和发热密度指数级上升
    的头像 发表于 01-16 08:06 8401次阅读
    近20年来最大<b class='flag-5'>突破</b>!中国科研团队攻克芯片<b class='flag-5'>散热</b>难题

    中央空调运维能耗高?安科瑞一套系统全解决

    的 40%~60% ,但长期以来普遍存在 运行粗放、调节滞后、能耗不透明、故障预判、多区域统一管理 等问题。一边是居高不下的电费账单,一边是冷热不均、用户体验差,传统运维模式已难以满足现代化、数字化、低碳化的管理需求。 安科
    的头像 发表于 04-16 16:25 85次阅读
    中央空调运维<b class='flag-5'>难</b>、<b class='flag-5'>能耗</b>高?安科瑞一套系统全解决

    筑玻璃深加工困局破解:新启航激光打孔替代水刀,攻克高污染高能耗难题

    一、引言 在绿色制造理念深度践行与环保政策日趋严格的背景下,玻璃深加工行业正面临高污染、高能耗的双重困局。作为核心加工环节的传统水刀打孔工艺,虽具备通用性优势,却因水资源与磨料的大量消耗、含磨料废水
    的头像 发表于 02-12 10:31 677次阅读

    【节能学院】破解公共建筑高能耗难题:安科瑞能耗监测与定额管理双轮驱动

    一、公共建筑能耗现状与节能政策导向公共建筑是人们开展各类公共活动的场所,其用能场景广泛,涵盖中央空调、通风新风、电梯扶梯、照明亮化等多个领域,且多数用能设备为大功率、24小时不间断运行,这一特性使得
    的头像 发表于 01-08 08:06 306次阅读
    【节能学院】破解公共建筑<b class='flag-5'>高能耗</b>难题:安科瑞<b class='flag-5'>能耗</b>监测与定额管理双轮驱动

    【节能学院】安科瑞连锁餐饮能源管控方案:破解能耗难题

    一、行业痛点:高能耗制约盈利对于连锁餐饮品牌而言,后厨的烟火气是盈利的底气,但电表上飞速跳动的数字,却往往成为运营的“隐忧”。从后厨的灶台、蒸柜,到前厅的空调、照明,再到冷链保鲜的冷库、冰箱,电力
    的头像 发表于 01-05 08:50 312次阅读
    【节能学院】安科瑞连锁餐饮能源管控方案:破解<b class='flag-5'>能耗</b>难题

    智能工厂能源监测管理系统

    加强重点用能单位能耗在线监测系统建设,提高数据时效性与准确性。 行业痛点 数据收集:水表、电表等仪表分散,人工收集成本高、效率低,存在滞后性与数据不准确问题。 异常能耗控:异常
    的头像 发表于 12-04 16:39 625次阅读
    智能工厂能源监测管理系统

    液冷散热时代:AI服务器如何重构磁元件设计

    随着AI服务器功率密度的快速提升,传统的风冷散热方案在热管理方面逐渐面临挑战。在此背景下,液冷散热技术正加速应用于数据中心,特别是高算力的AI集群中。 这一
    的头像 发表于 11-21 11:42 1086次阅读
    液冷<b class='flag-5'>散热</b>时代:<b class='flag-5'>AI</b>服务器如何重构磁元件设计

    Chroma 62150H-600大功率直流电源:高能耗电子测试的可靠动力基石

    为满足此类高能耗测试需求而设计的高性能解决方案,以其强大的输出能力、高精度和卓越的可靠性,成为大功率测试领域的核心设备。
    的头像 发表于 11-20 17:46 915次阅读

    微软最新研发微流体冷却系统助力散热效率提升最高三倍

    AI技术芯片的功耗和热量不断攀升,散热成为技术进步新瓶颈。微软最新研发的微流体冷却系统突破传统冷板限制,将液体冷却剂直接引入芯片内部,散热效率提升最高3倍。这项技术不仅显著降低温升与
    的头像 发表于 11-17 09:39 960次阅读

    AI赋能储能管理系统,通过AI模型提高能耗管理

    AI赋能储能管理系统,通过AI模型提高能耗管理 在能源转型成为全球共识的今天,储能系统作为平衡能源供需、消纳可再生能源的关键环节,其地位日益凸显。然而,传统的储能管理系统多依赖于预设的、固定的充放电
    的头像 发表于 11-05 17:52 983次阅读

    港口高能耗设备数据采集能源监测系统方案

    桩、冷库、泵站等高能耗设备不仅消耗大量能源,其能源利用效率也参差不齐,进一步加剧了能源浪费的问题。 《港口能源消耗在线监测系统建设规范》指出,港口作为综合交通运输体系的重要枢纽,充分利用信息化技术,实时精准
    的头像 发表于 09-18 17:10 662次阅读
    港口<b class='flag-5'>高能耗</b>设备数据采集能源监测系统方案

    福田启明星定义纯电轻卡价值新标准

    对新能源轻卡用户而言,能效从来不是单一的“省不省电”,而是“能耗够低”与“效率够高”的双向考验。福田启明星以“科技升维+场景适配”的双重颠覆,彻底打破了“强动力必高能耗、低能耗必弱性能”的行业认知,实现了
    的头像 发表于 08-15 10:13 1228次阅读

    仓储能耗监测物联网解决方案

    仓储行业作为物流体系的重要节点,近年来随着电商、快递等行业的迅猛发展,规模持续扩张。然而,传统仓储模式在能源利用方面存在诸多不足,高能耗问题日益凸显。仓储空间大、设备众多,照明、空调、通风等设备需
    的头像 发表于 07-16 17:19 724次阅读
    仓储<b class='flag-5'>能耗</b>监测物联网解决方案

    【智能控温,性能全开!】峰岹科技推出FT3207手机主动散热芯片,降温效率提升15%

    FT3207芯片——突破散热瓶颈,激活AI性能5G+AI时代算力爆发,芯片性能与发热量同步攀升。高温降频、器件老化、体验衰减——传统被动散热
    的头像 发表于 06-23 10:00 2152次阅读
    【智能控温,性能全开!】峰岹科技推出FT3207手机主动<b class='flag-5'>散热</b>芯片,降温效率提升15%

    工业网关如何采集能耗数据以提高能源利用效率

    工业网关采集能耗数据并提高能源利用效率,主要通过以下几个关键步骤实现: 数据采集 连接计量设备:工业网关可与各类能耗计量设备,如电表、水表、气表等相连接。通过相应的通信接口,如RS485
    的头像 发表于 05-06 14:37 826次阅读