0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浅谈大算力GPU电源架构设计及器件选型

贸泽电子 来源:贸泽电子 2026-06-04 11:11 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

针对大算力GPU,如当前主流的AI加速卡、大模型训练集群节点,电源管理已经从“配套边缘”变成了决定算力上限的“核心瓶颈”。

在几百瓦甚至突破千瓦的单芯片功耗下,GPU核心电压(Vcore)通常低于1V,这意味着核心电流往往超过1000A,且瞬间电流突变率(di/dt)可高达1000A/μs以上。传统的12V多相降压架构在这种极端的瞬态响应和巨大的I²R损耗面前已无法满足需求。

那么,大算力的GPU选取什么样的电源架构,才能满足其高能效的需求呢?

大算力GPU核心电源架构演进

为了应对“千安级”电流,当前的GPU电源架构主要沿着两个维度突围,即拓扑创新与空间物理位置的革新。以下为大算力GPU当前主流的三大高能效电源管理架构:

TLVR(跨导电感电压调节器)——当前主流的横向供电架构

在传统多相降压转换器拓扑中,电感值在稳定状态下和瞬态事件期间是恒定的。因此,选择电感值时需要在瞬态响应、功率损耗以及电压纹波和电流纹波之间进行权衡。为了兼顾效率和减小电流纹波,电感值不能太小;但电感大了,瞬态响应就慢,GPU瞬间拉载时电压会暴跌。

TLVR拓扑源自多相半桥降压转换器拓扑,但将每个相位的单绕组电感器替换为双绕组耦合电感器,当GPU发生巨大瞬态负载时,TLVR能够让所有电源相在极短时间内(几十纳秒级)同时响应,瞬间产生巨大的电流。这极大地减少了对主板输出电容数量的依赖,节省了GPU周边的宝贵空间。

英飞凌TDM24745T是一款OptiMOS四相AI电源模块,该模块将四个功率级、TLVR电感和解耦电容集成到紧凑的9x10x5mm³封装中,电流密度高达2 A/mm²以上,拥有高达320A的峰值电流能力,特别适用于下一代AI处理器和高电流多处理器平台。

48V两级转换架构——大算力GPU的标

传统数据中心和服务器主板采用12V配电。但随着单机柜功率突破数十千瓦,12V传输会产生极大的电流和线损。当前最前沿的架构,如Google主导的开放计算项目OCP架构,直接将48V引入主板,甚至直接通过单级或极少级数的转换送到处理器(PoL)。相比12V,48V在相同功率下电流降为1/4,传输损耗理论上可降至1/16。

在实际应用的电源方案中,从能效和散热等角度考虑,并不会选择一步到位将48V直接降至GPU核心所需的0.8V,而是采用两级转换策略。48V两级转换方案具有更高效率、更低成本和可调性优势。其工作过程是首先将VIN电源(48V)直接送到加速卡边缘——通常先用一个高密度、无稳压的开关电容转换器(STC)或LLC谐振变换器,以接近98%的效率将48V降为12V左右的中间电压;然后,再由紧靠GPU的传统多相Buck(通常结合TLVR)完成12V到0.8V的精准稳压。随着输入电压的降低,这些多相变换器的峰值效率可高达约97%。

EPC9159是一款1kW、48V/12V固定比的微型转换器,可实现5130W/in3的功率密度。在48V功率级EPC9159采用100V的EPC2619e GaN FET,而在12V功率级采用的是40V的EPC2067。该转换器基于LLC拓扑,由初级侧全桥、固定比率平面变压器、次级中心同步整流器组成。初级侧全桥使用4个EPC2619,次级侧使用6个EPC2067。这款产品专为高功率密度48V服务器电源和DC/DC转换器而设计。

VPD(垂直供电架构)——未来的终极形态

现代GPU有数百亿个晶体管,在大幅提升处理器性能的同时,其代价是电源需求的指数级增长。即使把电源芯片贴在GPU四周(横向供电),从电源到GPU硅片之间几厘米的PCB铜箔走线在1000A电流下也会产生几十毫伏的压降和巨大的发热。

目前看来,垂直供电是以最低PDN(电源分配网络)阻抗在处理器内核低电压下提供大电流的未来终极方式。在这种架构中,电流倍增器和旁路电容器一起堆叠,形成一个集成电源模块,可取代旁路电容器组合。电源模块将直接安装在GPU封装的正背面(主板另一侧),电流通过主板的过孔垂直向上直接注入GPU。此举可将供电路径从“厘米级”缩短到“毫米级”,彻底消除主板走线的寄生电阻,PDN损耗可减少80%以上。

Vicor推出的面向直接由48V供电的高性能GPU、CPUASIC(XPU)处理器的ChiP-set模块,是VPD架构的代表性产品。它由一个驱动器模块MCD4609和一对电流倍增器模块MCM4609组成,可提供高达650A的持续电流和1200A的峰值电流。电流倍增器不仅能够提供超过1000A的大电流,还可让PDN阻抗锐降50倍。极小的空间占用使得电流倍增器可部署在靠近处理器的位置,不仅能显著降低PDN损耗,而且还能提高电源系统效率,电流密度达到2A/mm2。通过“最后一英寸”供电,Vicor 4609 ChiP-set克服了为高功率处理器进行大电流传输造成的障碍。

48V两级转换架构设计及器件选型

在算力功耗动辄突破1000W的今天,直接将48V转换为0.8V核心电压面临着极大的物理挑战。如果是48V转0.8V,占空比仅为1.6%。在几百kHz甚至MHz的开关频率下,极窄的导通时间会导致巨大的开关损耗,且瞬态响应极差。

因此,48V两级转换架构成为当前大算力系统的主流方案。它将“高压变压”和“精准稳压”解耦,由两级电路各司其职。以下是针对该架构设计方案中主要器件选型的一些建议:

第一级:中间总线转换器

第一级的核心任务是按比例降压(DCX)和提供隔离(可选),它通常不负责精准的电压调节,而是以最高效率将48V降压。LLC谐振变换器利用电感和电容的谐振,实现开关管的零电压开通(ZVS)和零电流关断(ZCS),效率极高(通常>98%),具备电气隔离能力,技术成熟。但必须使用体积较大的变压器和谐振电感,在GPU寸土寸金的板级空间上较难布局,通常做成垂直插卡的模块(如OCP标准的非稳压隔离模块)。开关电容/开关储能转换器(STC)依靠电容组和MOSFET阵列进行电荷转移来实现按比例降压(如4:1降至12V,或8:1降至6V)。没有大体积的电感,功率密度极高,可以做得非常薄,紧贴甚至埋入主板。但不具备隔离功能,启动时有浪涌电流问题,需软启动设计。这种是目前AI硬件企业非常青睐的板上第一级方案。

控制器的选择:需选专用的LLC数字控制器或STC控制器。Texas Instruments、MPS、Renesas、Infineon均有专门针对48V至12V/6V的LLC、STC控制器芯片。Infineon的XDPP1100是标准48V至12V隔离DC/DC转换器,这是一款自带Cortex-M0内核的高端数字电源控制器,全面支持PMBus,适用于隔离式DC/DC电源应用。

功率器件(FETs)的选择:48V侧推荐使用80V-100V的GaN FET(EPC、Infineon均有相应的产品)或极低RDS(on)的硅基MOSFET。GaN在此频段的无反向恢复电荷特性可将效率推向99%。例如,专为48V中间总线架构设计的EPC2367,其RDS(on)低至1.2mΩ。

无源器件的选择:STC拓扑对电容要求极高,必须使用低ESR、耐高频纹波的X7R/X7T MLCC(多层陶瓷电容)。

第二级:负载点稳压器

第二级的核心任务是精准稳压和应对极端瞬态(di/dt),它直接面对要求严苛的GPU核心。传统多相降压可将12V或6V中间电压降至0.8V,相数通常在8相到24相甚至更多。如果第一级降至12V,中间总线电流较小,PCB走线容易;如果降至6V,第二级的降压比更大(6V降0.8V远比12V降0.8V轻松),第二级效率更高,但6V总线电流翻倍,考验主板铺铜能力。

TLVR在多相Buck的基础上,将各相电感耦合,以牺牲极小效率的代价,换取优异的瞬态响应速度,是目前顶配AI卡的标配。所选择的器件,必须具备PMBus/AVSBus通信能力,建议选择具备非线性控制算法(如MPS的恒定导通时间COT算法)的高端系列。

TLVR电感则需选用低损耗铁氧体材质的双绕组电感,确保主绕组DCR<0.2mΩ。

本文小结

随着人工智能(AI)、大型数据中心、新能源汽车以及边缘计算的飞速发展,系统对算力的要求呈指数级增长,随之而来的功耗问题使得高能效电源管理架构成为当前硬件设计的核心技术壁垒。

以目前主流的产品为例,单颗数据中心GPU的功耗已经从700W(H100)飙升至1000W甚至1200W(B200),传统12V架构早已无法承受巨大的电流和线损。采用48V电源可将输入电流降至20A左右,大幅降低了PDN的损耗。然而,一步到位地将48V直接降至GPU核心所需的0.8V,单级降压占空比又太小,极难控制且效率低下。两级转换架构完美解耦了这个矛盾。

OCP组织已将48V确立为下一代机柜的标准配电电压。接下来,48V两级转换架构不仅会成为应用的主流,它实质上已经是大算力GPU的标配,并在未来3-5年内的数据中心市场占据主导地位。

不过,合理的架构也需要满足要求的器件才能实现目标性能。因此,选择合适的电源器件是发挥GPU大算力的重要一环,值得我们花时间去研究。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 电源
    +关注

    关注

    185

    文章

    19090

    浏览量

    265385
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5350

    浏览量

    136328
  • Vicor
    +关注

    关注

    4

    文章

    251

    浏览量

    60871
  • 算力
    +关注

    关注

    2

    文章

    1822

    浏览量

    16881

原文标题:大算力GPU的高效供电:从电源架构设计到器件选型,一文讲透!

文章出处:【微信号:贸泽电子,微信公众号:贸泽电子】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    名单公布!【书籍评测活动NO.43】 芯片 | 高性能 CPU/GPU/NPU 微架构分析

    。本书对华为等厂商推出的NPU芯片设计也做了架构描述,中国也拥有独立自主知识产权的高芯片,并且支持多芯片、高带宽互连。本书也回顾了近20年来主流的CPU、GPU芯片
    发表于 09-02 10:09

    【「芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--全书概览

    GPU、NPU,给我们剖析了芯片的微架构。书中有对芯片方案商处理器的讲解,理论联系实际,使读者能更好理解
    发表于 10-15 22:08

    【「芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--了解芯片GPU

    着色器(Pixel shader)是图形流水线中相当强大的功能单元,因为它可以为每个片段执行复杂的计算,从而为最终渲染的图像添加细节和视觉效果。 DirectX API推动 GPU 演进
    发表于 11-03 12:55

    【「芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    前言 【「芯片 | 高性能 CPU/GPU/NPU 微架构分析」书中的芯片知识是比较接近当前的顶尖芯片水平的,同时包含了芯片架构的基础知
    发表于 06-18 19:31

    湘军,让变成生产

    脑极体
    发布于 :2025年11月25日 22:56:58

    手机机构设浅谈

    手机机构设浅谈
    发表于 11-13 11:21

    浅谈数字隔离器件选型与应用

    关于数字隔离器件选型与应用的资料分享。附件浅谈数字隔离器件选型与应用.doc167.5 KB
    发表于 12-11 09:23

    数据、算法和其实现载体是什么

    背景介绍数据、算法和是人工智能技术的三大要素。其中,体现着人工智能(AI)技术具体实现的能力,实现载体主要有CPU、GPU、FPGA
    发表于 07-26 06:47

    IBM全新AI芯片设计登上Nature,解决GPU瓶颈

    现如今的人工智能的神经网络与GPU密不可分,但是GPU对于未来神经网络的发展是不够用的,好在IBM全新AI芯片设计,能够解决GPU
    发表于 06-13 09:28 1807次阅读

    GPU如何突破供需瓶颈

    演讲嘉宾,探讨后GPT时代需求激增带来的挑战以及GPU如何突破供需瓶颈、推动人工智能产业普惠化发展。   沐曦联合创始人、CTO兼首
    的头像 发表于 08-22 10:26 2213次阅读

    揭秘GPU: 高端GPU架构设计的挑战

    在计算领域,GPU(图形处理单元)一直是性能飞跃的代表。众所周知,高端GPU的设计充满了挑战。GPU架构创新,为软件承接大模型训练和推理场景的人工智能计算提供了持续提升的硬件基础。
    的头像 发表于 12-21 08:28 2062次阅读
    揭秘<b class='flag-5'>GPU</b>: 高端<b class='flag-5'>GPU</b><b class='flag-5'>架构设</b>计的挑战

    服务器为什么选择GPU

    随着人工智能技术的快速普及,需求日益增长。智中心的服务器作为支撑大规模数据处理和计算的核心设备,其性能优化显得尤为关键。而GPU服务器也进入了大众的视野,成为高性能计算的首选。那
    的头像 发表于 07-25 08:28 2686次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b>服务器为什么选择<b class='flag-5'>GPU</b>

    GPU租用平台是什么

    GPU租用平台是一种基于云计算的服务模式,它允许用户通过互联网按需租用高性能GPU资源,而无需自行购买、部署和维护这些硬件。
    的头像 发表于 10-16 10:15 1342次阅读

    【一文看懂】大白话解释“GPUGPU

    随着大模型的兴起,“GPU”这个词正频繁出现在人工智能、游戏、图形设计等工作场景中,什么是GPU,它与CPU的区别是什么?以及到底什么是GPU
    的头像 发表于 10-29 08:05 5172次阅读
    【一文看懂】大白话解释“<b class='flag-5'>GPU</b>与<b class='flag-5'>GPU</b><b class='flag-5'>算</b><b class='flag-5'>力</b>”

    GPU租用平台有什么好处

    当今,GPU租用平台为科研机构、企业乃至个人开发者提供了灵活高效的解决方案。下面,AI部落小编带您深入探讨
    的头像 发表于 02-07 10:39 1037次阅读