0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI算力GPU开始腾飞,背后是电源管理的持续支持

Simon观察 来源:电子发烧友 作者:黄山明 2024-03-30 00:12 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/黄山明)近期,IDC出具了一份报告显示,AI PC在中国PC市场中新机的装配比例将在未来几年内快速攀升,预计2024年将迅速增长至55%,在2027年将达到85%,而今年也将成为AI PC元年。

不仅是AI PC,还包括AI服务器、AI手机、AI汽车等,众多AI实际应用让算力GPU的需求大增,也在不断追求性能更高的GPU。而随着GPU性能的提升,其功耗与稳定性的难度也随之增加。这就需要电源管理在背后为其提供稳定的电力供应,让GPU提供更好的AI算力支持。

算力GPU背后是电源管理

在AI的高速发展下,对GPU产生了显著影响,如AI领域,特别是深度学习算法需要大量的并行计算能力,GPU因其并行处理单元而成为执行这些任务的理想选择。这推动了GPU性能的不断提升,以满足AI计算的需求。

同时,随着模型复杂度和数据集的不断增长,GPU需要配备更大容量的显存,并提供更高的显存带宽,以满足大数据处理和缓存的需求。在保证算力提升的同时,还需要大幅降低单位功耗,提高能效比,这对于数据中心运维成本和环保都有重要意义。

但这样一来,就会带来几个问题,一个是散热问题。更高的算力意味着更大的发热量,传统的散热解决方案可能无法满足需求,需要创新的散热技术和材料以确保GPU能在高温环境下稳定运行。

另一个挑战是电源管理,更高的功耗要求电源管理模块具备更优秀的转换效率和动态负载适应能力,同时需要实现更加精细化的电源分配和控制策略。而更精细的电源管理,也能在一定程度上降低发热量。

同时,随着GPU性能的提升,其对电源稳定性的要求也更高。电源管理系统需要确保在高负载情况下,GPU能够获得充足且稳定的电力供应。

总的来说,GPU的发展,对提出了包括功耗、电流电压调控速度与精度、稳定性、纹波和噪声控制等方面的要求。

考虑到AI领域对电源需求的快速增长,传统的模拟控制解决方案可能已不再适用,数字控制解决方案因其可扩展性和配置灵活性而成为主流。电源纹波和噪声的控制也成为设计中的一个重要考虑因素,以确保系统的精确性和可靠性。

而数字控制解决方案之所以成为主流,是因为它们在可扩展性、配置灵活性、减少外围器件数量以及更好的稳压性能方面具有明显优势。并且随着AI技术的不断进步和应用领域的扩大,这些特点使得数字控制解决方案更加符合当前和未来AI市场对电源管理的需求。

用于支持GPU的电源管理解决方案与相关企业

目前国内外众多企业提供了多种型号的电源管理芯片,以支持高算力GPU的需求。比如TIADI英飞凌、ST、富士通等,还有国内的如力芯微、希荻微、晶丰明源等。

这些企业提供的电源管理芯片型号众多,具体型号需要根据GPU的功耗、性能要求以及系统设计的具体需求来选择。通常,这些芯片的型号会在其官方网站或产品目录中详细列出,并提供技术支持和设计指南以帮助客户选择合适的产品。

以UCC2871x系列为例,该芯片主要用于提供隔离输出的恒压(CV)和恒流(CC)输出稳压,通常应用于USB兼容适配器和充电器、电视和台式电脑待机电源以及白色家电电源等产品中。

虽然UCC2871x系列芯片本身并不是专门为支持GPU设计的,但它们可以作为电源解决方案的一部分,为GPU提供所需的电源转换和调节功能。GPU通常需要稳定和高效的电源供应,而UCC2871x系列芯片能够提供这种隔离式的电源解决方案,这对于需要隔离电源的GPU应用场景是有益的。

不过要注意的是,GPU通常需要高功率和高效率的电源管理,以及可能需要多相供电和精确的电压调节。因此,如果要将UCC2871x系列芯片应用于GPU的电源设计中,需要确保它们能够满足GPU的具体电源要求,包括功率、效率、电压稳定性和多相供电等。此外,可能还需要其他电源管理芯片或组件来共同工作,以确保整个电源系统能够满足GPU的复杂需求。

而国内的如晶丰明源推出的BPD93010,作为一款10相数字控制电源管理芯片,适用于CPU、GPU、AI等大功率计算芯片供电。这款芯片具备多种电源管理功能和保护特性,如UVLO(欠压锁定)、OTP(过热保护)、OCP(过流保护)、UVP(欠压保护)、OVP(过压保护)、VINOVP(输入电压欠压保护)和VINUVP(输入电压过压保护)等。

BPD93010的设计旨在为高性能计算设备提供高效、稳定的电源解决方案,特别是在需要多相供电的场合。它通过数字控制方式,搭配自主开发的GUI软件,提供智能的应用体验,并支持多种调压协议,如PMBUS/I2C等,以及具备多种保护功能和故障监测能力,适用于高性能计算和AI服务器的电源设计。

当然,还有其他方案,如富士通的32位RISC微控制器MB39C326,虽然它本身不是专门的PMIC,但它可以在系统中辅助进行电源控制和管理。当然,MB39C326并不直接管理电源电路,它更多的是通过逻辑控制和通信来辅助电源管理。实际的电源转换和调节功能仍然需要由专门的电源管理芯片或模块来完成。在设计高性能AI算力GPU的电源系统时,通常会结合使用微控制器和电源管理芯片,以实现高效、稳定的电源供应和控制。

小结

在AI快速发展的当下,对GPU的性能要求越来越高,这也拉高了对其电源管理的要求。GPU的电源管理不仅要提供充足、稳定的电力,还要具有智能化、精细化的调控能力,以确保GPU在性能、效率和稳定性之间取得最佳平衡。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134455
  • AI
    AI
    +关注

    关注

    89

    文章

    38090

    浏览量

    296546
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    湘军,让变成生产

    脑极体
    发布于 :2025年11月25日 22:56:58

    从CPU、GPU到NPU,美格智能持续优化异构计算效能

    前言AI已成为数字经济时代的核心生产,但全球AI产业正面临“供给不足、成本高企、生态待建”三重挑战。据行业统计,行业
    的头像 发表于 11-21 16:05 705次阅读
    从CPU、<b class='flag-5'>GPU</b>到NPU,美格智能<b class='flag-5'>持续</b>优化异构<b class='flag-5'>算</b><b class='flag-5'>力</b>计算效能

    什么是AI模组?

    未来,腾视科技将继续深耕AI模组领域,全力推动AI边缘计算行业的深度发展。随着AI技术的不断演进和物联网应用的
    的头像 发表于 09-19 15:26 1147次阅读
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模组?

    什么是AI模组?

    未来,腾视科技将继续深耕AI模组领域,全力推动AI边缘计算行业的深度发展。随着AI技术的不断演进和物联网应用的
    的头像 发表于 09-19 15:25 429次阅读
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模组?

    一文看懂AI集群

    最近这几年,AI浪潮席卷全球,成为整个社会的关注焦点。大家在讨论AI的时候,经常会提到AI集群。AI
    的头像 发表于 07-23 12:18 966次阅读
    一文看懂<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>集群

    【「芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    前言 【「芯片 | 高性能 CPU/GPU/NPU 微架构分析」书中的芯片知识是比较接近当前的顶尖芯片水平的,同时包含了芯片架构的基础知识,但该部分知识比较晦涩难懂,或许是由于我一直从事的事芯片
    发表于 06-18 19:31

    摩尔线程与AI平台AutoDL达成深度合作

    近日,摩尔线程与国内领先的AI平台AutoDL宣布达成深度合作,双方联合推出面向个人开发者的“摩尔线程专区”,首次将国产GPU
    的头像 发表于 05-23 16:10 1428次阅读

    搭建中心,从了解的GPU 特性开始

    ABSTRACT摘要本文介绍如何搭建,并介绍A100、H100、H200和B200这些GPU的特性。JAEALOT2025年4月23日随着人工智能、大数据和高性能计算(HPC)的快速发展,市场上
    的头像 发表于 04-24 11:08 2979次阅读
    搭建<b class='flag-5'>算</b><b class='flag-5'>力</b>中心,从了解的<b class='flag-5'>GPU</b> 特性<b class='flag-5'>开始</b>

    芯片的生态突围与革命

    据的爆发式增长,大芯片已成为科技竞争的核心领域之一。   大芯片的核心应用场景丰富多样。在人工智能训练与推理方面,大模型(如 GPT、Llama)的训练需要超大规模
    的头像 发表于 04-13 00:02 2607次阅读

    DeepSeek推动AI需求:800G光模块的关键作用

    随着人工智能技术的飞速发展,AI需求正以前所未有的速度增长。DeepSeek等大模型的训练与推理任务对的需求
    发表于 03-25 12:00

    远东股份:助力解锁AI持续未来

    。 记者调查发现,预计到2027年,整个人工智能行业每年的耗电量将达85至134太瓦时,相当于一座大型水电站一年的发电总量。数据中心作为AI的核心载体,需要24/7不间断运行以支持
    的头像 发表于 03-21 16:52 489次阅读
    远东股份:助力解锁<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>可<b class='flag-5'>持续</b>未来

    GPU租用平台有什么好处

    当今,GPU租用平台为科研机构、企业乃至个人开发者提供了灵活高效的解决方案。下面,AI
    的头像 发表于 02-07 10:39 715次阅读

    中心的如何衡量?

    (ComputationalPower)是指智中心通过其内部的计算设备(如CPU、GPUAI芯片等)对数据进行处理和计算的能力。它体现了智中心在单位时间内能够完成的计算任务量,
    的头像 发表于 01-16 14:03 4199次阅读
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量?

    企业AI租赁模式的好处

    构建和维护一个高效、可扩展的AI基础设施,不仅需要巨额的初期投资,还涉及复杂的运维管理持续的技术升级。而
    的头像 发表于 12-24 10:49 1657次阅读