0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI芯片成为耗电大户,负载功耗接近一个小国家?

手机技术资讯 来源:半导体行业观察 2023-11-25 17:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

如今,对人工智能的需求巨大。法国施耐德电气公司估计,2023年人工智能工作负载的功耗总计约为4.3吉瓦(GW),略低于塞浦路斯国家2021年的功耗( 4.7吉瓦)。该公司预计,人工智能工作负载的功耗将以26%至36%的复合年增长率(CAGR)增长,这意味着到2028年,人工智能工作负载的功耗将从13.5吉瓦增至20吉瓦,这比冰岛2021年消费的电力消耗还要多。

巨大的电力需求

据施耐德电气称,到 2023 年,所有数据中心的总功耗预计将达到 54 GW,其中人工智能工作负载将占到 4.3 GW。在这些人工智能工作负载中,训练和推理之间的分配特点是 20% 的功耗用于训练目的,80% 分配给推理任务。这意味着人工智能工作负载将占今年数据中心总功耗的约8%。

展望 2028 年,施耐德预计数据中心的总能耗将增至 90 吉瓦,其中人工智能工作负载的能耗将达到 13.5 吉瓦至 20 吉瓦。这表明,到 2028 年,人工智能可能消耗数据中心总用电量的 15% 至 20% 左右,这表明数据中心人工智能工作负载的功耗比例在五年内显着增加。根据施耐德电气的估计,训练和推理之间的分布预计将略有变化,训练消耗 15% 的电力,推理则占 85%。

AI GPU 变得更加“饥饿”

人工智能数据中心功耗不断上升的主要原因是人工智能工作负载的加剧、人工智能GPU和人工智能处理器的进步以及其他数据中心硬件的要求不断增加。例如,Nvidia 2020 年的 A100 功耗高达 400W,而 2022 年的 H100 功耗高达 700W。除了 GPU 之外,AI 服务器还运行耗电的 CPU 和网卡。

AI 工作负载,尤其是与训练相关的工作负载,需要大量计算资源,包括配备 AI GPU、专用 ASIC 或 CPU 的专用服务器。人工智能集群的规模受人工智能模型的复杂性和规模的影响,是功耗的主要决定因素。更大的人工智能模型需要更多数量的 GPU,从而增加总体能源需求。例如,拥有 22,000 个 H100 GPU 的集群使用大约 700 个机架。基于 H100 的机架在安装八台 HPE Cray XD670 GPU 加速服务器时,机架总密度为 80 kW。施耐德电气指出,因此,整个集群需要大约 31 兆瓦的电力,这还不包括冷却等额外基础设施需求所需的能源。

这些集群和 GPU 在整个训练过程中通常几乎满负荷运行,确保平均能耗几乎与峰值功耗相同。该文件指出,大量AI集群的机架密度在30kW到100kW之间,具体取决于GPU的数量和型号。

网络延迟在人工智能数据中心的功耗中也起着至关重要的作用。复杂的网络基础设施对于支持分布式训练过程中强大的 GPU 所需的高速数据通信至关重要。对高速网络电缆和基础设施(例如能够支持高达 800 Gb/s 速度的电缆和基础设施)的需求进一步增加了总体能耗。

鉴于人工智能工作负载需要高耗电的 ASIC、GPU、CPU、网卡和 SSD,冷却构成了重大挑战。鉴于高机架密度和计算过程中产生的巨大热量,有效的冷却解决方案对于保持最佳性能并防止硬件故障或失效至关重要。与此同时,空气和液体冷却方法在功耗方面也“昂贵”,这就是为什么它们也对用于人工智能工作负载的数据中心的功耗造成很大影响。

一些建议

施耐德电气预计AI硬件的功耗不会很快降低,公司充分预计AI机架的功耗将达到100kW或更高。因此,施耐德电气对专门处理人工智能工作负载的数据中心提出了一些建议。

施耐德电气特别建议从传统的120/208V过渡到240/415V配电,以更好地适应人工智能工作负载的高功率密度。对于冷却,建议从空气冷却转向液体冷却,以提高处理器的可靠性和能源效率,尽管沉浸式冷却可能会产生更好的效果。使用的货架应更宽敞,其规格例如宽度至少为 750 毫米,静态承重能力大于 1,800 公斤。







审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • asic
    +关注

    关注

    34

    文章

    1269

    浏览量

    124028
  • SSD
    SSD
    +关注

    关注

    21

    文章

    3061

    浏览量

    121750
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261393
  • GPU芯片
    +关注

    关注

    1

    文章

    306

    浏览量

    6393
  • AI芯片
    +关注

    关注

    17

    文章

    2062

    浏览量

    36558

原文标题:AI芯片成为耗电大户,负载功耗接近一个小国家

文章出处:【微信号:Mobile-Info,微信公众号:手机技术资讯】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AIDC如何成为AI发展的关键棒?

    AI
    脑极体
    发布于 :2025年09月21日 12:21:23

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    、现阶段更智能、更接近AGI的6中算法与模型 1、MoE模型 MoE模型作为Transfomer模型的后继者,代表着AI技术的项重大创新和发展。 优势: 在于能处理庞大的参数规模,显著减少内存占用
    发表于 09-18 15:31

    【「AI芯片:科技探索与AGI愿景」阅读体验】+神经形态计算、类脑芯片

    AI芯片不仅包括深度学细AI加速器,还有另外主要列别:类脑芯片。类脑
    发表于 09-17 16:43

    【「AI芯片:科技探索与AGI愿景」阅读体验】+第二章 实现深度学习AI芯片的创新方法与架构

    汽车 4.4 AI无人机 5、极低功耗AI芯片 三种针对边缘AI开发的算法,均满足极低功耗的要
    发表于 09-12 17:30

    【「AI芯片:科技探索与AGI愿景」阅读体验】+可期之变:从AI硬件到AI湿件

    通常情况下,半导体芯片的制造过程是经过光刻、蒸发、扩散、离子注入等物理方法来实现晶体管等元器件的生成和互连。芯片是被封装在带有大量引脚、不断耗电
    发表于 09-06 19:12

    AI 芯片浪潮下,职场晋升新契机?

    、新架构不断涌现。能够在工作中提出创新性的解决方案,推动 AI 芯片性能、功耗、成本等关键指标的优化,将极大提升在职称评审中的竞争力。例如,在芯片设计中引入新的计算范式,如存算
    发表于 08-19 08:58

    被误解的 “耗电大户”:铝电解电容其实是 “省电小能手” 的真相

    在电子元器件的世界里,铝电解电容常常背负着"耗电大户"的恶名。许多工程师和电子爱好者提到铝电解电容,脑海中就会浮现出漏电流大、损耗高的印象。然而,这种认知可能存在着严重的偏差。事实上,现代铝电解
    的头像 发表于 08-15 16:01 565次阅读
    被误解的 “<b class='flag-5'>耗电大户</b>”:铝电解电容其实是 “省电小能手” 的真相

    耗电大户到节能标兵:就靠DeviceNet转EtherCAT,锅炉水泵电费直降40%

    在电力行业的生产链条中,锅炉风机、水泵这类大功率设备是能耗"大户"。过去,我们工厂的锅炉系统里,PLC通过DeviceNet协议控制着批老旧电机,虽然设备稳定但调速精度低,常常出现"大马拉小车
    的头像 发表于 07-31 11:24 276次阅读
    从<b class='flag-5'>耗电大户</b>到节能标兵:就靠DeviceNet转EtherCAT,锅炉水泵电费直降40%

    【书籍评测活动NO.64】AI芯片,从过去走向未来:《AI芯片:科技探索与AGI愿景》

    创新、应用创新、系统创新五部分,接下来一一解读。 算法创新 在深度学习AI芯片的创新上,书中围绕大模型与Transformer算法的算力需求,提出了系列架构与方法创新,包括存内计算
    发表于 07-28 13:54

    如何解决测试待机功耗电流过大?六级能耗功率计

    功率计测试时电流数据波动大,可能是由高频干扰、负载波动等多种因素导致的。横河WT310E功率计的功能特性和操作指南,针对待机功耗电流波动大的问题。
    的头像 发表于 07-05 18:37 1515次阅读
    如何解决测试待机<b class='flag-5'>功耗电</b>流过大?六级能耗功率计

    如何选择适合的TONTEK(通泰)触摸芯片

    TONTEK芯片在智能家居中的应用更智能的触控体验你是否遇到过这些困扰:轻触开关却毫无反应,反复操作让人烦躁;浴室镜触控失灵,潮湿环境成了智能设备的“克星”;便携设备电量告急,触控功能竟成了耗电大户
    的头像 发表于 05-26 16:23 112次阅读
    如何选择适合的TONTEK(通泰)触摸<b class='flag-5'>芯片</b>?

    接近开关的工作电压和功耗如何

    接近开关的功耗相对较小,通常每只开关的功耗可以按0.1W估算。这使得接近开关在长时间工作时不会消耗过多的电能,有利于节能降耗。具体功耗水平可
    的头像 发表于 05-26 11:56 1335次阅读

    AI玩具芯片如何寻找性能、功耗与成本之间的平衡点

    之间找到适合的方案?本文结合实际案例,总结芯片选型的核心原则与开发经验。   AI 玩具芯片选择的三大核心原则   对于AI玩具而言,芯片
    的头像 发表于 04-29 08:24 2037次阅读

    2.5D封装为何成为AI芯片的“宠儿”?

     多年来,封装技术并未受到大众的广泛关注。但是现在,尤其是在AI芯片的发展过程中,封装技术发挥着至关重要的作用。2.5D封装以其高带宽、低功耗和高集成度的优势,成为
    的头像 发表于 03-27 18:12 562次阅读
    2.5D封装为何<b class='flag-5'>成为</b><b class='flag-5'>AI</b><b class='flag-5'>芯片</b>的“宠儿”?

    AN23-用于信号调理的微功耗电

    电子发烧友网站提供《AN23-用于信号调理的微功耗电路.pdf》资料免费下载
    发表于 01-12 11:21 0次下载
    AN23-用于信号调理的微<b class='flag-5'>功耗电</b>路