0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

内存是AI能效提升的下一个前沿领域

Micron美光科技 来源:Micron美光科技 2026-02-09 09:47 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

我们正在进入新的计算时代。AI 工作负载的占比越来越高,已成为影响企业基础设施战略、硅芯片路线图和业务指令的决定性力量。如今的 AI,规模大到令人咋舌:超大规模企业正在部署单个集群中包含数万块 AI 加速器的系统,正在训练拥有万亿级参数的模型,每个部署区消耗的电力高达数兆瓦。

业界一直在宣扬 AI 的力量——AI 能够改变各行各业,加速各种新发现,并能够增强人类的能力。这些论断并非夸大之词。但是,我们现在必须稍微冷静一下,面对另一个现实:AI 运行所需的动力(也即,运行这些工作负载所需的能量)正在成为 AI 创新面临的重大障碍。

通常能想到的解决方案包括:优化计算;优化机架散热;采购更多绿色电力。这些都是必要的措施,但这些措施现在已经不足以解决问题。长期以来,人们认为计算是影响能效的主要因素,这种假设现在已越来越不符合现实。事实上,这种观念可能掩盖了另一个真正影响能效的因素,也是目前我们尚未充分利用的领域。

那就是内存。

隐藏的能量池

在 AI 基础设施中,内存和存储通常被视为辅助设备——它们必不可少,但并非战略要素。然而,在现代 AI 集群中,内存子系统(包括DRAM、SSD 以及相关的互连设备)的功耗在系统总功耗中的占比可能高达 50%,具体取决于特定的配置和工作负载。随着模型大小持续增长,数据移动操作日益频繁,内存和存储的功耗占比只会越来越高,节能型内存和存储的重要性也将愈发突出。

为了通过优化计算来降低 AI 的能耗,出现了新的计算范式,例如端侧和分布式架构。有数据就需要处理,数据处理必然消耗能量,而人类每天生成的数据量已经到了惊人的程度。据估计,到 2025 年,全球每天将产生超过 402 艾字节的数据。这种情况下,作为一种自然的选择,AI 正在向着数据生成和存储的位置靠近,而数据驻留在内存和存储设备中。这些新的计算范式使得内存使用量增加,也为整个系统带来了额外的功耗优化机会。

如今,系统总功耗的主要组成部分是数据传输功耗,包括:从内存传输到加速器,从 SSD 转移到 DRAM,以及跨机架和存储网络传输。根据 Semianalysis 的一项独立研究,检查点和集合通信等内存密集型操作现在是超大规模 AI 集群达到峰值功率的主要原因。这些操作可能导致系统功率出现几十兆瓦的瞬时波动,显示出内存在降低系统能耗、维持电网稳定等方面越来越重要的作用。随着技术节点快速扩展和架构创新,计算系统已经得到显著优化,而内存系统的优化却一直比较缓慢。

内存系统是功耗优化的“盲点”。因此,为解决能效问题,我们必须开始着眼于内存。

新的优化规则:内存决定效率

在美光,我们认为未来的可持续 AI 基础设施将由内存主导。这种方法意味着我们需要从内存出发,重新思考整个架构——内存不应作为出现问题后的补救措施,而应从一开始便作为战略性基础设施,用于优化性能和效率。

我们看到,这种思维转换正在发生:

LPDDR:美光的新一代内存技术可提供行业前沿的每瓦特性能,有助于减少能耗,同时不影响带宽。这一成就不仅来自于美光通过采用先进工艺节点所获得的效率提升,还源自于美光致力于优化每种设计中的架构,以实现更高能效的不懈努力。

基于 SSD 的内存分层:利用高性能 SSD 来扩展内存的层次结构,可减少 DRAM 设备的数量,有助于降低闲置功耗。美光利用其行业前沿的第 9 代 NAND 来优化旗下的 SSD 产品组合,以满足每个内存和存储层的特定需求。每次必须存储和移动数据时,都能看到功效显著提升。

尽可能减少数据传输:通过系统架构创新,让数据更接近计算,减少不必要的传输操作,可节约大量能源。

遥测和动态调整:通过对内存子系统的实时功耗分析,可实现智能功耗限制和工作负载感知优化。

这些想法并非理论上的分析。如今它们已部署在世界上一些非常先进的 AI 集群中,运行结果令人欣喜。

战略要务

对于负责基础设施的企业领导者而言,这种转变不仅是一种对新技术的尝试,更是一种战略要求。功耗现已成为决定规模大小的关键因素。总拥有成本 (TCO) 正在快速攀升。可持续发展则是董事会关注的重点。而传统基础设施的发展速度难以跟上 AI 需求的步伐。超大规模 AI 数据中心的工作负载输出不再受到数据中心内部计算硬件的限制。唯一的限制因素是:它们可以从电网中获取多少能量。

以内存为主导的效率优化模式提供了一种全新的工具——现在即可使用,未来可通过扩展来解决新的问题。它使超大规模用户能在相同的供电包络内部署更多容量。它能够降低散热成本和配置成本。它使基础设施团队能在不影响可持续性或成本的前提下,满足下一代 AI 工作负载的需求。

未来展望

当我们展望未来时,“AI 是否会改变世界?”已不再是一个问题——答案是肯定的。我们面临的问题是:如何推动这种转变? 答案不仅在于更快的芯片,或者散热能力更强的数据中心,它还在于更智能的架构,这些架构强调性能和效率更高的内存和存储,并将内存和存储作为提升系统能效的核心。

美光很自豪能投资于相关创新技术、合作伙伴关系和系统,让内存成为大规模可持续 AI 的驱动力,从而引领这一转变。AI 拥有强大的力量,这是毋庸置疑的。但是,以高效、可持续方式运行的超大规模 AI 背后的驱动力量,才是决定下一个创新时代的关键。

让我们一起创造推动 AI 未来的动力!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 内存
    +关注

    关注

    9

    文章

    3255

    浏览量

    76590
  • AI
    AI
    +关注

    关注

    91

    文章

    41972

    浏览量

    303061
  • 能耗
    +关注

    关注

    1

    文章

    442

    浏览量

    13697

原文标题:驱动 AI 的力量:内存是 AI 能效提升的下一个前沿领域

文章出处:【微信号:gh_195c6bf0b140,微信公众号:Micron美光科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    三星SOCAMM2内存模组提升AI数据中心带宽与表现

    随着人工智能在全球范围内加速普及,数据中心的计算工作负载正经历爆炸式增长。随着大规模模型训练向持续推理的转变,挑战不再仅仅局限于性能一一对于维持下一代人工智能基础设施的运行也变得至关重要。这
    的头像 发表于 03-16 10:28 717次阅读

    嵌入式开发是否会成为下一个被看好的领域

    聊嵌入式开发会不会成为下一个风口,现在确实是挺热门的话题。各种论坛、投资报告都在讲物联网、智能硬件、AIoT的万亿市场,仿佛只要跟嵌入式沾边,就能乘着东风起飞。但如果套用我们刚才聊的那套逻辑,就会发现,这事儿还真“不好说”,得把那些热闹的表面词藻扒开,看看里面的筋骨。
    的头像 发表于 02-26 09:56 721次阅读
    嵌入式开发是否会成为<b class='flag-5'>下一个</b>被看好的<b class='flag-5'>领域</b>?

    使用NORDIC AI的好处

    提升,适合音频、图像和高采样率传感器等更重的 AI 负载。[Axon NPU 技术页] 模型更小、更快、更省电 Neuton 模型相较 TensorFlow Lite:*
    发表于 01-31 23:16

    安科瑞多回路电表对工业提升的计划与数据中心分级计量指南

    1、概述 到2025 年,工业行业提升,数据中心等领域明显
    的头像 发表于 01-23 16:46 764次阅读

    北大团队最新研究:AI芯片算力提升数倍,提升超90倍

    首次实现后摩尔新器件异质集成的多物理域融合傅里叶变换系统。   这全新计算架构将傅里叶变换计算速度从当前每秒约1300亿次提升至每秒约5000亿次,算力提升近4倍,
    的头像 发表于 01-15 09:31 2361次阅读

    半导体测试,是“下一个前沿

    ,但半导体测试是“下一个前沿”,它是设计与制造之间的桥梁,解决了传统分离领域之间模糊的界限。更具体地说,通过连接设计和制造,测试可以帮助产品和芯片公司更快地生产出
    的头像 发表于 12-26 10:02 812次阅读
    半导体测试,是“<b class='flag-5'>下一个</b><b class='flag-5'>前沿</b>”

    重磅合作!Quintauris 联手 SiFive,加速 RISC-V 在嵌入式与 AI 领域落地

    SoC 开发流程,帮开发者省时间; 优化下一代 RISC-V 设计的性能和,进步拉高性能上限; 把 RISC-V 打造成和传统专有
    发表于 12-18 12:01

    亚马逊发布新AI芯片Trainium3,性能提升4倍

    Trainium 4的开发计划。亚马逊表示,这款芯片能够比英伟达市场领先的图形处理单元(GPU)更便宜、更高效地驱动AI模型背后的密集计算。     作为亚马逊首款3纳米工艺AI芯片,Trainium3的核心突破在于性能、
    的头像 发表于 12-09 08:37 9018次阅读
    亚马逊发布新<b class='flag-5'>一</b>代<b class='flag-5'>AI</b>芯片Trainium3,性能<b class='flag-5'>提升</b>4倍

    【「AI芯片:科技探索与AGI愿景」阅读体验】+半导体芯片产业的前沿技术

    为我们重点介绍了AI芯片在封装、工艺、材料等领域的技术创新。 、摩尔定律 摩尔定律是计算机科学和电子工程领域条经验规律,指出集成电路上
    发表于 09-15 14:50

    弧形导轨如何提升新能源汽车的和续航里程?

    弧形导轨在新能源汽车中的应用主要集中在电池生产线和自动化装配线等领域,通过提高生产效率和精度,间接提升新能源汽车的和续航里程。
    的头像 发表于 09-13 17:55 828次阅读
    弧形导轨如何<b class='flag-5'>提升</b>新能源汽车的<b class='flag-5'>能</b><b class='flag-5'>效</b>和续航里程?

    【「AI芯片:科技探索与AGI愿景」阅读体验】+内容总览

    AI芯片:科技探索与AGI愿景》这本书是张臣雄所著,由人民邮电出版社出版,它与《AI芯片:前沿技术与创新未来》书是姊妹篇,由此可见作者在AI
    发表于 09-05 15:10

    科技云报到:西湖大学、智元机器人都选它,存储成为AI下一个风口

    科技云报到:西湖大学、智元机器人都选它,存储成为AI下一个风口
    的头像 发表于 09-03 11:24 883次阅读

    【原创】TDMS设置下一个写入位置函数的摸索

    labview在20版本前,tdms都有高级函数,写入文件位置set file positon,但是在20版本后被取消了。取而代之是‘tdms设置下一个写入位置函数’ 本意是想利用tdms设置
    发表于 08-11 20:54

    安森美携手英伟达推动下一AI数据中心发展

    安森美(onsemi,美国纳斯达克股票代号:ON)宣布与英伟达(NVIDIA)合作,共同推动向800V直流(VDC)供电架构转型。这变革性解决方案将推动下一代人工智能(AI)数据中心在
    的头像 发表于 08-06 17:27 1825次阅读

    AI玩具或成为下一个万亿新赛道

    如果你将拥有家庭新成员,你首先会想到什么?是孩子还是宠物?如果我说你下一个家庭成员,或许是会“察言观色”的
    的头像 发表于 07-29 10:15 1321次阅读