0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

高带宽闪存:面向AI数据中心与边缘计算的全新存储技术

海阔天空的专栏 来源:Alper Ilkbahar 作者:厂商供稿 2026-05-25 17:58 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

高带宽闪存:面向AI数据中心与边缘计算的全新存储技术

作者:闪迪公司执行副总裁兼首席技术官Alper Ilkbahar

人工智能(AI)正势不可挡地席卷整个计算领域。尽管目前全球仅约七分之一的数据中心具备承载AI工作负载的能力,但到2030年,这一比例预计将接近70%¹。AI正从超大规模数据中心迁移至企业级数据中心,并进一步部署至网络边缘——边缘AI应用预计在2030年底将创造近665亿美元的价值²。数据是这一全新计算时代的驱动力。海量数据必须高速传输至需求迫切且快速扩展的AI计算基础设施中。

然而,海量内容库正在让传统存储架构不堪重负,其固有的架构劣势也彻底显现。数据中心内存(DRAM 及专用高带宽内存HBM)在密度、存储容量与可扩展性方面,逐渐难以应对大型AI模型日益增长的需求。与此同时,超大规模计算厂商正面对DRAM与HBM攀升的生产成本、提升的设计复杂度及增加的能耗。在企业级数据中心与边缘AI应用场景中,这一挑战更为严峻 —— 受限于更小的物理空间,此类场景难以承受持续上涨的内存成本与功耗。

同时,AI推理也带来了一些亟待解决的问题。作为当下主流的AI工作负载,AI推理在数据管理方面的要求与AI训练截然不同:推理需要存储规模持续扩大的AI模型,而基于HBM与DRAM的内存方案已难以满足这些新需求,其在容量与成本可扩展性上存在明显短板。面对这些显著差异的内存特性,市场亟需一种专为AI推理优化的内存技术。

为何DRAM与HBM无法满足AI推理工作负载需求?

要理解为何仅DRAM与HBM并不适合AI的长期部署,可参考以下弊端³。这些问题起初只是细微隐患,但若不加以解决,将随时间推移不断扩大,最终动摇以AI为核心的下一代存储架构根基。

密度瓶颈:DRAM容量扩展已陷入停滞,而支撑AI推理所需的容量需求却持续攀升。³

与AI推理不匹配:DRAM在低时延、随机访问方面的优势,对AI推理而言并不适用。AI推理的访问模式具备确定性,借助数据预取等技术对时延有更高的包容度。³

面向AI推理优化的内存架构特性

规模达1,200亿美元的DRAM产业⁴正面临上述深层矛盾。鉴于超大规模服务商在AI基础设施领域的支出有望在2030年底达到6.7万亿美元⁵,该产业迫切希望稳固自身在数据中心领域的既有地位。

如果现在正是彻底重新打造一款贴合应用需求的全新存储解决方案的时机,而非让应用去适配现有存储,结果会如何?一款为AI优化的存储级内存应具备以下特性:

● 更大规模且可扩展的内存容量,专为推理工作负载配置

● 更高的内存密度(GB/mm²)

● 高带宽,满足AI推理需求

● 更低的系统级功耗

● 高性价比指标(美元/ TB)

高带宽闪存意指AI数据中心

高带宽闪存(HBF™)是一款颠覆性的新型内存架构,专为支持推动新一代AI计算而设计。HBF满足了高级计算及数据密集型应用对容量、能耗、吞吐量及可扩展性的核心要求。相较于HBM,HBF在保持同等带宽的前提下,提供了更高的容量与存储密度,更贴合AI推理的发展趋势。作为一种持久性存储介质,HBF在断电时仍能保留数据,且具备热稳定性,可支持高温运行环境⁶。

为实现这些优势,HBF通过优化高带宽特性与推理内存属性,对NAND闪存进行了高效重构。采用外围电路直接键合到存储阵列(CBA)晶圆技术,进一步提升了能效与带宽。

HBF重塑面向AI应用的NAND闪存

相较于传统NAND闪存,HBF通过并行架构、先进逻辑缩放工艺与定制化堆叠技术,实现更低时延与超高的读取带宽,让大语言模型以接近DRAM的速度流式读取数据⁶。

HBF还支持大型KV缓存,可高效处理冗长复杂的用户提示词,以及客户专属与领域专属数据,助力提升AI推理准确率。

以内存为中心的AI延伸至企业级场景与网络边缘

由于受密度、成本与功耗限制,HBM通常无法用于边缘与移动环境,而HBF可凭借更大存储容量,实现处理更复杂AI推理任务的价值。这为智能手机等边缘设备打开了应用空间,帮助其能够实时决策并执行各类复杂任务。凭借持久性存储的特性,HBF支持从历史查询中无缝调取过往上下文,以解决新问题。

HBF的优势可同样延伸至企业级计算场景。这类场景的用户规模远小于超大规模数据中心,而依托HBM的大型GPU集群成本过高。通过采用搭载HBF的加速方案,小型企业有望对大型预训练模型进行调优,以支持领域专属应用需求。

优化的存储解决方案突破AI计算增长的阻碍

在我们身边,数据中心与边缘AI设备正自主运行,支撑从“晚餐食谱”查询到“突破性科学发现”的各类任务。网站托管、企业数据管理等常规任务,正逐步让位于依托机器学习深度学习与数据分析来生成实用洞察的智能工作负载。

如今的数据中心与边缘存储亟需重新规划,以支撑大规模推理模型执行预测与生成任务。相较于HBM,HBF在具备显著容量优势的同时,可提供AI推理应用所需的高吞吐量⁶。作为可扩展的全新系统级存储技术,HBF有助于减少性能瓶颈,加快现代数据中心与边缘网络中AI应用的洞察生成速度。

参考文献

^1^ B. Srivathsan 、M. Sorel 、 P. Sachdeva,联合 A. Bhan 、 H. Batra 、 R. Sharma 、 R. Gupta 以及 S. Choudhary,麦肯锡咨询公司,《AI 算力:扩容数据中心以满足日益增长的需求》(2024 年 10 月)

^2^ Grand View Research,《边缘 AI 市场规模、份额及趋势分析报告 —— 按组件(硬件、软件、服务)、终端行业(消费电子、智慧城市、汽车)、地区及细分领域预测,2025—2030》

^3^ S. Legtchenko 、I. Stefanovici 、R. Black 、A. Rowstron 、J. Liu 、P. Costa 、B. Canakci 、D. Narayanan 、X. Wu,微软研究院,《受控保留内存:面向 AI 时代的全新内存品类》,康奈尔大学(2025 年 1 月)

^4^Fortune Business Insights,《DRAM 市场规模、份额及行业分析……》(2026 年 2 月)

^5^ J. Noffsinger、M. Patel、P. Sachdeva、联合A. Bhan、H. Chang以及M. Goodpaster,麦肯锡咨询公司,《计算成本:一场7 万亿美元规模的数据中心扩张竞赛》(2025 年 4 月)

^6^ HBF 技术资料页,闪迪,《闪迪发布面向 AI 的未来存储架构:高带宽闪存(HBF)》(2025 年 7 月)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 闪存
    +关注

    关注

    16

    文章

    1924

    浏览量

    117521
  • 数据中心
    +关注

    关注

    18

    文章

    5848

    浏览量

    75251
  • AI
    AI
    +关注

    关注

    91

    文章

    42023

    浏览量

    303088
  • 闪迪
    +关注

    关注

    0

    文章

    131

    浏览量

    14637
  • 边缘计算
    +关注

    关注

    22

    文章

    3579

    浏览量

    53801
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    通挑战英伟达,发布768GB内存AI推理芯片,“出征”AI数据中心

    电子发烧友网报道(文/莫婷婷)随着生成式AI应用的爆发式增长,数据中心对高效、低成本、低功耗AI推理能力的需求急剧上升。通凭借其在移动计算
    的头像 发表于 10-29 10:36 4070次阅读
    <b class='flag-5'>高</b>通挑战英伟达,发布768GB内存<b class='flag-5'>AI</b>推理芯片,“出征”<b class='flag-5'>AI</b><b class='flag-5'>数据中心</b>

    通挑战英伟达!发布768GB内存AI推理芯片,“出征”AI数据中心

    电子发烧友网报道(文/莫婷婷)随着生成式AI应用的爆发式增长,数据中心对高效、低成本、低功耗AI推理能力的需求急剧上升。通凭借其在移动计算
    的头像 发表于 10-29 09:14 6869次阅读
    <b class='flag-5'>高</b>通挑战英伟达!发布768GB内存<b class='flag-5'>AI</b>推理芯片,“出征”<b class='flag-5'>AI</b><b class='flag-5'>数据中心</b>

    演讲回顾 - 慧荣科技 | 从云端到边缘,智创 AI 存储新未来,携手普迪飞共筑 AI 数据中心核心底座

    :SiliconMotionAIInnovationXPDFExensioAnalytics,深度分享AI驱动下存储产业变革趋势、慧荣科技面向数据中心
    的头像 发表于 04-29 09:04 371次阅读
    演讲回顾 -  慧荣科技 | 从云端到<b class='flag-5'>边缘</b>,智创 <b class='flag-5'>AI</b> <b class='flag-5'>存储</b>新未来,携手普迪飞共筑 <b class='flag-5'>AI</b> <b class='flag-5'>数据中心</b>核心底座

    双芯光缆:数据中心建设的理想之选

    在数字化时代,数据中心作为信息存储、处理和传输的核心枢纽,其重要性不言而喻。随着云计算、大数据、人工智能等技术的快速发展,
    的头像 发表于 03-26 10:05 251次阅读

    人工智能数据中心的光纤布线策略

    随着人工智能(AI)技术的飞速发展,数据中心的光纤布线策略正面临前所未有的挑战和机遇。AI带宽
    的头像 发表于 11-21 10:21 742次阅读

    伟创力重磅发布全球首款面向千兆瓦级数据中心AI基础设施平台

    伟创力重磅发布全球首款面向千兆瓦级数据中心AI基础设施平台,平台集成了电源和冷却产品、计算能力和服务,专为AI和高性能
    的头像 发表于 10-23 15:08 1029次阅读

    CPO技术加速未来数据中心网络发展

    生成式 AI 的快速普及正在推动数据中心网络需求的指数级增长。光电一体化封装(CPO)技术以其带宽密度、低功耗和可靠性优势,成为满足
    的头像 发表于 09-23 14:24 2391次阅读

    睿海光电:400G光模块技术创新与AI数据中心变革

    睿海光电:400G光模块技术创新与AI数据中心变革 一、400G光模块:新一代数据中心的核心引擎 在AI大模型训练、
    的头像 发表于 08-18 13:52 1454次阅读

    睿海光电以高效交付与广泛兼容助力AI数据中心800G光模块升级

    引领AI时代网络变革:睿海光电的核心竞争力 在AI时代,数据中心正经历从传统架构向AI工厂与AI云的转型。
    发表于 08-13 19:01

    加速AI未来,睿海光电800G OSFP光模块重构数据中心互联标准

    定义数据中心互联的新范式。 一、技术实力:800G OSFP光模块的卓越性能表现 睿海光电800G OSFP光模块系列采用行业领先的PAM4调制技术,具备以下核心优势: 超高速率 :单模传输速率达
    发表于 08-13 16:38

    华为面向拉美地区发布全新星河AI数据中心网络方案

    在华为数据通信创新峰会2025拉美站期间,以“星河AI数据中心网络,赋AI时代新动能”为主题的分论坛上,华为面向拉美地区发布
    的头像 发表于 08-11 10:42 2687次阅读

    PCIe协议分析仪在数据中心中有何作用?

    数据中心的整体可靠性。以下是其核心作用及具体应用场景的详细分析:一、性能优化:突破带宽瓶颈,提升计算效率 链路带宽利用率分析 场景:在AI
    发表于 07-29 15:02

    中型数据中心中的差分晶体振荡器应用与匹配方案

    中型数据中心的定义与特点 中型数据中心通常服务于中大型企业、科研机构或地方行业节点,具备50至200个机柜,部署多台服务器、交换设备、存储系统与光通信链路等,强调高带宽、低延迟与
    发表于 07-01 16:33

    小型数据中心晶振选型关键参数全解

    小型数据中心的定义与应用 小型数据中心通常是为中小型企业、边缘计算、物联网(IoT)设备及其他特定业务需求提供计算
    发表于 06-11 13:37

    华为面向亚太地区发布全新星河AI数据中心网络方案

    在华为数据通信创新峰会2025亚太站期间,以“星河AI数据中心网络,赋AI时代新动能”为主题的分论坛上,华为面向亚太地区发布
    的头像 发表于 06-11 11:11 1677次阅读