0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

美光高管看2024年AI数据中心、AI PC的存储趋势

花茶晶晶 来源:电子发烧友网 作者:黄晶晶 2024-10-13 15:22 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/黄晶晶)生成式AI带来的产业技术革新不仅在于性能越来越强大的GPU,它同时正在推进存储产品的变化和技术的进步。近日,美光副总裁暨客户端存储事业部总经理Prasad Alluri在接受包括电子发烧友网在内的少数媒体采访时指出,与过往不同,闪存和内存曾各自为政,主要致力于提高密度。AI的兴起带来了两大转变,一是与系统架构的协同优化;二是将能效作为关键优化参数。为此,美光科技正积极优化存储产品、赋能AI在数据中心、PC、智能手机乃至汽车等各领域的应用与发展。

AI数据中心:两大存储池的不同存储策略


Prasad Alluri表示,在探讨AI基础设施对数据中心存储的具体影响时,我们可以将其视为两个独立的存储池来分析。

首先,存在一个庞大的数据池,用于存储供模型训练所需的数据。以GPT-4为例,据估算,其训练过程消耗了互联网上约四分之一的数据,这足以说明大模型所需数据的庞大规模。为了训练这类模型,必须具备存储海量数据的能力,我们可以形象地称之为“数据湖”,即所有待训练数据均汇聚于此。

对于这一存储场景,最关键的属性在于能够高效且经济地传输数据。将容量与经济性相结合,意味着需要摒弃主要依赖大容量硬盘驱动器的传统架构,转而采用大容量SSD。此举不仅能减少物理占用空间,还能降低能耗,从而提升整体能源经济性。在此方面,美光科技推出的6500 ION系列产品正是针对大容量存储需求而优化的理想解决方案。

另一方面是训练过程实际发生的存储池,即紧邻GPU的存储池。此时,需考虑的是如何将数据湖中的数据高效送入GPU内存以供训练。在此过程中,设备的读写性能至关重要,尤其是随机读取性能。对于这类靠近GPU训练集群的存储,美光9550 SSD从设计之初便旨在满足这些需求。9550 SSD随机读取性能领先业界,速率高达3,300 KIOPS,这正是训练集群所亟需的。

此外,美光9550 SSD提供业界领先的能效,并在支持各类AI工作负载方面表现出众,包括使用大规模存储加速器(BaM)进行图神经网络(GNN)训练(SSD平均功耗降低高达43%,整体系统能耗减少高达29%)、NVIDIA Magnum IO GPUDirect Storage(每传输1TB数据,SSD能耗降低高达81%)、MLPerf(SSD能耗降低高达35%,系统能耗降低高达13%)以及使用Microsoft DeepSpeed对Llama 大语言模型(LLM)训练进行微调(SSD能耗降低高达 21%)。

wKgZoWcLddKAHPtSAAOKConnGk0495.png

AI PC的存储需求,将远超微软的“基准要求”


微软为AI PC产品Copilot+设定了基准要求,其中NPU的算力起始于40 TOPS,内存方面则规定了至少16GB的容量,以及256GB的存储空间作为最低配置。不过,Prasad Alluri表示,这些仅是基础指导线,并未全面界定AI PC的真正内涵。

“要深入理解AI PC,我们需将焦点放在用户体验上。AI PC的核心在于通过诸如翻译或图像编辑等任务来提升生产力,且这些任务需在设备上高效完成。正是这种整体体验定义了AI PC,而非单纯的技术规格。为了满足用户的这些期望,我们认为所需的内存量远超最低指导线。事实上,当前多数OEM在打造AI PC时,已配备了24GB至32GB的DRAM。”

从存储角度来看,尽管OEM目前提供的最低容量为512GB,但我们认为对于AI工作负载而言,更理想的容量应接近1TB。

不过,这不仅仅关乎容量大小,功耗效率和性能同样至关重要。在存储领域,目标是以最高效的方式将AI模型从存储加载到内存中。为此,需要在不增加功耗的前提下,获得尽可能高的吞吐量。美光高性能客户端3500 SSD在相同功耗下提供了业界领先的性能。

针对于AI PC,美光科技加速了LPDDR5X在AI PC中的应用普及。与同类SODIMM产品相比,LPDDR5X的性能提升了约1.5倍。此外,还专为AI个人电脑设计了一种新型内存模块——LPCAMM2。与传统SODIMM产品相比,LPCAMM2不仅性能提升1.5倍,而且功耗降低高达58%,空间节省达64%。这款新产品于今年早些时候推出,主要围绕三大目标设计:提升性能、降低功耗以及减小体积。在标准PC中,通常需要两个SODIMM并排放置,占用主板大量空间。而LPCAMM2则将这些功能集成到一个DIMM中,从而显著提升了电源效率和性能。

在当前的PC环境中,以我们内部使用的Microsoft Copilot为例,它高度依赖云计算,将大部分复杂任务卸载到云端。然而,未来的AI个人电脑将能够在本地处理部分工作负载,减少对云端的依赖。这样,模型复杂性将降低,AI个人电脑能在保持高性能的同时,实现更高效的能源利用,提高数据处理的灵活性和速率。

在PC的本地存储中完全可以放置多个模型,并根据用户查询的上下文加载这些模型。例如,如果用户需要语音转文本服务,您可以加载相关模型;如果用户需要图像创建,您可以加载相应的模型。在此过程中,关键在于以节能方式从存储中加载数据,因此,SSD的性能至关重要,它需在最低功耗下实现最高吞吐量,即充分利用PCIe 4.0 的四通道。

为此,美光科技的3500 SSD不仅在最低功耗下提供行业领先的性能。同时,该SSD中内置了启发式算法。当检测到AI工作负载时,驱动器可以主动加载所需的正确模型或数据。这些就是为实现高效能和电源效率所做的优化。

QLC越发重要,闪存层数应从纵横向提升


当本网记者问及当前QLC对于AI存储越来越重要,美光的看法与规划,以及3D NAND闪存的层数将如何发展等问题时,Prasad Alluri也给出了详细的分析。

Prasad Alluri表示,从NAND技术的视角来看,最关键的因素在于每平方毫米的容量密度。也就是我们最终追求的是比特面密度(Bit Areal Density),因为这将有助于降低成本。

但是,有多种方法可以实现这一目的。其中一种是对单个物理单元提升容量。这正是四阶存储单元(QLC)技术大显身手的地方,而我们在这一领域始终保持领先地位,特别是在PC市场率先推出了这一技术。目前,美光科技在该领域的市场占有率位居前列。尽管我们尚未宣布针对数据中心的具体计划,但我们仍在持续投资QLC技术,并致力于提高容量密度,这是推动技术进步的重要途径之一。

另外,在NAND技术中可以通过堆叠更多层来增加单位面积内的容量。美光科技最近推出了第九代(G9)TLC NAND技术。虽然目前尚不清楚3D NAND的层数何时会达到极限,但在未来的几代产品中,美光的闪存层数将继续增加。

wKgaoWcLdeyAPoT_AAH35i87vBg197.png

但他也强调,层数并非实现比特面密度提升的唯一关键因素,因为横向扩展同样至关重要。除了关注3D堆叠层的数量外,还需要考虑单元之间水平位置的接近程度。这种横向优化是美光提高比特面密度的另一个关键领域。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    13

    文章

    4701

    浏览量

    89582
  • 数据中心
    +关注

    关注

    16

    文章

    5529

    浏览量

    74664
  • AI
    AI
    +关注

    关注

    90

    文章

    38189

    浏览量

    297009
  • 美光
    +关注

    关注

    5

    文章

    737

    浏览量

    53253
  • AI PC
    +关注

    关注

    0

    文章

    140

    浏览量

    692
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    通挑战英伟达,发布768GB内存AI推理芯片,“出征”AI数据中心

    电子发烧友网报道(文/莫婷婷)随着生成式AI应用的爆发式增长,数据中心对高效、低成本、低功耗AI推理能力的需求急剧上升。通凭借其在移动计算和通信领域的技术积累,正试图通过差异化战略,
    的头像 发表于 10-29 10:36 3133次阅读
    <b class='flag-5'>高</b>通挑战英伟达,发布768GB内存<b class='flag-5'>AI</b>推理芯片,“出征”<b class='flag-5'>AI</b><b class='flag-5'>数据中心</b>

    通挑战英伟达!发布768GB内存AI推理芯片,“出征”AI数据中心

    电子发烧友网报道(文/莫婷婷)随着生成式AI应用的爆发式增长,数据中心对高效、低成本、低功耗AI推理能力的需求急剧上升。通凭借其在移动计算和通信领域的技术积累,正试图通过差异化战略,
    的头像 发表于 10-29 09:14 6067次阅读
    <b class='flag-5'>高</b>通挑战英伟达!发布768GB内存<b class='flag-5'>AI</b>推理芯片,“出征”<b class='flag-5'>AI</b><b class='flag-5'>数据中心</b>

    2024存储行业十大事件盘点

    电子发烧友网报道(文/黄晶晶)2024存储行业经历了冰火两重天的一AI数据中心带动HBM内
    的头像 发表于 01-06 06:51 7111次阅读
    <b class='flag-5'>2024</b><b class='flag-5'>年</b><b class='flag-5'>存储</b>行业十大事件盘点

    AI数据中心供电系统的发展现状和未来趋势

    AI数据中心作为数字时代的核心基础设施,承担着海量数据存储、处理和传输任务,而供电系统是其稳定运行的“生命线”。随着云计算、大数据、人工智
    的头像 发表于 09-24 17:07 2855次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>数据中心</b>供电系统的发展现状和未来<b class='flag-5'>趋势</b>

    睿海光电:400G模块技术创新与AI数据中心变革

    睿海光电:400G模块技术创新与AI数据中心变革 一、400G模块:新一代数据中心的核心引擎 在AI
    的头像 发表于 08-18 13:52 777次阅读

    睿海光电800G模块助力全球AI基建升级

    在全球数字化转型加速的背景下,超高速模块作为数据中心AI算力网络的核心部件,正经历从400G向800G、1.6T的迭代浪潮。在这一赛道中,深圳市睿海光电科技有限公司(以下简称“睿海光电”)凭借
    发表于 08-13 19:05

    睿海光电以高效交付与广泛兼容助力AI数据中心800G模块升级

    提供“数据高速通道”。 低延迟与可靠:通过信号完整性设计与超低功耗控制,减少数据中心能耗的同时,保障大规模AI训练的稳定性。 前瞻布局:1.6T
    发表于 08-13 19:01

    加速AI未来,睿海光电800G OSFP模块重构数据中心互联标准

    在人工智能算力需求呈指数级增长的2025数据传输效率已成为制约AI发展的关键瓶颈。作为全球AI模块领域的标杆企业,深圳市睿海光电凭借技
    发表于 08-13 16:38

    光纤为何是AI就绪型数据中心的基石?

    康普数据中心业务部大中国区销售总监 刘伟岗 随着人工智能(AI)在各行各业加速落地应用,企业领导者也开始从根本上重新思考数据中心的建设和运营方式。同样,AI在中国市场势头正猛,各行业正
    的头像 发表于 06-13 17:07 850次阅读

    【「零基础开发AI Agent」阅读体验】+ 入门篇学习

    很高兴又有机会学习ai技术,这次试读的是「零基础开发AI Agent」,作者叶涛、锴、张心雨。 大模型的普及是近三来的一件大事,万物皆可大模型已成为
    发表于 05-02 09:26

    适用于数据中心AI时代的800G网络

    数据中心依赖数千甚至上万个GPU集群进行高性能计算,对带宽、延迟和数据交换效率提出极高要求。 AI云:以生成式AI为核心的云平台,为多租户环境提供推理服务。这类
    发表于 03-25 17:35

    DeepSeek推动AI算力需求:800G模块的关键作用

    类型和功耗选项,是数据中心向800G带宽扩展的理想选择。 市场前景广阔: 随着AI算力需求的不断增长,尤其是在超大规模数据中心AI集群的建设中,对
    发表于 03-25 12:00

    华为全新升级星河AI数据中心网络

    在华为中国合作伙伴大会2025期间,以 “星河AI数据中心网络,赋AI时代新动能”为主题的数据中心网络分论坛圆满落幕。本次论坛汇聚了来自全国的300多位客户和伙伴,共同探讨
    的头像 发表于 03-24 14:46 854次阅读

    Cadence颠覆AI数据中心设计

    日前举办的英伟达 GTC 2025 开发者大会汇聚了众多行业精英,共同探讨人工智能的未来。而人工智能正在重塑全球数据中心的格局。据预测,未来将有 1 万亿美元用于 AI 驱动的数据中心升级。然而
    的头像 发表于 03-21 15:43 875次阅读

    Solidigm高密度方案解决数据中心存储难题,赋能AI创新发展

    QLC在内的丰富产品组合,打破从数据中心到边缘应用面临的存储瓶颈,提升人工智能效率,释放人工智能潜能。 当AI的发展突破界限,算力与存力的天平被重新校准。在AI 浪潮下,传统HDD
    的头像 发表于 03-13 15:36 927次阅读