0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

LPDDR5X在AI数据中心多能打?10.7Gbps速率、互连快7倍、推理吞吐高5倍、延迟低80%!

晶芯观察 来源:未知 作者:黄晶晶 2026-01-27 09:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:黄晶晶

LPDDR5X具有高带宽、低功耗、高容量密度等特性,可用于AI推理等对能效和成本有严苛要求的场景。科技大厂例如英伟达高通、微软等都将LPDDR5X应用于AI数据中心领域。而存储厂商们包括三星、美光、SK海力士以及长鑫存储等也不断拉高LPDDR5X的规格,有望拓展继智能终端之后AI数据中心这类新应用。

三星电子

三星发布的比前代快1.25倍、功耗效率提升25%的高端低功耗DRAM LPDDR5X,不仅应用于移动设备,还广泛用于PC、服务器、汽车以及新兴的端侧AI应用,未来将引领低功耗DRAM市场的扩展。

设备自身运行AI的端侧AI时代。LPDDR5X支持高达10.7Gbps的惊人超高速数据处理速度。对于需要高性能计算的5G、AI、AR、VR自动驾驶和元宇宙等未来IT技术和端侧AI生态系统,LPDDR5X是优化的内存解决方案。



LPDDR5X采用了最先进的12nm工艺和创新的电路设计。通过应用更高级的电压可变优化技术(FDVFS)和低功耗运行区间扩展技术,相较于上一代产品,性能提升且功耗减少近25%。在智能手机和笔记本电脑等移动设备中,LPDDR5X提供了更长的电池续航时间;在用于数据中心的服务器中,它有助于降低运营成本(CTO),从而减少碳排放。

移动 DRAM LPDDR5X 在单个封装中支持高达32 GB 的容量,将应用范围从智能手机和笔记本电脑扩展到高性能 PC、服务器和设备上的人工智能应用。三星的LPDDR5X还通过了 AEC-Q100 认证,可在极高和极低温度下提供可靠的性能。

SK海力士

SK 海力士基于第5代10 纳米级(1b nm)工艺的 16Gb LPDDR5X 内存运行速率为 10.7Gbps,相较上代 9.6Gbps LPDDR5T 速度高出约 10%,能效方面提升达到 15%。SK 海力士计划以 SOCAMM 和 LPCAMM 的模组形态向服务器和 PC 市场推出 LPDDR5X 产品,以响应 AI 计算对高性能 DRAM 的需求。



美光科技

美光科技全球首款基于 1γ(1-gamma)工艺节点的LPDDR5X内存支持业界最快的10.7 Gbps 速率,同时功耗最高可降低 20%,封装厚度压缩至 0.61 毫米 ,相比竞品薄 6%,较上一代产品厚度降低14%。



NVIDIA Grace Hopper GH200是首款采用 LPDDR5X 技术的商用产品。该创新系统将 ARM CPU 与H100 GPU相结合,代表高性能计算基础设施的前沿方案。

根据美光的对比分析,基于LPDDR5X的Grace Hopper与同期的DDR5 服务器配置来看,二者的核心架构差异体现在内存封装方式,LPDDR5X 内存直接焊接在 Grace Hopper 板卡上,而 DDR5 则是通过 64 位带宽的模块连接到 CPU。Grace Hopper 的架构采用32个内存控制器,每个控制器管理来自单个 LPDDR5X 封装的16位通道。这种配置在数据处理中提供了更高的并行性与效率,因为每个通道可独立运行。
相比之下,DDR5 系统采用了更传统的设计,4 个内存控制器,每个控制器包含 4 条 32 位通道(使用 2 条 32 位子通道),总计 16 条 32 位通道。LPDDR5X 配置支持 4 个 rank,而 DDR5 仅支持2个rank,进一步提升访问并行性(因为每个 rank 可独立运行)。性能数据凸显了 LPDDR5X 的优势,其峰值理论带宽达 384GB/s,略高于DDR5 的358GB/s。这种更高的数据速率、更强的并行性与更大的带宽相结合,使 LPDDR5X 成为高性能计算应用与混合内存访问模式的优选技术。

在 CPU/GPU系统中使用 LPDDR5X 进行大语言模型推理的效果如何呢。美光科技评估了 LPDDR5X 在两种场景下的大语言模型推理性能:仅使用 CPU 的配置和 CPU+GPU 的配置。

在仅使用 CPU | Llama 3 8B的评估下,在 LPDDR5X 和 DDR5 系统上都运行Llama 3 8B 模型。参数规模在 80 到 200 亿之间的模型通常被认为适合仅在 CPU 上运行。DDR5 系统配备了高性能的 x86 CPU,时钟频率为 3.9 GHz,且具有大容量的末级缓存(L3),其原始性能更优:生成tokens的速度快1.7 倍,首token延迟也低约 1.1 倍。

然而,在评估每瓦性能(衡量能效的关键指标)时,LPDDR5X 系统表现更出色。它借助 LPDDR5X 内存和低功耗的基于ARM架构的 Grace CPU,实现了1.1 倍的能效提升,这有望显著降低推理部署成本。

在CPU 和 GPU | Llama 3 70B的评估下,为了更好地理解在 CPU+GPU 场景下的推理运行中 LPDDR5X 所起的作用,美光科技研究了一个拥有 700 亿参数的 Llama 3 模型。这种规模的模型由于对带宽和计算有更高的要求,需要GPU 和HBM 资源。

并采用了两种配置的 H100/HBM3 GPU:・集成了 H100/HBM3 GPU 的LPDDR5X 系统(NVIDIA Grace Hopper 超级芯片)・标准 DDR5 系统,为了使对比保持一致,在该系统中安装了相同的 H100/HBM3。

关键的差异在于互连性能。Grace Hopper 超级芯片配备了集成的 NVIDIA NVLink,具有 900 GB/s 的双向带宽,而标准 DDR5 系统的 PCIe Gen5 链路仅提供 128 GB/s 的双向带宽。

LPDDR5X 系统的性能大幅优于 DDR5 系统,主要体现在
・互连速度(CPU - GPU)快 7 倍
・设备到主机的传输速度为346 GB/s,主机到设备的传输速度为 334 GB/s,而 DDR5 的单向传输速度为 55 GB/s
・推理吞吐量高 5 倍
・推理延迟低 80%



长鑫存储

LPDDR5/5X 是第五代超低功耗双倍速率动态随机存储器。通过创新的封装技术和优化的内存设计,长鑫存储 LPDDR5X在容量、速率、功耗上都有显著提升,目前提供12Gb和16Gb两种单颗粒容量,最高速率达到10667Mbps ,达到国际主流水平,较上一代LPDDR5提升了66%,同时可以兼容LPDDR5,功耗则比LPDDR5降低30%。



英伟达、微软、高通将LPDDR应用于AI数据中心

近日,Cadence宣布与微软合作开发出一款面向数据中心的LPDDR5X9600Mbps内存系统解决方案。

该方案将Cadence的 LPDDR5X IP 与微软专有的纠错算法RAIDDR(冗余独立双倍数据速率阵列)ECC(纠错码)相结合。该方案可同时实现高性能、低功耗和高可靠性。微软计划在其数据中心部署此方案。双方强调,通过应用RAIDDR ECC技术,实现了与现有服务器DDR5 内存相当的数据保护能力。

此前,美光与英伟达合作开发了SOCAMM,专为支援英伟达 GB300 Grace Blackwell Ultra 超级芯片而设计,能为英伟达的相关AI平台提供低功耗、高容量的内存支持。

去年,高通推出面向数据中心的下一代AI推理优化解决方案,基于Qualcomm AI200与AI250芯片的加速卡及机架系统。Qualcomm AI200带来专为机架级AI推理打造的解决方案,每张加速卡支持768GB LPDDR内存,实现更高内存容量与更低成本,为AI推理提供卓越的扩展性与灵活性。

Qualcomm AI250解决方案将首发基于近存计算(Near-Memory Computing)的创新内存架构,实现超过10倍的有效内存带宽提升并显著降低功耗,为AI推理工作负载带来能效与性能的跨越性提升。

两款机架解决方案均支持直接液冷散热,以提升散热效率,支持PCIe纵向扩展与以太网横向扩展,并具备机密计算,保障AI工作负载的安全性,整机架功耗为160千瓦。据悉,Qualcomm AI200与AI250预计将分别于2026年和2027年实现商用。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    通挑战英伟达,发布768GB内存AI推理芯片,“出征”AI数据中心

    电子发烧友网报道(文/莫婷婷)随着生成式AI应用的爆发式增长,数据中心对高效、低成本、低功耗AI推理能力的需求急剧上升。通凭借其
    的头像 发表于 10-29 10:36 4038次阅读
    <b class='flag-5'>高</b>通挑战英伟达,发布768GB内存<b class='flag-5'>AI</b><b class='flag-5'>推理</b>芯片,“出征”<b class='flag-5'>AI</b><b class='flag-5'>数据中心</b>

    通挑战英伟达!发布768GB内存AI推理芯片,“出征”AI数据中心

    电子发烧友网报道(文/莫婷婷)随着生成式AI应用的爆发式增长,数据中心对高效、低成本、低功耗AI推理能力的需求急剧上升。通凭借其
    的头像 发表于 10-29 09:14 6852次阅读
    <b class='flag-5'>高</b>通挑战英伟达!发布768GB内存<b class='flag-5'>AI</b><b class='flag-5'>推理</b>芯片,“出征”<b class='flag-5'>AI</b><b class='flag-5'>数据中心</b>

    如何为边缘AI选择高速内存PHY?从硅验证数据到9600Mbps实测——LPDDR5X IP选型指南

    随着端侧大模型与边缘计算快速发展,LPDDR5X 成为带宽、低功耗的主流内存方案。但不少 IP 仅标称高速率,实际因信道、封装等问题大幅降频,流片风险极高。
    的头像 发表于 04-23 17:17 603次阅读

    Cadence推出高可靠性LPDDR5X 9600Mbps内存IP系统解决方案

    楷登电子(美国 Cadence 公司,NASDAQ:CDNS)近日宣布,推出业界首款专为企业与数据中心应用设计的高可靠性 LPDDR5X 9600Mbps 内存 IP 系统解决方案。该创新方案融合了
    的头像 发表于 01-21 15:00 848次阅读

    长鑫存储DDR5/LPDDR5X双芯亮相,火力全开!

    电子发烧友网综合报道,近日,长鑫存储首次全面展示DDR5LPDDR5X两大产品线最新产品。   长鑫存储最新的DDR5产品是中国首个自主研发的DDR5。该产品系列最高
    的头像 发表于 11-25 08:27 9418次阅读
    长鑫存储DDR<b class='flag-5'>5</b>/<b class='flag-5'>LPDDR5X</b>双芯亮相,火力全开!

    今日看点:长鑫存储官宣发布LPDDR5X,苹果自研 5G 芯片 C2 曝光

    动态随机存储器。通过创新的封装技术和优化的内存设计,长鑫存储 LPDDR5X容量、速率、功耗上都有显著提升,目前提供12Gb和16Gb两种单颗粒容量,最高速率达到10667Mbps
    发表于 10-30 09:53 1271次阅读

    长鑫存储LPDDR5X来了!速率高达10667Mbps,跻身国际主流水平!

    和优化的内存设计,长鑫存储 LPDDR5X容量、速率、功耗上都有显著提升,目前提供12Gb和16Gb两种单颗粒容量,最高速率达到10667Mbps,达到国际主流水平,较上一代
    的头像 发表于 10-30 09:12 6864次阅读
    长鑫存储<b class='flag-5'>LPDDR5X</b>来了!<b class='flag-5'>速率</b>高达10667Mbps,跻身国际主流水平!

    睿海光电以高效交付与广泛兼容助力AI数据中心800G光模块升级

    提供“数据高速通道”。 延迟可靠:通过信号完整性设计与超低功耗控制,减少数据中心能耗的同时,保障大规模
    发表于 08-13 19:01

    加速AI未来,睿海光电800G OSFP光模块重构数据中心互联标准

    定义数据中心互联的新范式。 一、技术实力:800G OSFP光模块的卓越性能表现 睿海光电800G OSFP光模块系列采用行业领先的PAM4调制技术,具备以下核心优势: 超高速率 :单模传输速率
    发表于 08-13 16:38

    芯动科技全套IP通过ISO 26262汽车功能安全最高等级认证

    。 图为:SGS为芯动科技颁发LPDDR5X车规级IP认证证书 其中,LPDDR5X IP以ASIL-D标准为基准,高达10.7Gbps速率A
    的头像 发表于 08-03 20:21 2454次阅读
    芯动科技全套IP通过ISO 26262汽车功能安全最高等级认证

    PCIe协议分析仪在数据中心中有何作用?

    速率,确保关键业务(如实时AI推理)的延迟。 NUMA架构下的PCIe拓扑优化 场景:多CPU服务器中,NUMA节点间通过PCIe交换
    发表于 07-29 15:02

    Cadence推出LPDDR6/5X 14.4Gbps内存IP系统解决方案

    楷登电子(美国 Cadence 公司,NASDAQ:CDNS)近日宣布业内首个 LPDDR6/5X 内存 IP 系统解决方案完成流片。该解决方案已经过优化,运行速率高达 14.4Gbps
    的头像 发表于 07-17 17:17 1549次阅读
    Cadence推出<b class='flag-5'>LPDDR</b>6/<b class='flag-5'>5X</b> 14.4<b class='flag-5'>Gbps</b>内存IP系统解决方案

    中型数据中心中的差分晶体振荡器应用与匹配方案

    中型数据中心的定义与特点 中型数据中心通常服务于中大型企业、科研机构或地方行业节点,具备50至200个机柜,部署多台服务器、交换设备、存储系统与光通信链路等,强调高带宽、延迟
    发表于 07-01 16:33

    LPDDR5X更轻薄了!明年旗舰机型或将采用

    电子发烧友网综合报道,近日美光(Micron)宣布,正在交付全球首款基于1γ工艺的LPDDR5X内存样品。该产品采用第六代10nm级别1γ(1-gamma)DRAM,速率达到10.7Gbps,可节省
    的头像 发表于 06-14 01:04 4543次阅读

    美光科技出货全球首款基于1γ制程节点的LPDDR5X内存 突破性封装技术

    开始 出货全球首款采用1γ(1-gamma)制程节点的LPDDR5X内存认证样品 。该产品专为加速旗舰智能手机上的AI应用而设计。美光LPDDR5X内存具备业界领先的速率,达到每秒
    的头像 发表于 06-06 11:49 2006次阅读