0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于DRAM的性能分析和发展

半导体科技评论 来源:djl 作者:Kevin Fogarty 2019-09-04 10:26 次阅读

如果人类创造了一个真正有自我意识的人工智能,那么等待数据到达可能会让它倍感沮丧。

过去二十年来,基于 DRAM 的计算机内存的存取带宽已经提升了 20 倍,容量增长了 128 倍。但延迟表现仅有 1.3 倍的提升,卡内基梅隆大学的研究者 Kevin Chang 如是说,他提出了一种用于解决该问题的新型数据通路。

现代计算机需要大量高速度、高容量的内存才能保证持续运转,尤其是工作重心是内存数据库、数据密集型分析以及越来越多的机器学习和深度神经网络训练功能的数据中心服务器。尽管研究人员已经在寻找更好、更快的替代技术上努力了很多年,但在性能优先的任务上,DRAM 仍旧是人们普遍采用的选择。

这有助于解释今年的 DRAM 销量激增,尽管据 IC Insights 报告称供应有限让其平均售价增长了 74%。售价激增让 DRAM 市场收入达到了创纪录的 720 亿美元,帮助将 IC 市场的总收入推升了 22%。据这份 IC Insights 报告说,如果没有来自 DRAM 价格的额外增长(过去 12 个月增长了 111%),那么 2017 年整个 IC 市场的增长将只能达到 9%,相比而言 2016 年仅有 4%。

对于 DRAM 这样一个很多人都想替代的成熟技术而言(因为它的速度达不到处理器一样快),这个数字确认惊人。当前或未来有望替代 DRAM 的技术有很多,但专家们似乎认为这些技术还无法替代 DRAM 的性价比优势。就算用上 DRAM 技术上规划的改进方案以及 HBM2 和 Hybrid Memory Cube 等新型 DRAM 架构,DRAM 和 CPU 之间的速度差距依然还是存在。

Rambus 的系统与解决方案副总裁和杰出发明家 Steven Woo 在 CTO 办公室中说,来自 JEDEC 的下一代 DRAM 规格 DDR5 的密度和带宽都是 DDR4 的 2 倍,可能能够带来一些提速。

对于需要密集计算而且对时间敏感的金融技术应用以及其它高端分析、HPC 和超级计算应用而言,这将会非常重要——尤其是当与专用加速器结合起来时。

Woo 说:“对更高内存带宽和更大内存容量的需求是显然存在的,但 DDR5 本身并不足以满足这些需求,我们也不清楚其它哪些技术可能会取得成功。我们已经看到很多处理过程(比如加密货币挖矿和神经网络训练)正从传统的 x86 处理器向 GPU 和专用芯片迁移,或者对架构进行一些修改,让数据中心中的处理更靠近数据的存储位置,就像边缘计算或雾计算。”

关于DRAM的性能分析和发展

图 1:新标准的引入;来自 Cadence

据 Babblabs 公司 CEO 兼斯坦福大学 System X 的战略顾问 Chris Rowen 说,对于在神经网络上训练机器学习应用而言,GPU 显然最受欢迎的,但芯片制造商和系统制造商也在实验一些稍微成熟的技术,比如 GDDR5,这是一种为游戏机、显卡和 HPC 开发的同步图形 RAM,英伟达也正是这么使用它的。

关于DRAM的性能分析和发展

图 2:内存在芯片层次结构中的位置;来自 Rambus

由 SK 海力士和三星制造的 HBM2 将一些高速 DRAM 芯片放在了增加了一些逻辑处理的层级以及提供了到处理器的高速数据链路的 interposer 之上,从而让内存与处理器之间的距离比 GDDR5 的设计更近。HBM2 是高速度至关重要的 2.5D 封装中的一项关键元素。HBM2 是一项与 Hybrid Memory Cube 相竞争的 JEDEC 标准。Hybrid Memory Cube 是由 IBM 和美光开发的,使用了过硅通孔(TSV)来将不同的内存层连接到基础逻辑层。

应用硅光子学的光学连接(optical connection)也能实现加速。到目前维持,大多数硅光子学应用都在数据中心中的服务器机架和存储之间以及高速网络连接设备内部。业内专家预计这种技术将会在未来几年里向离处理器更近的位置迁移,尤其是当其封装技术得到完全验证并且设计流程将这项技术包含进来之后。光学方法的优势是发热很慢而且速度非常快,但光波还是要在转换成电信号之后才能存储和处理数据。

另外还有 Gen-Z、CCIX、OpenCAPI 等新型互连标准,也有 ReRAM、英特尔的相变 3D Xpoint、 3D NAND 和磁相变 MRAM 等新型内存类型。

NVDIMM 速度更慢但容量更大,增加电池或超级电容可以实现非易失性,从而让它们可以使用更低的功耗缓存比普通 DRAM 更多的数据,并且还能保证它们在断电时不会丢失交易数据。据八月份来自 Transparency Market Research 的一份报告称,支持 NVDIMM 的芯片制造商包括美光和 Rambus,预计其销售额将会从 2017 年的 7260 万美元增长到 2025 年的 1.84 亿美元。

选择这么多,可能会让人困惑,但针对机器学习或大规模内存数据库或视频流来调整内存性能会让选择更轻松一些,因为其中每种任务都有不同的瓶颈。Rowen 说:“实现带宽增长有一些主流的选择——DDR3、DDR4、DDR5,但你也可以尝试其它选择,从而让内存带宽满足你想做的事情。”

Rowen 说,对于有意愿编写直接控制 NAND 内存的代码的人来说,整个问题可能还会更简单;而如果是鼓捣协议和接口层,让 NAND 看起来就像是硬盘并且掩盖在上面写入数据的难度,那就可能会更加困难。“有了低成本、容量和可用性,我认为在让闪存存储包含越来越多存储层次上存在很多机会。”

冷却 DRAM

Rambus 的内存与接口部门的首席科学家 Craig Hampel 说,每一种内存架构都有自己的优势,但它们都至少有一个其它每一种集成电路都有的缺点:发热。如果你能可靠地排出热量,你就可以将内存、处理器、图形协处理器和内存远远更加紧密地堆积到一起,然后可以在节省出的空间中放入更多服务器,并且还能通过减少内存与系统其它组件之间的延迟来提升性能。

液体冷却是让绝缘矿物油流经组件的冷却方法。据 IEEE Spectrum 2014 年的一篇文章称,液体冷却让香港的比特币挖矿公司 Asicminer 的 HPC 集群的冷却成本降低了 97%,并且还减少了 90% 的空间需求。

自 2015 年以来,Rambus 就一直在与微软合作开发用于量子计算的内存,这是微软开发拓扑量子计算机工作的一部分。因为量子处理器只能在超低温环境下运行(低于 -292℉/-180℃/93.15K),所以 Rambus 正为该项目测试的 DRAM 也需要在这样的环境下工作。Rambus 在 4 月份时扩展了该项目,那时候 Hampel 说该公司已经确信寒冷能带来重大的性能增益。

关于DRAM的性能分析和发展

图 3:低温计算和存储;来自 Rambus

比如,当 CMOS 足够冷时,CMOS 芯片的数据泄露(data leak)就会完全停止。几乎就会变成非易失的。它的性能会增长,能让内存的速度赶上处理器的速度,从而消除 IC 行业内一大最顽固的瓶颈。在 4K 到 7K 这样极端低温的环境下,线材将变成超导体,让芯片仅需非常少的能量就能实现长距离通信

低温系统还有额外的优势。比起空调制冷,低温系统能从堆叠的内存芯片中抽取出更多热量,从而可实现更大的堆叠(或其它组装方式)密度,实现更高效的协作。Hampel 说:“抽取热量让你能将服务器机架的大小减小多达 70%,这意味着数据中心每立方英尺的密度增大了。这让它们更容易维护,也可以更容易地将它们放在之前无法到达的地方。”

更重要的是,如果在处理器层面上实现的效率提升与数据中心其它地方的提升基本一致,那么低温系统可以让现有的数据中心更有成本效益和实现更高效的计算,从而可以减少对更多数据中心的需求。

而且不需要非常冷就可以收获其中大多数效益;将内存冷却到 77K(-321℉/-196℃)就能得到大多数效益了。

Hampel 说:“液氮很便宜——每加仑几十美分,而且在达到大约 4 K 的超级冷之前,成本上涨其实也并不快。降到50K 左右其实并不贵。”

接近处理器

据 Marvell 存储部门总监 Jeroen Dorgelo 说,超低温冷却可以延长数据中心中 DRAM 的寿命,但随着行业从 hyperscale 规模向 zettascale 规模演进,已有的任何芯片或标准都无法应付这样的数据流。他说,DRAM 虽快但功率需求大。NAND 不够快,不适合扩展,而大多数前沿的内存(3D XPoint、MRAM、ReRAM)也还无法充分地扩展。

但是大多数数据中心还没有处理好变得比现在远远更加分布式的需求。据 Marvell 的连接、存储和基础设施业务部网络连接 CTO Yaniv Kopelman 说,分布式有助于减少远距离发送给处理器的数据的量,同时可将大多数繁重的计算工作留在数据中心。

IDC 的数据中心硬件分析师 Shane Rau 说,社交网络、物联网和几乎其它每个地方的数据所带来的压力正迫使数据中心蔓延扩展——在全国各地建立两三个大规模数据中心,而不是在单一一个地方建一个超大规模数据中心。

Rau 说:“规模确实不一样,但问题的关键仍然是延迟。比如说,如果我旁边就有一个数据中心,我就不需要将我的数据移动太远距离,而且我可以在我的笔记本电脑上完成一些处理,更多的处理则在本地数据中心中进行,所以在数据到达它要到达的位置时已经经过一些处理了。很多人在谈将处理工作放到存储的位置是为了平衡不同设备基础上的瓶颈。现在,规模问题更多是关于让数据中心在边缘完成一些工作,即数据的产生位置和数据的最终去处之间。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    18024

    浏览量

    221534
  • DRAM
    +关注

    关注

    40

    文章

    2126

    浏览量

    181820
  • 数据中心
    +关注

    关注

    15

    文章

    4125

    浏览量

    69344
收藏 人收藏

    评论

    相关推荐

    DRAM供应链在改善亏损的同时,需应对需求挑战

    关于各个细分领域,有观点指出,PC DRAM买家将在第二季度加大DDR5的采购量,由于存储芯片生产商正大规模转向更高级别的制造工艺,其收益得到显著改善。但是,机构预期PC DRAM第二季度合约价环比涨幅为3%——8%,而其中DD
    的头像 发表于 03-26 15:58 44次阅读

    三轴按键试验机:原理、应用与性能分析

    三轴按键试验机:原理、应用与性能分析
    的头像 发表于 12-18 09:10 157次阅读
    三轴按键试验机:原理、应用与<b class='flag-5'>性能</b><b class='flag-5'>分析</b>

    dram和nand的区别

    门。尽管它们都是用于存储数据的,但在构造、功能、性能和应用方面存在很多区别。 首先,DRAM和NAND的构造方式不同。DRAM是由一个个存储单元组成的,每个存储单元由一个电容和一个开关组成。在读写数据
    的头像 发表于 12-08 10:32 4137次阅读

    DRAM的范式转变历程

    DRAM制造技术进入10nm世代(不到20nm世代)已经过去五年了。过去五年,DRAM技术和产品格局发生了巨大变化。因此,本文总结和更新了DRAM的产品、发展和技术趋势。
    的头像 发表于 11-25 14:30 560次阅读
    <b class='flag-5'>DRAM</b>的范式转变历程

    DRAM选择为何突然变得更加复杂?

    芯片制造商正在使用更多的DRAM。在某些情况下,DRAM——尤其是高带宽存储器(HBM)——正在取代一些SRAM。DRAM在耐用性方面有着良好的记录,也有成熟的工艺,而且比SRAM便宜得多
    的头像 发表于 11-22 16:36 492次阅读
    <b class='flag-5'>DRAM</b>选择为何突然变得更加复杂?

    关于DRAM市场趋势的“虚假谎言

    在半导体逻辑的研发中,“小型化的极限”一直被人们谈论。正如上次提到的,尖端逻辑MOS FET的加工尺寸已不再与技术节点值相匹配,可以说晶体管的小型化已经达到了极限。那么DRAM的小型化又如何呢?
    发表于 11-08 11:38 159次阅读
    <b class='flag-5'>关于</b><b class='flag-5'>DRAM</b>市场趋势的“虚假谎言

    DRAM先进制程进展如何?

    美光1β DDR5 DRAM支持计算能力向更高的性能扩展,能支持数据中心和客户端平台上的人工智能(AI)训练和推理、生成式AI、数据分析和内存数据库(IMDB)等应用。
    发表于 10-26 14:19 140次阅读

    同时取代闪存和DRAM,ULTRARAM真有这个潜力吗?

    电子发烧友网报道(文/周凯扬)在近期的闪存峰会上,一家由英国兰卡斯特大学孵化的初创公司Quinas Technology获得了创新大奖。他们展示了ULTRARAM,一个结合了DRAM性能和闪存
    的头像 发表于 10-09 00:10 1314次阅读

    MRAM会取代DDR吗?简单比较下MRAM、SRAM和DRAM之间的区别

    在当前我们比较熟悉的存储产品就是DRAM和NAND,DRAM和NAND也一直在寻求高带宽和低功耗的发展
    的头像 发表于 10-07 10:18 1737次阅读
    MRAM会取代DDR吗?简单比较下MRAM、SRAM和<b class='flag-5'>DRAM</b>之间的区别

    DRAM的工作原理 DRAM存储数据和读取数据过程说明

    内存应该是每个硬件工程师都绕不开的话题,稍微复杂一点的系统都需要用到DRAM,并且DRAM是除CPU之外,最为复杂也最贵的核心部件了,其设计,仿真,调试,焊接,等等都非常复杂,且重要。对DRAM
    发表于 09-25 11:38 1989次阅读
    <b class='flag-5'>DRAM</b>的工作原理 <b class='flag-5'>DRAM</b>存储数据和读取数据过程说明

    堆叠式DRAM存储节点相关部分的结构分析

    在下面的图中显示了堆叠式DRAM存储节点相关部分的结构图。下图(a)显示了堆叠式DRAM存储节点接触(SNC)结构。
    发表于 09-08 10:02 610次阅读
    堆叠式<b class='flag-5'>DRAM</b>存储节点相关部分的结构<b class='flag-5'>分析</b>

    内存芯片制造工艺 DRAM工艺流程 堆叠式DRAM工艺流程

    内存芯片在驱动ic市场和ic技术发展方面发挥了重要作用。市场上两个主要的内存产品分别是DRAM和NAND。
    的头像 发表于 09-01 09:43 3361次阅读
    内存芯片制造工艺 <b class='flag-5'>DRAM</b>工艺流程 堆叠式<b class='flag-5'>DRAM</b>工艺流程

    使用Arm Streamline分析树莓派的性能

    在本指南中,我们将探索Linux应用和系统性能分析,并学习如何找到一个系统正在花费时间的地方。说明应用程序和发现性能瓶颈有助于集中软件优化努力,以改善系统性能。简化
    发表于 08-29 06:30

    DRAM连接32位SDRAM时,sdram支持多大的容量?

    DRAM 连接32位SDRAM时,最大支持64Mx32bit?
    发表于 05-26 07:27

    《现代CPU性能分析与优化》--读书心得笔记

    很荣幸拿到这本<<现代CPU性能分析与优化>>,花了几天的时间浏览了一遍,书比较单薄,正文只有不到200页,但是里面的内容确是非常丰富的,一般
    发表于 04-24 15:31