0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

存储级内存SCM详细介绍

SSDFans 来源:面包板社区 作者:面包板社区 2020-09-02 15:04 次阅读

在存储基础部件领域(Storage & Memory),这两年讨论最多的应属Intel Optane系列,全新的介质、出色的性能、非挥发特性、适中的价格,Optane受到众多存储架构师和数据中心架构师的青睐,Intel也持续大力研发和推广。本文原逻辑在2019年8月的DapuStor Haishen3系列产品发布会上已经讨论过,这里再引申一些内容,抛砖引玉,供大家探讨。

主要有以下内容:

什么是SCM(StorageClassMemory);

为什么说SCM越来越重要(数据中心基础设施在经历什么,存储行业又在经历什么);

DapuStor在思考什么(Optane SSD & Haishen3-XL)。

什么是SCM

关于SCM的定义,个人觉得以下统称比较合适:“介于DRAM和NAND FLASH之间的具备非挥发特性的产品”。因为没有精确的关于SCM参数的定义,我们先来看看DRAM和NAND的一些相关参数:

表:DRAM vs NAND FLASH

可以看到这两者之间存在比较大的GAP,SCM即填补了这个GAP,如下图的产品级图示:

图:存储层缺口Gap - SCM

为什么说SCM越来越重要

首先,每个CPU核的可用DRAM容量,每两年降低20~30%。

Intel创始人之一的Gordon Moore提出“集成电路上可容纳的元器件的数目,约每隔18-24个月便会增加一倍,性能也将提升一倍”,这成为IT产业最著名的摩尔定律,Intel、AMD服务器CPU路线也符合这个发展规律:

表:服务器CPU的发展

但当我们把服务器内存容量的发展趋势和CPU核数放在一起,就能看到其中的问题:

表:服务器CPU &内存的发展

即“每个服务器CPU核的可用DRAM容量,每两年降低20~30%”,其实服务器CPU对内存的“hungry”是业界的共识:

图:服务器CPU &内存的发展

这个趋势从美国阿冈国家实验室超级计算机计划 Argonne National Labs plans也可以看出:

表:阿冈国家实验室HPC计划

其次,CPU获得的DRAM带宽增速,远远不及SSD、网络带宽增速。

这里直接引用Sandisk Fellow Fritz Kruger的数据,有兴趣的朋友可以搜索“CPU Bandwidth – The Worrisome 2020 Trend”:

图:网络、存储、DRAM趋势(Log scale)

图:网络、存储、DRAM趋势(Linear scale)

第三,DRAM行业面临scale up瓶颈。

熟悉DRAM行业的朋友,都知道DRAM行业经历了一个残酷的厮杀过程:从上世纪80年代的超过20家,到现在的“3大1小”。

在这个行业发展过程中,每一家都在靠以下两种方式竞争:“制程转进”与“扩大产能”。前者即为新工艺的研发,如20nm转往17nm,会带来比如20~30%的bit growth;后者即为更新、增加产线和设备,以增加投片和产出。这两者都需要庞大的资本投入,而在早期资本的投入和整体bit growth基本呈线性关系。

而我们如果拆开来看的话,可以发现随着制程的发展,到了20nm及以下制程后,工艺的转进带来的研发投入增长越来越庞大,大白话是“原来有100块钱,花30块钱更新制程另外70块钱扩产;但是现在更新一个制程需要花70块甚至更高”。

因此,行业近5年虽然资本支出越来越大,但产出bit growth却越来越低,也就是说整个行业面临scale up的瓶颈,资本投入和bit growth并非线性关系,且越来越明显:

图:DRAM行业资本支出和位成长率

DRAM是已经商用的最快的存储介质,从性能特性来说无法被替代,再加上现在行业的寡头局面,任何一个IT OEM厂商或者数据中心,都需要至少3家供应商。如果你是其中一家DRAM供应商,你会怎么想?会不会是“这个生意太好了,慢慢来 :)”。

综合以上各个趋势发展,聪明的架构师们就开始从系统角度来思考这个问题,这也说明了为什么SCM会被委以重任。

具体SCM的使用场景有两种:Caching 和 Tiering,一般情况下Caching相对比较容易实现,而Tiering需要更深入的上下层整合,包括配套的算法,以确保兼顾各Tier的容量比(即成本)和效率。很多大型数据中心和存储厂商都在积极寻找和布局合适Optane SCM的应用场景,比如HPE有“Memory-Driven Flash”(Caching),比如DellEMC PowerMAX支持Tiering。

DapuStor在思考什么

DapuStor(深圳大普微电子科技有限公司)致力于打造企业级智能固态硬盘、数据存储处理器芯片及边缘计算相关产品,企业级、数据中心级智能存储基础设施是我们现阶段主要的方向,而在此领域如此重要的SCM产品,当然非常关键。

合作伙伴KIOXIA(原Toshiba)在2018年提出SCM级XL-FLASH发展规划,在接下来的时间里,DapuStor也针对XL-FLASH和KIOXIA进行了长时间的紧密沟通和合作,Haishen3-XL SCM级SSD也确定了如下特性:

图:DapuStor Haishen3 SCM特性

关于Haishen3-XL和OptaneSSD、Z-SSD性能的比较

表:Optane SSD vs Z-SSD vs Haishen3-XL

Optane SSD采用3DXpoint,Z-SSD和Haishen3-XL采用optimized low-latency SLC NAND,从介质上讲3DXpoint已经不是NAND而是PCRAM,是“cross point”型架构,寻址方式、写入过程等与NAND完全不同,不需要垃圾回收,因此Optane SSD RW IOPS有明显优势,另外据说Optane Gen2 会进一步提升至60DWPD,这是从介质改革带来的优势;其它方面Haishen3-XL并不弱。

因此从整体性能方面,low-latency SLC NAND SSD,如Haishen3-XL可在大部分应用场景和Optane SSD共同存在。

DapuStor也在2020年1月份的PM Summit上基于RWW(Real World Workload)对Optane SSD、Haishen3-XL进行了比较,原文链接参考:http://www.dapustor.com/news_view.aspx?nid=2&typeid=139&id=543

关于Haishen3-XL和OptaneSSD成本的比较

因为Intel在数据中心CPU领域占绝对垄断地位,针对CPU和Optane、SSD也有类似bundle program优势,因此我们无法估算Optane SSD的to B实际成交价格,仅以电商平台零售价来看还是挺高的:

表:Optane SSD零售价

另一方面,我们粗算一下,能看到3DXpoint Gen1的Wafer成本大概是96L low-latency SLC NAND的2倍:

表:Wafer Cost:TLC vs XL-FLASH vs 3DXpoint vs DRAM

下面再看看Intel 3DXpoint从Micron的采购成本。

从Micron 2020FQ2 Earnings report,可以估算出Micron交付给Intel的3DXpoint业务预计为2B$的6%,即为120M$:

“……Revenue for the CNBU was approximately $2 billion, down approximately1% sequentially and down 17% year-over-year. We have now started to include all 3D XPoint revenue in CNBU reporting, as the use cases for 3D XPoint technology are more closely aligned with memory expansion and this business is being managed by CNBU. Excluding 3D XPoint, CNBU revenue would have been down 7% sequentially……”

而3DXpointGen1的产能约为135MGB/Q https://blocksandfiles.com/2019/08/27/3d-xpoint-revenue-forecasts/:

“……It will output 45m GB/month of Gen 1 XPoint in the fourth quarter and 5m GB/month of Gen 2 XPoint……”

即Intel采购价格约为120M$/135MGB = 0.88$/GB。Intel和Micron的长期合作协议,该价格应该是Micron能提供的最优价,基本符合上面Wafer成本的测算(3DXpoint Gen1 wafer成本大概是96L TLC的10倍).

财务表现上, Intel在Optane上的巨大研发投入,也导致NSG绝大多数财季在亏损。从长期来看,Intel大概率会持续推广Optane产品,随着3DXpoint的使用量越来越多,生产制造成本也会随之降低,形成正循环。

而从一个健康的行业发展来看,现阶段正是需要多个SCM玩家推高市场需求的时期。Low-latency NAND因为基于非常成熟的3D NAND研发生产制造流程,从生态上来说是一个非常合适的SCM产品第二选择,DapuStor也立志成为基于low-latency NAND的优秀SCM解决方案提供商。

说明:文中部分内容涉及对未来的判断,可能和实际会有出入;另外有一些数据是通过参考公开数据推测而来,并非一手数据。若有偏颇还望见谅,有问题欢迎讨论lijinxing@dapustor.com :)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    12

    文章

    3854

    浏览量

    84652
  • SCM
    SCM
    +关注

    关注

    2

    文章

    65

    浏览量

    15203

原文标题:珍藏!存储级内存SCM,看这一篇就够了!

文章出处:【微信号:SSDFans,微信公众号:SSDFans】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    数据中心存储的趋势

    的优越性能,全闪存存储阵列在数据中心中越来越受欢迎。这些存储系统使用SSD作为主存储和辅助存储,提供更快的数据访问、降低功耗并提高可靠性。 二、存储
    的头像 发表于 03-18 17:39 210次阅读

    rom是什么存储器是内存还是外存

    与主存储器(内存)和辅助存储器(外存)有不同的特点和应用场景。 首先,我们来详细了解ROM的特点和分类。ROM是一种非易失性存储器,这意味着
    的头像 发表于 02-05 10:05 1464次阅读

    系统内存和运行内存的区别

    系统内存和运行内存都是计算机中重要的概念,它们在计算机的存储和运行方面起着不可或缺的作用。虽然它们与计算机存储和运行息息相关,但是它们具有不同的功能和实现方式。接下来我将
    的头像 发表于 01-15 16:32 673次阅读

    段式存储管理和页式存储管理的区别

    段式存储管理和页式存储管理是操作系统中两种常见的内存管理技术,它们在物理内存的分配和管理上有着显著的区别。本文将对这两种存储管理技术进行
    的头像 发表于 12-30 17:17 1544次阅读
    段式<b class='flag-5'>存储</b>管理和页式<b class='flag-5'>存储</b>管理的区别

    什么是内存内存的工作原理 关于NOR和NAND的介绍和区别

    什么是内存呢?在计算机的组成结构中,有一个很重要的部分,就是存储器。存储器是用来存储程序和数据的部件,对于计算机来说,有了存储器,才有记忆功
    的头像 发表于 12-07 11:02 832次阅读

    jvm内存区域由哪几部分组成

    方法栈。下面将详细介绍这些部分。 堆内存(Heap Memory):堆内存是JVM中最大的一块内存区域,用来
    的头像 发表于 12-05 14:10 291次阅读

    jvm内存模型和内存结构

    JVM(Java虚拟机)是Java程序的运行平台,它负责将Java程序转换成机器码并在计算机上执行。在JVM中,内存模型和内存结构是两个重要的概念,本文将详细介绍它们。 一、JVM
    的头像 发表于 12-05 11:08 394次阅读

    利用内存存储构建边缘策略

    利用内存存储构建边缘策略
    的头像 发表于 11-23 09:04 128次阅读
    利用<b class='flag-5'>内存</b>及<b class='flag-5'>存储</b>构建边缘策略

    SCM601L216UE烧写时提示DDR init select error是什么原因?

    SCM601L216UE烧写时提示DDR init select error,什么原因?
    发表于 09-01 07:29

    使用emWin的API显示面板内存存储的图片

    应用程序: 此示例代码使用 emWin 的 API 显示面板内存存储的图片 。 BSP 版本:M480系列BSP CMSIS V3.03.001 硬件: NuMaker-PFM-M487 V3.0
    发表于 08-31 08:18

    C语言内存问题如何解决

    。 踩内存,轻则导致功能异常,重则导致程序崩溃死机。 内存,粗略地分: 静态存储区 动态存储存储于相同
    的头像 发表于 06-22 11:37 259次阅读
    C语言<b class='flag-5'>内存</b>问题如何解决

    什么是堆内存存储方式是什么样的?

    只有在堆内存里面才会发生内存泄漏的问题,在栈内存中不会发生内存泄漏。因为栈内存在自动分配空间之后,还会自动释放空间。 什么是堆
    的头像 发表于 06-22 10:29 762次阅读
    什么是堆<b class='flag-5'>内存</b>?<b class='flag-5'>存储</b>方式是什么样的?

    Linux内存管理的详细介绍分享

    内存管理是计算机系统中负责管理系统内存资源的一种机制,主要包括内存分配、内存释放、内存映射和虚拟内存
    的头像 发表于 05-29 14:09 1393次阅读
    Linux<b class='flag-5'>内存</b>管理的<b class='flag-5'>详细</b><b class='flag-5'>介绍</b>分享

    金升阳车规级SCM1212-Q芯片性能介绍

    SCM1212-Q作为成熟的DC-DC电源管理IC产品,在设计之初便考虑到引脚兼容问题,引脚尺寸设计时便与市场上产品互通,无需用户大幅改动pcb板,便可丝滑切换,享受更高的性价比体验。
    发表于 05-26 09:39 443次阅读
    金升阳车规级<b class='flag-5'>SCM</b>1212-Q芯片性能<b class='flag-5'>介绍</b>

    如何从github获得的Bluebox存储库?

    我们已经尝试构建从 github 获得的 Bluebox 存储库,但由于大量旧的 Codeaurora URI,早在 Yocto 的配方解析阶段就遇到了问题。似乎影响所有 BSP,无论转速如何(尝试
    发表于 05-06 06:23