0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何使用NVMe SSD实现构建全闪存存储系统

牵手一起梦 来源:C114通信网 作者:C114通信网 2020-01-01 17:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

根据2018年底IDC发布的报告“Data Age 2025:The Digitization of the World From Edge to Core”显示,伴随5G/IoT和车联网等新兴技术落地,越来越多的终端以及越来越高的带宽催生越来越多的数据产生,到2025年,全球将每年产生约175ZB数据;同时随着大数据/AI技术的广泛应用,数据的价值得到更加充分的挖掘,被存储和被分析的数据量指数增长。

另一方面,相比机械盘(HDD),基于NAND Flash介质的SSD可提供更高性能、更高密度、更低能耗,随着技术不断进度,成本进一步下降,已经被市场广泛接受,发货量超过HDD;传统针对HDD盘设计的SATA/SAS接口,无法充分发挥SSD的性能潜力,针对SSD设计的NVMe标准接口一经出现,便展现了强大生命力。根据2019年全球闪存峰会(Flash Memory Summit,FMS)的预测,2020年将有50%以上的服务器,40%以上的阵列支持NVMe SSD,NVMe将很快超过SATA/SAS成为SSD使用的主流存储接口,宣告NVMe时代的到来。

应用数据量和数据热度同时增加,对于存储系统的设计提出了新的挑战,使用NVMe SSD构建的全闪存存储系统成为业界共识,而如何构建各自又有不同的理解。本文对这个问题做一个粗浅的探讨。

全闪系统的性能指标,低时延比高IOPS更为关键。降低时延,关键是缩短IO路径,提升IO路径的处理效率。在系统设计选择上,要求针对NVMe特点做出新的调整。

为达到更低的IO时延和更高的效率,前端支持NVMe over Fabric是必选。后端NVMe SSD的组网可在PCIe和NVMe over Fabric(FC或RoCE)之间选择,PCIe时延为亚微秒,但扩展能力比较局限;NVMe over Fabric扩展能力强,而时延则在10微秒级。

NVMe SSD单盘性能相当强大(100k iops),控制器往往构成系统性能瓶颈,串接盘柜的扩容方式,只能增加容量,并不能带来性能的增长,因此,全闪系统应考虑scale-out的架构。 从降低时延的角度,数据的跨控制器转发应尽量避免。但为了提供数据跨控制器冗余,或者提升单对象多控制器并发访问能力,又要求数据在不同控制器之间转发,一个系统需要在有冲突的多个需求间寻求平衡。

而另一方面,无论技术如何发展,高可用性是对存储系统的一贯要求,对于更多承担关键业务的全NVMe闪存系统来说,高可用性更是一个不容让步的目标。Scale-out系统有了更多的硬件部件,合适的架构可以达成相比双控阵列更高的可用性,而不合适的架构选择可能形成整体串联的可靠性模型,反而降低了系统的可用性,这是系统设计者和用户都值得注意的。

例如一些系统为追求全局去重效果,将所有的数据按其指纹的HASH来确定数据存储和处理的模块,这种设计不仅在正常工作时存在大量的模块间数据转发,更为严重的是,在单个模块故障后,可能导致全系统数据不可用(如图1,不同模块处理不同尾数的指纹。例如Module1故障后,所有指纹尾数是0、1的数据将不可用,从而整个系统不可用);这种系统的可用性模型是各模块的串联,假设单个模块可用性是5个9,全系统可用性必然低于5个9。

如何使用NVMe SSD实现构建全闪存存储系统

图 1 按模块处理指纹的全局去重设计示意

中兴通讯基于多年存储研发技术的积累,全新发布全NVMe全闪存阵列KF8200。秉承一贯脚踏实地的风格,以系统可靠稳定为基石,同时积极拥抱技术最新发展,在软硬件架构上全面创新,KF8200成为全NVMe时代中兴通讯存储的旗舰产品。

图 2 ZXCLOUD KF8200全NVMe闪存阵列

全系统由一个或多个双控机柜通过RoCE网络连接,组成一个scale-out系统。每个双控机柜都可以提供NVMe over Fabric访问接口;单机柜支持30块NVMe SSD,可提供超过200w IOPS以及亚ms的响应时间。

所有NVMe SSD都位于控制器柜中,通过PCIe直接与控制器相连,避免了复杂的后端组网,硬件设计上保证极低时延;软件上,数据冗余使用机柜内专用通道在机柜内双控间完成,避免了机柜间数据转发导致的时延;数据分布策略设计上,做到了系统正常工作时,基本无跨模块数据转发,IO数据路径做到业界最短。

由于消除了正常工作时模块间数据转发,基本实现了真正意义上的scale-out,即性能和容量都随着节点(以机柜为单位)增加而线性增加。各个节点间正常工作状态呈现为松耦合,而在异常发生时各节点业务又可以互为倒换,在可靠性和性能二者之间达成较为理想的均衡。

责任编辑:gt

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 车联网
    +关注

    关注

    76

    文章

    2719

    浏览量

    94050
  • 5G
    5G
    +关注

    关注

    1368

    文章

    49255

    浏览量

    644565
  • IOT
    IOT
    +关注

    关注

    190

    文章

    4435

    浏览量

    210271
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    中科曙光正式发布高端闪存存储FlashNexus 9000

    5月13日,中科曙光正式发布高端闪存存储FlashNexus 9000,以高达2亿IOPS的极致性能,守护金融、医疗、能源、通信等关键行业的高价值数据,助力构建AI数据底座,推动核心
    的头像 发表于 05-14 09:58 941次阅读

    AI Ceph 分布式存储教程资料大模型学习资料2026

    。如何构建高性能、高吞吐、高可扩展的 AI 分布式存储系统,已成为解锁大模型基建能力的核心科技命题。这不仅关乎数据存得下、读得快,更直接决定了 GPU 集群的利用率与模型训练的最终效率。 一、 突破 I/O
    发表于 05-01 17:35

    SSD固态硬盘品牌推荐:从FTL到掉电保护,读懂高可靠存储的技术逻辑

    SSD固态硬盘正在逐步取代机械硬盘成为各类系统的核心存储方案。本文从技术原理出发,解析SSD如何通过FTL闪存转换层、磨损均衡、垃圾回收等机
    的头像 发表于 04-09 17:06 451次阅读

    星载存储架构演进:天硕XMC固态硬盘如何实现航天存储的可控性提升

    星载存储系统的单点失效并非源于单一器件,而是数据路径在多层机制叠加下的系统性风险。本文从航天工程实践出发,结合天硕航天存储等行业路径,解析航天级SSD固态硬盘如何通过分层容错与
    的头像 发表于 03-30 15:19 490次阅读

    工业级NVMe M.2 ArmourDrive™ PX系列SSD深度解析

    工业级NVMe M.2 ArmourDrive™ PX系列SSD深度解析 在电子设备高速发展的今天,存储设备的性能和可靠性至关重要。Greenliant推出的GLS88DQ064G3 / 128G3
    的头像 发表于 03-30 14:20 288次阅读

    nvme SSD 上重新启动失败,如何解决?

    。每当我发出“sudo reboot”时,系统在重置后都会挂起,显然是因为它找不到 nvme ssd: 这是我在串行控制台中得到的内容: [ 4.193478] starfive soc
    发表于 03-12 06:40

    工业级NVMe存储稳态性能实测:天硕G40 M.2 SSD长时压力测试

    的新一代工业级SSD产品:G40 M.2 NVMe 工业级SSD。 让我们先初步了解一下本次的测试对象:天硕(TOPSSD)G40 M.2 NVMe 工业级
    的头像 发表于 02-06 11:29 697次阅读
    工业级<b class='flag-5'>NVMe</b><b class='flag-5'>存储</b>稳态性能实测:天硕G40 M.2 <b class='flag-5'>SSD</b>长时压力测试

    忆联以SSD产品赋能存储产业高效跃迁

    AI的飞速发展,正成为驱动全球存储市场增长的核心动力,市场对DRAM、NAND到SSD/ HDD的存储栈需求持续激增。
    的头像 发表于 12-29 10:45 2060次阅读
    忆联以<b class='flag-5'>全</b>系<b class='flag-5'>SSD</b>产品赋能<b class='flag-5'>存储</b>产业高效跃迁

    高性能网络存储设计:NVMe-oF IP的实现探讨

    延伸到网络中。 该IP系统架构如下: 它具有如下特点: ① 动态队列绑定(DynamicQueue Binding)机制 系统针对 NVMe SSD 的多队列并行特性,设计了 负载感知
    发表于 12-19 18:45

    Xilinx高性能NVMe Host控制器IP+PCIe 3.0软核控制器IP,纯逻辑实现,AXI4和AXI4-Stream DMA接口,支持PCIe 3.0和4.0

    NVMe AXI4 Host Controller IP1介绍NVMe AXI4 Host Controller IP可以连接高速存储PCIe SSD,无需CPU,自动加速处理所有的
    发表于 11-14 22:40

    戴尔科技闪存存储PowerStore有何独特之处

    近日,在IDC最新发布的全球企业存储系统季度跟踪报告中,戴尔科技集团再度蝉联闪存存储供应商收入榜首!
    的头像 发表于 10-15 14:19 1969次阅读

    华纳云为游戏数据库选择高性能NVMe SSD存储

    游戏数据库对速度、可靠性和可扩展性有极高要求。随着在线游戏的发展,开发者越来越依赖NVMe SSD存储来提供服务器租用和服务器托管解决方案。本文将指导您了解为游戏数据库选择高性能NVMe
    的头像 发表于 09-30 16:03 1269次阅读

    Ceph分布式存储系统解析

    在当今数据爆炸的时代,企业对存储系统的需求日益增长,传统的集中式存储已经无法满足大规模数据处理的要求。分布式存储系统应运而生,而Ceph作为开源分布式存储系统的佼佼者,以其高可用性、高
    的头像 发表于 07-14 11:15 1352次阅读

    NVMe IP高速传输却不依赖便利的XDMA设计之三:系统架构

    吞吐量不低于2GB/s, 随机写IOPS不低于500000, 随机写延迟不高于1ms。 (3) 易集成、 易操作 实现NVMe 主机控制逻辑和 NVMe 固态硬盘作为存储
    发表于 06-29 17:42

    NVMe协议研究扫盲

    SSD优势 与机械硬盘(Hard Disk Driver, HDD)相比,基于Flash的SSD具有更快的数据随机访问速度、更快的传输速率和更低的功耗优势,已经被广泛应用于各种计算领域和存储系统
    发表于 06-02 23:28