0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

企业级SSD系统中如何用Device self-test命令?

VIBT_dputech 来源:大普微 作者:大普微 2021-03-28 11:14 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

写在DST之前

企业级SSD系统在日益变得复杂,有增强掉电保护的备电电容,有使用频率越来越高的DRAM,有堆叠层数越来越高的NAND, NAND结构的复杂对固件的要求也相应的变高,如存储单元里的数据一段时间不读会导致之后可能读不出来或者出现很多的bit翻转等等。而备电电容有老化的风险以及在不同的温度环境下会影响电容的可靠性;DRAM使用不当易出现ECC,甚至是UNC,影响盘的可靠性;NAND的上的冷数据如果不经常性的去读取就可能存在数据丢失的风险。

像服务器上电自检一样,SSD在上电过程中也会做电容,DRAM等自检操作。但是一般盘上电使用之后就极少会下电,所以为了能让HOST能实时的获取盘内部部件的情况,NVMe协议提供了一个标准的命令Device self-test来主动触发盘的部件检测,可以快速的发现盘是哪个部件出现了问题,可以相应的做出反应,保障用户数据的安全。

Device self-test

NVMe命令device self-test是一个管理类命令,定义了一个操作序列。具体内容如下:

11bf29ee-8eb9-11eb-8b86-12bb97331649.png

如上图所示:每个序列都规定了相应的操作,有些操作是针对controller层级,有些操作是NVM层级。Controller层级的主要是用于测试SSD的功能是否还正常,比如电容容值检查,如果容值变低,则会影响SSD的掉电时间。

1、Device self-test命令在Command DW 10字段中定义了诊断的操作类型,而所有其他命令指定的字段都要保留。

121e3fa6-8eb9-11eb-8b86-12bb97331649.png

如上图所示,目前支持的操作类型有4种,

开始一个短诊断操作;

1、短诊断的完成时间不能大于2min。

2、开始一个长诊断操作;

长诊断的完成时间由Identify Controller的字段EDSTT定义,单位是分钟。

E、开始一个厂商自定义操作;

F、中断一个诊断操作;

2、中断一个自检命令的操作有:

1、Controller reset

2、NVMe Format Command

3、一个STC为F的Device self-test命令

4、一个删除对应的ns的操作

5、Sanitize命令

3、触发自检命令之后,FW会按照相应的序列顺序执行,命令运行的情况在device self-test log中显示,这个log可通过get log page命令的LID=6来获取。

1、Current Device Self-Test Operation 表示当前的诊断操作类型

2、Current Device Self-Test Completion 表示当前的诊断操作进度

3、Self-test Result Data Structure 总共有20条记录,记录了历史的自检结果,主要关注两个点:

* Device Self-test Status:这里显示了自检的结果,成功或者失败。

* Segment Number:这里显示了失败在哪个序列操作.

DRAM Check

*由于DRAM用作用户数据的缓存,以及存放了部分代码和重要的数据,所以如果对这部分DRAM区域做读写校验的话,会直接导致数据的丢失或者固件exception。

*由于DRAM在打开ECC校验的情况下,如果出现未写先读的情况,会使得DRAM出现UNC.

基于以上两点,对于DRAM Check,固件主要要做的事情有两个:

1、对于无法做读写校验(即只读)的区域,FW需要保证该区域已经写过数据,所以可以直接去读该区域。如果出现UNC,则固件存在bug,会危及盘的正常使用。

2、对于用作堆区域的DRAM空间,可以申请出来做读写校验。除了校验数据的正确性,还需要关注DRAM是否出现ECC,如若出现ECC,则可能会危及盘的正常使用。

Volatile Memory Backup

我们常用的数据缓存介质DRAM是易失性存储介质,在设备掉电之后DRAM中的数据都会丢失。但是DRAM的数据传输速率高,为了性能考虑,其存在又是必须的。

1、缓存用户数据,加速命令的执行,减少QOS.

2、缓存了设备的元数据,加速了元数据的修改。

所以为了解决设备掉电之后缓存数据丢失的问题,设备需要增加备电电容以供在掉电时保证缓存数据存入flash。但是电容存在一定的失效率,失效的原因可能如下:

1、电容出厂时个体的差异导致能承受的电压阈值偏低;

2、随着时间的推移,电容会存在漏液现象导致容值降低。

软件需要在设备上电或者运行过程中对电容进行定时检测,以防止电容失效或者电容容值下降不足以保证设备刷新缓存数据所需时间导致数据丢失,但是电容的检测又不能太频繁。否则一是会影响电容的使用寿命,二是如果在电容放电的过程中盘掉电了,会影响盘的掉电时间。

所以Host使用device self-test命令来检查电容的容值是必需的,尤其是在接近盘的生命末期的时候,但是又不能太频繁。

Metadata validation

在SSD的所有写入数据中,存在一些频繁更新的数据和一些很久都不会更新的数据,如果那些很久都不会更新的数据量大的话,那么也会导致对应的元数据很久得不到更新。所以为了解决这个问题,在device self-test命令的元数据检查序列里,FW会去对元数据做读校验,确认元数据的完整性。

1、确保元数据还能从NAND读出来,不会出现UNC;

2、对读出来的数据做check,保证数据的正确性。

结尾

限于篇幅以及对协议的理解不同,各个厂商对其他的device self-test序列所做的事情存在区别,所以这里不再赘述。只介绍了对以上3个序列的个人理解。

原文标题:日益复杂的企业级SSD系统,如何做Device self-test?

文章出处:【微信公众号:大普微】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 电容
    +关注

    关注

    100

    文章

    6442

    浏览量

    158063
  • SSD
    SSD
    +关注

    关注

    21

    文章

    3061

    浏览量

    121818

原文标题:日益复杂的企业级SSD系统,如何做Device self-test?

文章出处:【微信号:dputech,微信公众号:DapuStor】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    国内企业级SSD厂商加速崛起

    ,2029年中国企业级固态硬盘市场规模将达到91亿美元。 从2024年中国企业级SSD主要厂商的市场份额来看,Solidigm和三星领衔中国企业级固态硬盘市场。其次是忆联、忆恒创源、大
    的头像 发表于 06-09 07:54 1.2w次阅读
    国内<b class='flag-5'>企业级</b><b class='flag-5'>SSD</b>厂商加速崛起

    Xilinx高性能NVMe Host控制器IP+PCIe 3.0软核控制器IP,纯逻辑实现,AXI4和AXI4-Stream DMA接口,支持PCIe 3.0和4.0

    命令接口,实现对PCIe SSD的复位/断电/SMART/Error Information/Device Self-test管理功能Ø提供1个IO
    发表于 11-14 22:40

    德明利企业级SSD与OpenCloudOS、腾讯云完成技术兼容互认证

    德明利TS3160系列企业级SATA SSD产品与OpenCloudOS、腾讯云相互兼容认证
    的头像 发表于 10-17 15:48 361次阅读
    德明利<b class='flag-5'>企业级</b><b class='flag-5'>SSD</b>与OpenCloudOS、腾讯云完成技术兼容互认证

    容量可达245.76TB,铠侠企业级与数据中心SSD迎来全面升级

    吞吐的表现,对于企业以更低成本部署AI训练、推理和应用落地无疑是更好的选择。在近期,铠侠正式发布了LC9系列、CM9系列以及CD9P系列企业级与数据中心SSD,全
    的头像 发表于 09-10 08:36 933次阅读
    容量可达245.76TB,铠侠<b class='flag-5'>企业级</b>与数据中心<b class='flag-5'>级</b><b class='flag-5'>SSD</b>迎来全面升级

    容量可达245.76TB,铠侠企业级与数据中心SSD迎来全面升级

    铠侠正式发布了LC9系列、CM9系列以及CD9P系列企业级与数据中心SSD,全新的系列可更好的满足AI计算存储需求,并适用于云端应用、在线交易和虚拟化等多种应用场景。
    的头像 发表于 09-02 10:33 1876次阅读
    容量可达245.76TB,铠侠<b class='flag-5'>企业级</b>与数据中心<b class='flag-5'>级</b><b class='flag-5'>SSD</b>迎来全面升级

    永不掉线的守护:永铭钽电容赋予“企业级固态硬盘”可靠护航者使命

    企业级固态硬盘面临的考验SSD数据洪流时代,企业级固态硬盘面临哪些生死考验?在数字化浪潮企业级固态硬盘如同数据中心的"数字粮仓",承载着
    的头像 发表于 09-01 09:57 283次阅读
    永不掉线的守护:永铭钽电容赋予“<b class='flag-5'>企业级</b>固态硬盘”可靠护航者使命

    为什么相比于企业级SSD,更该选天硕工业SSD

    在极端工业环境,温度的剧烈变化、强烈的振动冲击以及复杂的电磁干扰等,都对存储设备构成严峻考验。天硕工业 SSD 固态硬盘的 G55 Pro M.2 NVMe
    的头像 发表于 07-23 17:59 582次阅读

    企业级Linux磁盘维护的完整流程

    企业级Linux环境,磁盘故障是导致系统宕机和数据丢失的主要原因之一。据统计,超过70%的企业级服务器故障与存储系统相关。作为运维工程师
    的头像 发表于 07-23 16:59 629次阅读

    企业级智能体是什么?有什么作用?

    企业级智能体是基于人工智能技术构建的数字化员工系统,其核心在于将机器学习、自然语言处理、知识图谱等AI技术与具体业务场景深度融合。不同于传统的自动化工具,企业级智能体具备三大核心特征: 1. 认知决策能力:通过深度学
    的头像 发表于 07-21 15:44 591次阅读
    <b class='flag-5'>企业级</b>智能体是什么?有什么作用?

    企业级SSD的核心技术与市场趋势

    。   企业级SSD的核心部件示意图   主控芯片(控制大脑) 控制数据读写,直接决定SSD 的性能、可靠性固件(操作系统) 确保SSD高效
    的头像 发表于 07-06 05:34 6566次阅读
    <b class='flag-5'>企业级</b><b class='flag-5'>SSD</b>的核心技术与市场趋势

    国内排名第四,这家企业级SSD厂商创业板IPO!

    电子发烧友网综合报道,近日,深圳大普微电子股份有限公司(简称“大普微”)创业板IPO获得受理,公司拟首发募资18.78亿元。 大普微主要从事数据中心企业级SSD产品的研发和销售,是业内领先、国内
    发表于 07-04 09:09 2944次阅读
    国内排名第四,这家<b class='flag-5'>企业级</b><b class='flag-5'>SSD</b>厂商创业板IPO!

    ​紫光闪芯新一代企业级SATA SSD E1200产品系列发布

    2025 年 6 月 25 日,紫光闪芯正式发布新一代面向企业级市场的SATA SSD E1200产品系列,凭借性能显著跃升与企业级高可靠性设计,为数据中心、云计算、边缘计算等场景的高性能存储需求
    的头像 发表于 06-26 16:57 654次阅读

    谁说高性能必须高能耗?揭秘企业级SSD功耗管理“黑科技”

    数据中心高密度计算场景下,企业级SSD功耗管理成为优化TCO(总体拥有成本)的关键切入点。采用具备高能效设计、先进散热方案与智能管理的企业级SSD,能有效降低电力及运维支出,通过减少能
    的头像 发表于 04-22 17:19 547次阅读
    谁说高性能必须高能耗?揭秘<b class='flag-5'>企业级</b><b class='flag-5'>SSD</b>功耗管理“黑科技”

    产品力获认可,佰维存储企业级SSD通过联想服务器兼容性互认证

    近日,佰维存储SP406/416系列企业级PCIe 4.0 SSD、SS621系列企业级SATA SSD,与联想服务器完成相互兼容性测试并取得认证。测试期间,产品在功能适配、性能及
    的头像 发表于 02-14 09:08 1632次阅读

    慧荣科技企业级主控芯片SM8366为企业级SSD存储芯片注入新动力

    慧荣科技凭借其深厚的技术积累和创新精神,推出了企业级主控芯片SM8366,这一举动无疑为企业级SSD存储芯片市场注入了新的活力,慧荣科技此次推出的企业级主控芯片SM8366,在性能提升
    的头像 发表于 02-07 13:28 994次阅读
    慧荣科技<b class='flag-5'>企业级</b>主控芯片SM8366为<b class='flag-5'>企业级</b><b class='flag-5'>SSD</b>存储芯片注入新动力