编者按:数字经济时代,随着数据中心规模的不断扩大和数据量的爆发式增长,存储技术的重要性日益显著,直接关系到数据中心的运行性能、效率和安全可靠。基于平头哥在存储主控芯片领域的创新实践,策划推出存储技术专栏系列——【存储技谈】,共同探讨存储发展趋势。
在上一篇存储技谈中,我们重点阐述了平头哥技术团队通过软硬件的合理分工和流程优化等创新,在镇岳510存储主控芯片上实现了4μs的超低4K IO Write Latency,而在SSD(固态硬盘)主控芯片中,还有一个关于时延的重要性能指标是E2E(End-to-End,端到端)时延,也能直接影响到SSD的响应速度。
E2E时延统计一般用于测量数据从应用程序发送请求,经过SSD的处理,直到数据最终返回给应用程序所需的时间。这一过程涉及多个阶段,包括命令的接收、数据的读取/写入、以及结果的返回等,直接反映了用户应用在与存储设备交互时所经历的实际延迟,帮助开发者和用户直观了解SSD在实际应用中的表现。
不同阶段的时延统计,能很好的帮助定位系统QoS时延问题,从而进行针对性优化提升。从主机Host抓取E2E时延,可以界定主机侧发现的长尾时延是否在盘内产生。从SSD盘内抓取E2E在IO处理路径不同阶段的分解时延,可以辅助性能调优进行问题定位。E2E时延统计是SSD开发必不可少的一项功能。
01传统E2E时延统计造成额外开销和测量误差
传统方案中,E2E时延统计往往依赖于固件中的软件实现。
当一个I/O命令被提交给SSD时,控制器会记录一个时间戳;随后,在各个处理阶段,如命令解析、地址映射、实际读写操作等,可能会再次记录时间戳以跟踪进度,以计算各个分段时延;最后,当命令完成并发送CQE(Completion Queue Entry)回主机时,再进行总时延的计算。
这种统计方法不仅增加了额外的软件开销,并可能导致一定的测量误差。软件进行时间戳抓取与硬件数据处理并不同步,如果硬件的数据处理和控制信息状态更新异步,软件统计的I/O命令完成时间就会存在较大误差。
02基于硬件辅助的E2E时延统计更精准高效
为了更精确且高效地进行E2E时延统计,平头哥技术团队在镇岳510主控芯片的设计中,引入了硬件级别支持来提升效能,也即利用专用硬件模块来自动捕获和管理时间戳,从而避免了软件干预带来的额外延迟和资源消耗。
具体的系统方案包括以下四个步骤:
时间戳捕捉:
硬件可以在接收到来自主机的SQE(Submission Queue Entry)时立即记录时间戳,并在最终将CQE送回主机之前再次记录时间戳。
全局时间同步:
确保所有内部处理单元使用同一基准时间源,以便能够准确地比较不同阶段的时间差。
分段时延测量:
除了整体E2E时延外,还可以针对SSD内部的不同处理步骤(例如前端命令解析、FTL映射查询、BE后端命令执行等)硬件支持单独进行时延统计,帮助识别性能瓶颈。
异常检测与报告:
如果某个I/O命令的处理超过了预设的时延阈值,硬件可以触发报警机制,将相关信息传递给固件进行进一步分析。

平头哥镇岳510时延统计方案示意图
通过如上的硬件辅助方法,不仅可以获得更加精确的E2E时延统计数据,还能有效减少因频繁时间戳记录而造成的系统负担,同时提供足够的灵活性用于后续的数据分析和性能调优,在精确性和时效性上实现了双重提升。
03精准的E2E时延统计可发挥重要价值
E2E时延统计的精确性和时效性,不仅影响着应用程序的响应速度,还可能对整体系统吞吐量产生重大影响。
在云计算环境中,大量用户同时访问存储资源,E2E时延统计可以帮助监测数据传输的效率,对于平衡负载和保证响应时间至关重要;在科学计算或模拟等高性能计算应用中,E2E时延统计能够确保数据交换的高效性,减少计算等待时间,从而加速整体计算效率;而在金融交易、视频流处理和在线游戏等实时数据分析和处理的场景中,实时监测E2E时延有助于确保系统的高可用性和快速响应。
随着应用场景的不断扩展,通过优化SSD主控产品中的E2E时延统计,能够显著提升性能,同时,基于这些数据的深入分析与应用也可以为终端用户带来更优质的体验。因此,关注和优化E2E时延统计不仅是提升系统性能的必要举措,也是增强用户体验的重要手段。
平头哥镇岳510通过创新的E2E时延统计方案,有效地提升了SSD在实际应用中的响应速度和性能表现,从而为云计算、数据库、人工智能等场景提供领先的存储服务支持。
更多技术亮点和创新方案,后续我们将持续展开阐释,敬请关注。
-
存储技术
+关注
关注
6文章
764浏览量
46949 -
SSD
+关注
关注
21文章
3061浏览量
121803 -
固态硬盘
+关注
关注
12文章
1607浏览量
60116 -
平头哥
+关注
关注
0文章
73浏览量
10004
原文标题:【存储技谈】提升SSD响应速度:硬件辅助实现E2E时延统计的精准高效
文章出处:【微信号:gh_65bdec3412bd,微信公众号:平头哥半导体】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
平头哥镇岳510芯片的QoS技术解析
自研LDPC算法,揭秘镇岳510 Errorfloor降低一个数量级的技术密码
平头哥首颗SSD主控芯片镇岳510问世,将率先在阿里云数据中心部署
阿里平头哥发布首颗SSD主控芯片:镇岳510
平头哥发布专为云计算的首颗SSD主控芯片镇岳510
阿里平头哥发布“镇岳510”入局存力领域芯片
平头哥发布首颗PCle5.0 SSD主控芯片镇岳510!4μs超低时、误码率领先行业标杆一个数量级!
平头哥SSD主控芯片镇岳510性能分析
平头哥半导体携镇岳510亮相2023中国数据与存储峰会

平头哥镇岳510如何提升SSD响应速度
评论