0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

平头哥镇岳510如何提升SSD响应速度

平头哥半导体 来源:平头哥半导体 2025-01-21 14:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

编者按:数字经济时代,随着数据中心规模的不断扩大和数据量的爆发式增长,存储技术的重要性日益显著,‌直接关系到数据中心的运行性能、效率和安全可靠。‌基于平头哥在存储主控芯片领域的创新实践,策划推出存储技术专栏系列——【存储技谈】,共同探讨存储发展趋势。

在上一篇存储技谈中,我们重点阐述了平头哥技术团队通过软硬件的合理分工和流程优化等创新,在镇岳510存储主控芯片上实现了4μs的超低4K IO Write Latency,而在SSD(固态硬盘)主控芯片中,还有一个关于时延的重要性能指标是E2E(End-to-End,端到端)时延,也能直接影响到SSD的响应速度。

E2E时延统计一般用于测量数据从应用程序发送请求,经过SSD的处理,直到数据最终返回给应用程序所需的时间。这一过程涉及多个阶段,包括命令的接收、数据的读取/写入、以及结果的返回等,直接反映了用户应用在与存储设备交互时所经历的实际延迟,帮助开发者和用户直观了解SSD在实际应用中的表现。

不同阶段的时延统计,能很好的帮助定位系统QoS时延问题,从而进行针对性优化提升。从主机Host抓取E2E时延,可以界定主机侧发现的长尾时延是否在盘内产生。从SSD盘内抓取E2E在IO处理路径不同阶段的分解时延,可以辅助性能调优进行问题定位。E2E时延统计是SSD开发必不可少的一项功能。

01传统E2E时延统计造成额外开销和测量误差

传统方案中,E2E时延统计往往依赖于固件中的软件实现。

当一个I/O命令被提交给SSD时,控制器会记录一个时间戳;随后,在各个处理阶段,如命令解析、地址映射、实际读写操作等,可能会再次记录时间戳以跟踪进度,以计算各个分段时延;最后,当命令完成并发送CQE(Completion Queue Entry)回主机时,再进行总时延的计算。

这种统计方法不仅增加了额外的软件开销,并可能导致一定的测量误差。软件进行时间戳抓取与硬件数据处理并不同步,如果硬件的数据处理和控制信息状态更新异步,软件统计的I/O命令完成时间就会存在较大误差。

02基于硬件辅助的E2E时延统计更精准高效

为了更精确且高效地进行E2E时延统计,平头哥技术团队在镇岳510主控芯片的设计中,引入了硬件级别支持来提升效能,也即利用专用硬件模块来自动捕获和管理时间戳,从而避免了软件干预带来的额外延迟和资源消耗。

具体的系统方案包括以下四个步骤:

时间戳捕捉:

硬件可以在接收到来自主机的SQE(Submission Queue Entry)时立即记录时间戳,并在最终将CQE送回主机之前再次记录时间戳。

全局时间同步:

确保所有内部处理单元使用同一基准时间源,以便能够准确地比较不同阶段的时间差。

分段时延测量:

除了整体E2E时延外,还可以针对SSD内部的不同处理步骤(例如前端命令解析、FTL映射查询、BE后端命令执行等)硬件支持单独进行时延统计,帮助识别性能瓶颈。

异常检测与报告:

如果某个I/O命令的处理超过了预设的时延阈值,硬件可以触发报警机制,将相关信息传递给固件进行进一步分析。

b5b5afb2-d7be-11ef-9310-92fbcf53809c.png

平头哥镇岳510时延统计方案示意图

通过如上的硬件辅助方法,不仅可以获得更加精确的E2E时延统计数据,还能有效减少因频繁时间戳记录而造成的系统负担,同时提供足够的灵活性用于后续的数据分析和性能调优,在精确性和时效性上实现了双重提升。

03精准的E2E时延统计可发挥重要价值

E2E时延统计的精确性和时效性,不仅影响着应用程序的响应速度,还可能对整体系统吞吐量产生重大影响。

云计算环境中,大量用户同时访问存储资源,E2E时延统计可以帮助监测数据传输的效率,对于平衡负载和保证响应时间至关重要;在科学计算或模拟等高性能计算应用中,E2E时延统计能够确保数据交换的高效性,减少计算等待时间,从而加速整体计算效率;而在金融交易、视频流处理和在线游戏等实时数据分析和处理的场景中,实时监测E2E时延有助于确保系统的高可用性和快速响应。

随着应用场景的不断扩展,通过优化SSD主控产品中的E2E时延统计,能够显著提升性能,同时,基于这些数据的深入分析与应用也可以为终端用户带来更优质的体验。因此,关注和优化E2E时延统计不仅是提升系统性能的必要举措,也是增强用户体验的重要手段。

平头哥镇岳510通过创新的E2E时延统计方案,有效地提升了SSD在实际应用中的响应速度和性能表现,从而为云计算、数据库、人工智能等场景提供领先的存储服务支持。

更多技术亮点和创新方案,后续我们将持续展开阐释,敬请关注。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储技术
    +关注

    关注

    6

    文章

    764

    浏览量

    46949
  • SSD
    SSD
    +关注

    关注

    21

    文章

    3061

    浏览量

    121803
  • 固态硬盘
    +关注

    关注

    12

    文章

    1607

    浏览量

    60116
  • 平头哥
    +关注

    关注

    0

    文章

    73

    浏览量

    10004

原文标题:【存储技谈】提升SSD响应速度:硬件辅助实现E2E时延统计的精准高效

文章出处:【微信号:gh_65bdec3412bd,微信公众号:平头哥半导体】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    平头510芯片的QoS技术解析

    针对上述需求,平头存储技术团队凭借深度软硬件协同设计,通过IOPS一致性、带宽分配、时延控制三个核心技术构建了全场景的QoS保障体系,为金融交易、视频流媒体、AI训练等关键业务提供"性能零波动"的存储体验。
    的头像 发表于 04-29 09:16 2873次阅读
    <b class='flag-5'>平头</b><b class='flag-5'>哥</b><b class='flag-5'>镇</b><b class='flag-5'>岳</b><b class='flag-5'>510</b>芯片的QoS技术解析

    悄然席卷企业级SSD市场的RISC-V主控

    在一些细分市场,RISC-V也已经开始崭露头角,比如服务器领域的CPU芯片,以及企业级SSD的主控。   平头   在2023云栖大会上,阿里巴巴平头
    的头像 发表于 11-16 00:22 3303次阅读
    悄然席卷企业级<b class='flag-5'>SSD</b>市场的RISC-V主控

    自研LDPC算法,揭秘510 Errorfloor降低一个数量级的技术密码

    电子发烧友网报道(文/黄山明)日前,在深圳MemoryS 2025存储峰会上,据平头半导体产品总监周冠锋介绍,510已在阿里云的EBS
    的头像 发表于 03-17 01:07 1894次阅读
    自研LDPC算法,揭秘<b class='flag-5'>镇</b><b class='flag-5'>岳</b><b class='flag-5'>510</b> Errorfloor降低一个数量级的技术密码

    华为DATS路面感知响应速度提升100倍

    华为动态自适应扭矩系统(DATS)识别颠簸路面动态,智能调整扭矩,大幅提升通过平顺性。路面感知响应速度提升100倍。
    的头像 发表于 09-06 16:21 3800次阅读
    华为DATS路面感知<b class='flag-5'>响应速度</b><b class='flag-5'>提升</b>100倍

    平头首颗SSD主控芯片510问世,将率先在阿里云数据中心部署

    11月1日,在2023云栖大会上,阿里巴巴平头发布旗下首颗SSD主控芯片510,该芯片为云
    的头像 发表于 11-01 16:50 1095次阅读

    2023云栖大会亮点:平头首颗SSD主控芯片RISC-V架构的510亮相

    2023云栖大会亮点:平头首颗SSD主控芯片510亮相 2023云栖大会昨天开幕,阿里巴巴
    的头像 发表于 11-01 17:20 1704次阅读
    2023云栖大会亮点:<b class='flag-5'>平头</b><b class='flag-5'>哥</b>首颗<b class='flag-5'>SSD</b>主控芯片RISC-V架构的<b class='flag-5'>镇</b><b class='flag-5'>岳</b><b class='flag-5'>510</b>亮相

    阿里平头发布首颗SSD主控芯片:510

    510芯片使用pcie 5.0x4接口、nvme1.4b规格、zns接口协议、16个高速nand通道,支持大容量、高带宽。支持1xxl/2xxl tlc/qlc nand闪存。最大带宽为3400 k iops,最大14gby
    的头像 发表于 11-02 09:55 1802次阅读

    平头发布专为云计算的首颗SSD主控芯片510

    510是为云计算场景进行深度定制的芯片。它通过与云存储软件系统的协同作用,有效地减少数据读写延迟,实现4μs超低时延和10^-18的误码率。
    的头像 发表于 11-02 16:59 2210次阅读

    阿里平头发布“510”入局存力领域芯片

    510”是专为云计算场景所设计的,它将芯片和云存储软件系统融合在一起,以有效降低数据读写的延迟。通过这种协作,它可以实现4微秒的超低时延并保持10的负18次方的误码率。这款芯片将首先在阿里云数据中心进行部署,适用于人工智能
    的头像 发表于 11-03 15:13 1524次阅读
    阿里<b class='flag-5'>平头</b><b class='flag-5'>哥</b>发布“<b class='flag-5'>镇</b><b class='flag-5'>岳</b><b class='flag-5'>510</b>”入局存力领域芯片

    平头发布首颗PCle5.0 SSD主控芯片510!4μs超低时、误码率领先行业标杆一个数量级!

    从第一款当时全球性能最强的AI专用芯片含光800,到高性能RISC-V架构处理器玄铁910,再到首款CPU芯片倚天710,平头在给自家产品的取名上,就偏爱用中国上古和武侠中的“神兵利剑”来命名。而这次的
    的头像 发表于 11-03 16:27 2465次阅读
    <b class='flag-5'>平头</b><b class='flag-5'>哥</b>发布首颗PCle5.0 <b class='flag-5'>SSD</b>主控芯片<b class='flag-5'>镇</b><b class='flag-5'>岳</b><b class='flag-5'>510</b>!4μs超低时、误码率领先行业标杆一个数量级!

    平头SSD主控芯片510性能分析

    510芯片还针对云计算场景进行了深度优化,芯片与云存储软件系统紧密融合协作,有效降低数据读写的延时,为系统带来了更高的性能。例如,
    发表于 11-22 11:36 1909次阅读
    <b class='flag-5'>平头</b><b class='flag-5'>哥</b><b class='flag-5'>SSD</b>主控芯片<b class='flag-5'>镇</b><b class='flag-5'>岳</b><b class='flag-5'>510</b>性能分析

    平头半导体携510亮相2023中国数据与存储峰会

    11月29日,2023中国数据与存储峰会(DataStorage Summit 2023)在北京举行。平头半导体携全新发布的企业级SSD主控芯片
    的头像 发表于 11-30 14:15 1114次阅读
    <b class='flag-5'>平头</b><b class='flag-5'>哥</b>半导体携<b class='flag-5'>镇</b><b class='flag-5'>岳</b><b class='flag-5'>510</b>亮相2023中国数据与存储峰会

    DOIT传媒对话平头:突破SSD主控芯片,触发新一轮市场冲击波

    转载自DOIT传媒 在2023云栖大会上,阿里巴巴旗下平头半导体发布首颗SSD主控芯片-510
    的头像 发表于 12-14 16:20 1705次阅读
    DOIT传媒对话<b class='flag-5'>平头</b><b class='flag-5'>哥</b>:突破<b class='flag-5'>SSD</b>主控芯片,触发新一轮市场冲击波

    如何提升 ChatGPT 的响应速度

    提升 ChatGPT 的响应速度是一个涉及多个层面的复杂问题。以下是一些可能的方法和策略,可以帮助提高 ChatGPT 的响应速度: 优化算法 : 并行处理 :通过并行处理技术,可以让多个计算任务
    的头像 发表于 10-25 17:39 2170次阅读

    平头半导体荣获“中国芯”优秀技术创新产品奖

    近日,由中国电子信息产业发展研究院主办的2024中国微电子产业促进大会暨第十九届“中国芯”优秀产品征集结果发布仪式在珠海横琴举办。平头半导体旗下企业级SSD主控芯片--
    的头像 发表于 11-08 16:55 1592次阅读