编者按:数字经济时代,随着数据中心规模的不断扩大和数据量的爆发式增长,存储技术的重要性日益显著,直接关系到数据中心的运行性能、效率和安全可靠。基于平头哥在存储主控芯片领域的创新实践,策划推出存储技术专栏系列——【存储技谈】,共同探讨存储发展趋势。
在数字化转型加速的今天,数据量呈几何级增长,对数据的处理速度和安全性提出了更高的要求,这使得企业级存储设备正面临前所未有的挑战。从云数据中心的多租户资源隔离,到边缘计算场景的实时响应需求,SSD的QoS(Quality of Service,服务质量)能力已成为决定时延敏感型业务稳定性和资源利用率的关键技术指标。
随着SSD容量提升和全闪存阵列的普及,单一存储设备需同时承载多种业务负载(如数据库、虚拟化、大数据分析等),资源竞争成为常态。良好的QoS设计,可以通过动态分配带宽、控制时延,并进行优先级调度,确保业务获得稳定、可预测的存储性能;还可以避免低优先级任务占用过多资源导致关键业务的性能波动。例如,在云服务场景中,可隔离不同租户的IO请求,防止“邻居干扰”问题;在AI训练场景中,突发IO流量和边缘计算的低时延要求,也需要通过QoS技术提供动态资源保障。
值得注意的是,不同场景对Qos的诉求各具特色。例如,MySQL场景中,IOPS的一致性很敏感;视频类的流媒体中,对读写带宽的预留需求很高;而在高频实时交易中,对时延百分位要求很高。
针对上述需求,平头哥存储技术团队凭借深度软硬件协同设计,通过IOPS一致性、带宽分配、时延控制三个核心技术构建了全场景的QoS保障体系,为金融交易、视频流媒体、AI训练等关键业务提供"性能零波动"的存储体验。
IOPS一致性:为波动流量装上平滑滤波器
在数据库事务处理、实时数据分析等场景中,业务流量的瞬时波动可能导致IOPS剧烈震荡。当业务本身下发的流量存在波动时,如果SSD一味的及时响应就会导致业务感知到IOPS的波动,因此我们需要对业务发出的IOPS请求进行滤波处理,可以使I/O操作按照规定频率执行,再反馈给业务层,从而减少业务对IOPS波动的感知。
镇岳510创新性地采用基于命令粒度的IOPS流控。所谓“基于命令粒度”,指的是根据每个单独I/O命令的特点—包括其类型(如读、写)、优先级及实时性要求—来进行IOPS的调控。通过精确地控制前端IO下发的间隔,让每个IO平滑地下发给固件处理,再返回给业务,硬件控制的优势是可以将精度控制在1%以内。这项技术如同为SSD装上了智能节拍器,让IO请求以恒定频率流转,即使面对突发流量冲击,业务端也能感知到平滑稳定的I/O响应。
在虚拟化环境中,镇岳510还实现了多虚拟设备独立IOPS流控的支持,不同租户的虚拟机可配置差异化IOPS上限,彻底杜绝"邻居干扰"现象,给业务带来稳定的IOPS体验。

带宽弹性分配:让每比特流量找到最优路径
在视频类的流媒体的业务中,业务需要大量稳定的读带宽以及小部分稳定的写带宽。但在日志备份的业务中则正好相反,需要大量稳定的写带宽以及小部分稳定的读带宽。如果读写带宽没有一个稳定的分配机制,就无法满足业务的需求。
镇岳510拥有一套灵活的带宽控制机制,可以分别独立控制读写总带宽、读带宽、写带宽,实现读写带宽按需分配互不干扰。
考虑到IO流量可能会来自不同的业务,不同业务对IO流量的诉求是不同的,镇岳510在读写带宽的控制通路上继续细分了多组不同需求的带宽控制,便于业务的灵活配置。

镇岳510带宽分配流程图
时延百分位:将微秒级优化做到极致
在高频交易、云游戏等时延敏感的业务中,细微的时延波动会被放大,最终会体现在交易的迟缓,游戏画面的卡顿。存储业界使用百分位时延指标来衡量一款SSD所提供的存储服务的质量,也即QoS。
镇岳510芯片内部通过对命令通路的全链路优化,构建了前端、中端和后端三级时延控制体系:
1前端:IO调度与优先级隔离
增加overlap功能,使读写IO可以单独处理,避免因LBA地址重叠导致IO队列串行排队,减少IO等待时延。与此同时,镇岳510芯片还对IO做了多重优先级的区分,确保时延敏感的高优先级IO得到优先处理,保证其时延的稳定。为写IO增加大容量高速缓冲,杜绝IO访问普通DDR带来的时延。
2中端:硬件加速与固件优化
增加自研的硬件辅助固件的加速功能,比如读改表的操作、最优读电压的选择等等,这些硬件加速模块可以将IO命令的处理开销掩藏在IO传输过程中,从而降低固件操作导致的时延开销。同时也允许固件根据业务的特点进行灵活的数据排布,实现读、写IO的效率优化。
3后端:Loop消除与时延监测
镇岳510芯片强大的LDPC引擎,通过独创的Loop消除技术,不仅可以将Error Floor降低一个数量级,亦可大幅减少译码迭代次数,最大限度的译码一次成功,降低了译码时延。而数据通路上的Cut-through快速数据通路,可以减少一次数据搬移,直接将NAND中的数据搬移到主机内存;此外,镇岳510芯片支持灵活的suspend算法,针对不同的业务模型,配置最优的suspend参数,最大化的降低读写擦冲突所引入的IO时延。
更值得一提的是,镇岳510技术团队自创的HW-Acc Latency Statistics技术,可实时监测每个IO节点的时延分布,且完全不增加运行时开销。这项技术如同给SSD安装了"性能CT机",帮助SSD开发者以及存储系统的运维人员,精准定位性能、时延瓶颈所在,优化系统及固件,真正做到实时问题,实时定位。

镇岳510QoS技术总图
从金融核心交易系统的毫秒级响应,到视频直播平台的带宽动态调度,再到云原生环境的多租户隔离,平头哥镇岳510通过QoS技术矩阵重新定义了企业级存储的价值标准。通过可配置的QoS策略模板,让SSD开发者能够像调节水龙头一样灵活控制存储资源,真正做到了对业务场景的完美适配。
-
芯片
+关注
关注
462文章
53565浏览量
459373 -
存储技术
+关注
关注
6文章
764浏览量
46950 -
SSD
+关注
关注
21文章
3061浏览量
121809 -
IOPs
+关注
关注
0文章
12浏览量
14450
原文标题:【存储技谈】“三位一体”构建镇岳全场景QoS保障体系
文章出处:【微信号:gh_65bdec3412bd,微信公众号:平头哥半导体】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
自研LDPC算法,揭秘镇岳510 Errorfloor降低一个数量级的技术密码
阿里的量子芯片竟然比“平头哥”更受关注?
平头哥的“量子芯片”即将问世
平头哥专用SoC芯片研发提上日程
平头哥首颗SSD主控芯片镇岳510问世,将率先在阿里云数据中心部署
阿里平头哥发布首颗SSD主控芯片:镇岳510
平头哥发布专为云计算的首颗SSD主控芯片镇岳510
阿里平头哥发布“镇岳510”入局存力领域芯片
平头哥发布首颗PCle5.0 SSD主控芯片镇岳510!4μs超低时、误码率领先行业标杆一个数量级!
平头哥SSD主控芯片镇岳510性能分析
平头哥半导体携镇岳510亮相2023中国数据与存储峰会
平头哥半导体荣获“中国芯”优秀技术创新产品奖
平头哥镇岳510如何提升SSD响应速度

平头哥镇岳510芯片的QoS技术解析
评论