0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何更加高效的提升存储系统性能?

浪潮存储 来源:浪潮存储 2020-06-13 11:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着智慧化转型的不断加速

数据被越来越多的应用于营销、决策和分析

快速响应能力已经成为企业的决胜因素

数据存储性能是业务加速的关键核心

如何更加高效的提升存储系统性能?

浪潮存储在新一代G5存储平台上,打造【iTurbo智能引擎】硬核技术,构建起一套如汽车自动变速引擎的黑科技,让存储系统可以根据前端应用自适应和调配不同数据处理策略,实现智能的IO感知、路径选择、组织和调度,为存储带来创新的加速方案。

今天就让我们一起探秘

【iTurbo智能引擎】的核心技术之一

智能IO感知技术

智能缓存预读

实现“热”升“冷”降的数据电梯

介绍缓存预读之前,我们首先要搞清楚关于缓存的两个基本问题:

一:为什么要用缓存?

二:缓存是如何工作的?

为什么要用缓存?

大家知道,CPU 的运行速度比磁盘的速度快很多倍,这样会导致 CPU 需等待磁盘完成处理后才能继续下一道指令, 缓存的处理速度能够跟得上 CPU,它作为CPU与磁盘之间的过渡,很好的解决了这一问题。当CPU处理完数据后,将数据直接发送给缓存,然后立即向应用返回确认,缓存中数据达到一定水位定期写入磁盘,从而提升效率。

缓存是如何工作的?

在程序运行过程中,缓存会有一个局部性原理,即程序会频繁访问局部缓存。如果缓存地址变换频繁,那么缓存中存放的数据就会频繁改变;如果程序频繁访问局部数据,那么缓存中的数据改变就不会很大。因而命中率就会提高,CPU的运行效率也会提升。

浪潮存储的缓存工作原理

由此可知,衡量缓存管理的优劣有两个指标:

一:缓存命中率,命中率高,性能就高,否则反之。

二:有效缓存的比率,有效缓存是指真正会被访问到的缓存项,如果有效缓存的比率偏低,则相当部分磁盘带宽会被浪费到读取无用缓存上,而且无用缓存会间接导致系统缓存紧张,最后可能会严重影响性能。 现在我们清楚了缓存的工作原理及性能指标。

那么为了充分发挥缓存的作用,仅仅依靠“暂存刚刚访问过的数据”是远远不够的,还要通过使用数据预读算法——尽可能把将要使用的数据预先从内存中取到缓存里。

那么关键问题来了:如何精准判断哪些数据是应用程序将要使用的数据?当缓存写满时,如何判断哪些数据被淘汰?

这就是浪潮存储缓存预读算法的精髓所在,我们来深入剖析浪潮存储缓存预读的工作原理。

一方面,浪潮存储基于缓存预读 可精准判断数据热度浪潮存储的缓存预读算法,可以根据历史数据的I/O模式,通过智能分析、预判将要访问的数据,提前将这些数据预读到缓存中,提升缓存命中率,降低I/O访问时延。这里主要有两个关键技术要点:

浪潮存储的智能缓存预读算法

一:自适应缓存预读策略读I/O分为随机读和顺序读两大类,为了保证预读命中率,针对不同的I/O模式采用不同的预读算法。对于顺序读根据区域地址进行顺序预读,对于随机读根据区域热度进行预读。根据不同的读I/O模式两种预读策略动态调整,不仅可以保证很高的预读命中率,同时有效率/覆盖率也很好。

因为顺序读是最简单而普遍的,而随机读在内核来说也确实是难以预测的。内核通过验证如下两个条件来判定是否顺序读:该区域内容被第一次读,并且读的是首部;当前的读请求与前一个读请求在区域内的位置是连续的;如果不满足上述顺序性条件,就判定为随机读。预读策略根据读I/O模式不同动态调整。

二:预读粒度动态调整当确定了要进行顺序预读时,就需要决定合适的预读粒度。预读粒度太小的话,达不到应有的性能提升效果;预读太多,又有可能载入太多程序不需要的内容,造成资源浪费。为此,浪潮存储可根据实际的需求动态调整预读数据内容的粒度,从而提高缓存的有效率。如果缓存命中率提高,后续的预读粒度将逐次倍增,直到系统的最佳预读大小;随着缓存命中率降低,后续预读粒度将逐渐减小,直到系统的最佳预读大小。

另一方面,浪潮存储基于缓存替换算法 实现低访问数据下移

当缓存满了怎么办?不得覆盖掉一个,覆盖掉哪一个?这就是替换算法要解决的。

浪潮存储的缓存替换算法是基于预读数据的命中率,结合数据的访问热度,淘汰最近最少用的那一块,从而提升预读数据的有效性,保证预读持续、高效的正向性能提升。 我们的设计思路是,如果一个数据在最近一段时间没有被访问到,那么在将来它被访问的可能性也很小。也就是说,当限定的空间已存满数据时,应当把最久没有被访问到的数据淘汰。具体实现算法如下:

硬件缓存每一行都有一个计数器,用来记录被使用次数。

计数器变化规则: 每组4行时,计数器有两位,计数值越小则说明越被常用命中时被访问行的计数置0,比其低的计数器加1,其余不变未命中且该组未满时,新行计数器置为0,其余全加1未命中且该组已满时,计数值为3的那一行中的主存块被淘汰,新行计数器置为0,其余全加1

说到这里,估计大家还是没有看懂为了更加直观的展示算法原理,我们举个例子:

智能缓存替换算法原理

现在有四个格子,但是有 5 个不一样的块要进来,缓存替换过程如下:1 来,没有命中,1 进入缓存,计数器为 02 来,没有命中,2 进入缓存,2 计数器 0,1计数器为 1(对应第三条)3 来同上4 来同上1 又来,命中,1 的计数器变为 0,其余加 12 又来,命中,2 的计数器变为 0,其余加 15 来了,但是现在 Cache 满了,去掉哪一个呢?计数器最大的那个!…

特征数据识别

基于“逐字节”比对实现去重

根据用户的数据特征建立数据特征表单,当新的数据请求与表单中的特征匹配时,说明该部分数据已经落盘,这部分数据可以避免重复写入。

特征匹配采用近似匹配的策略,存在两份不同数据的特征一致的情况,为了确保用户的数据安全,每份不同的数据都能一字不落的存放起来,浪潮存储还对特征匹配的数据需要进行“逐字节”比较,为了降低逐字节比较时的访盘时延,系统会智能感知特征数据的访问热度,将频繁访问的热点特征数据提取到内存中,保证系统时延最低。

浪潮存储的特征数据识别算法

黑科技总结时间

浪潮存储【iTurbo智能引擎】的核心技术之一智能IO感知技术,通过自适应缓存预读算法对历史数据I/O模式进行分析、判断识别,对其提前读取到缓存,从而达到缓存最高命中率。当缓存写满时,通过独特的替换算法将使用最少数据的淘汰,将缓存发挥出其最大的价值,从而提升存储整体I/O性能;通过特征数据识别和逐字节的比较,在确保数据安全的前提下减少数据落盘,从而提高存储的性能及空间使用率。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储系统
    +关注

    关注

    2

    文章

    440

    浏览量

    41982
  • 感知技术
    +关注

    关注

    1

    文章

    45

    浏览量

    10385

原文标题:【科技放大镜】探秘iTurbo智能引擎黑科技 — 智能IO感知技术

文章出处:【微信号:inspurstorage,微信公众号:浪潮存储】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    英飞凌新品介绍:提升电子系统性能与效率

    英飞凌新品介绍:提升电子系统性能与效率 在2022年2月,英飞凌推出了一系列新产品,涵盖了隔离栅驱动器、MOSFET、音频放大器等多个领域,为电子工程师在不同应用场景下提供了更多高性能、高可靠性
    的头像 发表于 05-18 11:05 301次阅读

    高端磁带库存储系统功率MOSFET选型方案——高效、可靠与智能电源管理设计指南

    在数据存储需求爆炸式增长与数据中心绿色化转型的双重驱动下,高端磁带库存储系统作为冷热数据分层存储的核心设施,其电源与电机驱动系统的可靠性、能效及功率密度直接决定了数据中心的运营成本与数
    的头像 发表于 04-16 10:39 283次阅读
    高端磁带库<b class='flag-5'>存储系统</b>功率MOSFET选型方案——<b class='flag-5'>高效</b>、可靠与智能电源管理设计指南

    高端容灾存储系统功率链路设计实战:效率、可靠性与热管理的平衡之道

    在数据中心朝着高密度、高可用与绿色节能不断演进的今天,其内部存储系统的供电与电机驱动链路已不再是简单的能量转换单元,而是直接决定了数据存取性能系统可靠性(RAS)与总体拥有成本(TCO)的核心
    的头像 发表于 04-09 09:35 175次阅读
    高端容灾<b class='flag-5'>存储系统</b>功率链路设计实战:效率、可靠性与热管理的平衡之道

    星载存储架构演进:天硕XMC固态硬盘如何实现航天存储的可控性提升

    星载存储系统的单点失效并非源于单一器件,而是数据路径在多层机制叠加下的系统性风险。本文从航天工程实践出发,结合天硕航天存储等行业路径,解析航天级SSD固态硬盘如何通过分层容错与系统协同
    的头像 发表于 03-30 15:19 464次阅读

    Linux系统性能调试工具—strace

    今天给大家分享一个linux内核自带的调试工具,该工具可用于查看和定位系统问题,进程运行过程探索,进行进程监控,对每个系统调用都可以监测,有助于我们优化系统性能
    的头像 发表于 01-30 17:03 2113次阅读
    Linux<b class='flag-5'>系统性能</b>调试工具—strace

    Linux系统性能优化与调试的思路​

    在开发过程中,对系统性能的要求越来越高,在求职的过程中很多岗位不单单是要求驱动开发或者系统开发,会解决系统性能瓶颈问题,往往是加分项,有些公司特别是大厂都会把性能优化单独划分一个岗位。
    的头像 发表于 01-30 16:58 792次阅读
    Linux<b class='flag-5'>系统性能</b>优化与调试的思路​

    戴尔科技蝉联全球服务器市场与外部存储系统行业份额第一

    近日,知名研究机构IDC公布的2025年第三季度《全球服务器季度追踪报告》和《全球企业存储季度追踪报告》显示,戴尔科技集团再次双双位列榜首,蝉联全球服务器市场与外部存储系统行业份额第一。
    的头像 发表于 01-21 16:04 768次阅读
    戴尔科技蝉联全球服务器市场与外部<b class='flag-5'>存储系统</b>行业份额第一

    全球前四!京东云云海AI存储跻身IO500高性能存储榜单

    存储技术,云海AI存储不采用 PMEM 硬件,具备更强通用性的同时也实现了更低存储成本。 IO500是全球高性能计算HPC领域最权威、最具影响力的
    的头像 发表于 11-27 14:51 496次阅读
    全球前四!京东云云海AI<b class='flag-5'>存储</b>跻身IO500高<b class='flag-5'>性能</b><b class='flag-5'>存储</b>榜单

    集装箱储能系统标准解析系列(二)|IEC TS 62933-3-1电能存储系统的规划和性能评估

    IEC TS 62933-3-1电能存储(EES)系统 第3-1部分:电能存储系统的规划和性能评估
    的头像 发表于 11-25 15:30 834次阅读
    集装箱储能<b class='flag-5'>系统</b>标准解析系列(二)|IEC TS 62933-3-1电能<b class='flag-5'>存储系统</b>的规划和<b class='flag-5'>性能</b>评估

    Linux系统性能优化技巧

    经过10年一线运维经验,我发现大多数工程师只掌握了Linux优化的冰山一角。今天分享的这些秘技,能让你的系统性能提升200%以上!
    的头像 发表于 08-27 14:34 1236次阅读

    曙光存储支持西湖大学高性能计算中心部署完成全新存储系统

    近日,曙光存储支持西湖大学高性能计算中心部署完成全新存储系统,为AI研发、科学计算和信息化平台等提供存力支持。性能实测显示,该系统单节点带宽
    的头像 发表于 08-25 11:48 1560次阅读

    NAS存储系统断电风险大?UPS电源守护数据安全刻不容缓

    在数字化时代,企业数据已成为最宝贵的资产。NAS存储系统作为企业数据存储的核心设备,一旦遭遇意外断电,轻则导致数据丢失,重则造成设备损坏,给企业带来难以估量的损失。作为专业UPS电源厂家,优比施
    的头像 发表于 08-25 10:13 1263次阅读
    NAS<b class='flag-5'>存储系统</b>断电风险大?UPS电源守护数据安全刻不容缓

    Linux系统性能调优方案

    关键要点预览:本文将深入解析Linux系统性能瓶颈的根本原因,提供可直接落地的调优方案,让你的系统性能提升30-50%!
    的头像 发表于 08-06 17:49 1152次阅读

    Ceph分布式存储系统解析

    在当今数据爆炸的时代,企业对存储系统的需求日益增长,传统的集中式存储已经无法满足大规模数据处理的要求。分布式存储系统应运而生,而Ceph作为开源分布式存储系统的佼佼者,以其高可用性、高
    的头像 发表于 07-14 11:15 1336次阅读

    升降速曲线对直线电机系统性能影响的研究

    速曲线对直线电机系统性能影响的研究.pdf【免责声明】本文系网络转载,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请第一时间告知,删除内容!
    发表于 06-17 08:48