0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浪潮存储基于对亚健康状态的研究

浪潮存储 来源:浪潮存储 作者:浪潮存储 2022-05-09 15:06 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

“亚健康”这个词不仅在生活中被熟知,而且大家经常使用的信息系统中也会经常遇到;亚健康状态,顾名思义,是存储系统介于健康状态和故障状态之间的一种状态,系统仍在运行且功能正常但处于降级模式的一种情况,它的存在会造成系统性能严重低于预期。

浪潮存储基于对亚健康状态的研究,在分布式存储平台进行技术创新,研发了亚健康状态监控功能,对硬件、系统、网络等进行实时监测,当系统发现运行过程中存在亚健康状态时,可快速定位原因、上报、并对处于亚健康的部件进行必要的处理,降低亚健康状态对存储系统的影响,保障用户数据服务的可靠、高效。

过去因大部分应用系统规模较小,一般会将亚健康状态划归到故障进行处理,系统在这种情况下虽处于亚健康状态,但仍可以对外提供服务,处于亚健康的部件却被当成故障处理扩大了亚健康状态的影响范围,有时甚至会导致系统不可提供服务,也造成了资源浪费。近十年,随着新技术的快速发展,以及分布式系统部署规模的增加,亚健康状态对于存储系统的破坏已经越来越显著,之前亚健康状态处理方式已经不适合现在的大规模系统。亟待更加智能、高效的机制来保障存储系统健康运行。

亚健康状态是隐形的系统杀手

以网络亚健康为例,网卡故障、驱动程序故障、设备故障、接线松动、温度过高过低等都可能引起网络亚健康状态,尽管产生网络亚健康状态的原因众多,但其对外表现的现象相对简单,主要是网络时延的增加和网络丢包率的增加。如下为网络丢包率和时延对分布式存储系统性能的影响。

efb6e722-cf5f-11ec-bce3-dac502259ad0.png

efe0a63e-cf5f-11ec-bce3-dac502259ad0.png

在一个分布式存储系统中,单个节点网络丢包率或网络时延增加时,存储系统的性能会极快速的下降,5%的丢包率或50ms时延,就足以使存储系统性能下降一半左右。

从网络亚健康实例中可以看出,亚健康状态对系统的危害,微小的一个亚健康状态,对系统性能的影响都是巨大的。此外CPU、内存、硬盘模块、网卡等硬件部件、操作系统以及软件运行均有可能进入亚健康状态。

浪潮存储基于大量来自企业、大学、实验室等案例的亚健康状态的研究,进行了故障分类和根因分析,可以看出,硬件亚健康状态占比33%,网络亚健康状态占比38%,这两类故障占比超过整体的70%。

effc8552-cf5f-11ec-bce3-dac502259ad0.png

△亚健康状态案例比例

亚健康状态监控

让分布式存储运行更稳定

基于对亚健康状态的表象根因等分析与研究,浪潮在分布式存储上实现了亚健康状态监控功能,对硬件亚健康状态、系统亚健康状态以及网络亚健康状态的实时监控,当系统发现运行过程中存在亚健康状态时,可快速定位亚健康状态的原因、上报故障、并对亚健康的部件进行必要的处理(如尝试恢复、隔离部件等),最大限度的降低亚健康状态对存储系统的影响。

浪潮分布式存储AS13000配置了亚健康状态监控之后可以进行亚健康状态监控告警服务的同时还具有如下优势:

01精准定位

亚健康状态的场景复杂,症状、根因众多,检测难度大。亚健康状态监控系统通过建立硬件亚健康检测、网络亚健康检测以及系统亚健康检测的机制,有效的覆盖了亚健康状态的各种检测场景,再加上检测信息的精准分析,能更精准的定位亚健康状态。

02快速处理

存储系统长期以亚健康状态的状态运行,会影响整体性能,监控功能可以在短期内发现亚健康状态,并及时做出必要的处理。以往为了确保系统运行的稳定性,运维人员预计需要每周执行一次巡检脚本,对整个集群进行健康巡检。这种方式一方面时效性差,平均3-4天才可以发现问题;另一方面是巡检脚本检测并不全面。亚健康状态监控可以150秒内发现网络亚健康状态并进行网口隔离处理、30分钟内发现系统亚健康状态并告警、60分钟内发现磁盘温度异常并告警等;平均发现系统亚健康状态并处理的时间缩短了四分之三,并且检测的项目更全面、结果更准确。

f01a31f6-cf5f-11ec-bce3-dac502259ad0.png

具备亚健康状态监控功能的分布式存储AS13000,已经在金融、通信、教科研、医疗等行业规模部署,在运行过程中亚健康状态监控功能快速响应机制,降低了亚健康状态对存储系统的影响与运维成本,保障了客户业务,让企业轻松应对数字经济时代的海量数据挑战。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    13

    文章

    4934

    浏览量

    90387
  • 浪潮
    +关注

    关注

    1

    文章

    491

    浏览量

    25499
  • 存储系统
    +关注

    关注

    2

    文章

    440

    浏览量

    41981

原文标题:“亚健康”智能监测,浪潮分布式存储让数据更可靠

文章出处:【微信号:inspurstorage,微信公众号:浪潮存储】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    RK3562 单板机嵌入式 eMMC 健康监测开发指南:数据采集与状态分析

    )及日志记录功能,提供完整的测试、编译流程与关键代码解析,助力开发者快速实现嵌入式平台 eMMC 存储健康监测与管理。
    的头像 发表于 03-31 15:07 238次阅读
    RK3562 单板机嵌入式 eMMC <b class='flag-5'>健康</b>监测开发指南:数据采集与<b class='flag-5'>状态</b>分析

    迪文推出充电宝健康状态监测与显示方案

    根据充电宝新国标要求,迪文科技推出基于T5F0ASIC的充电宝健康状态监测与显示方案。新国标中新增了如下2项要求:强制智能监测:实时记录电压、电流、温度、异常状态,并通过显示屏等方式进行显示;强制
    的头像 发表于 03-16 18:05 809次阅读
    迪文推出充电宝<b class='flag-5'>健康</b><b class='flag-5'>状态</b>监测与显示方案

    键合引线的存储寿命老化研究

    键合引线超过半年就必须丢弃吗?本文深度解析ASTM针对金丝与铝丝长达两年的老化研究,揭示退火态引线在恒温存储下的“硬核”稳定性。从细线延伸率波动到粗铝丝的再结晶机理,为您拆解引线长期贮存的性能演变,助力企业平衡物料成本与生产良率。
    的头像 发表于 03-16 16:57 668次阅读
    键合引线的<b class='flag-5'>存储</b>寿命老化<b class='flag-5'>研究</b>

    深入解析ADI LTC3337:初级电池健康状态监测的利器

    深入解析ADI LTC3337:初级电池健康状态监测的利器 在电子设备的电源管理领域,准确监测初级电池的状态对于设备的稳定运行和寿命延长至关重要。ADI公司的LTC3337作为一款专门的初级电池
    的头像 发表于 02-12 15:25 824次阅读

    如何打破“亚健康”的电源供应链关系?

    在国家大力倡导高质量发展与新质生产力的背景下,电源行业的自主创新却面临一个深层次的梗阻:电源供应链关系的“亚健康状态。 当回款周期以月为单位延长,当价格博弈取代技术协同,当信任缺失成为国产替代
    的头像 发表于 02-04 11:35 420次阅读
    如何打破“<b class='flag-5'>亚健康</b>”的电源供应链关系?

    DR1 系列评估板 eMMC 健康管理案例开发手册:信息查询与寿命监控

    记录,支持多品牌 eMMC 适配。文档详细说明参数配置、测试步骤与关键代码,适配 Windows 与 Ubuntu 开发环境。创龙科技通过标准化流程,帮助开发者高效监测 eMMC 健康状态,及时掌握存储寿命与坏块情况,适用于嵌入
    的头像 发表于 01-22 15:24 512次阅读
    DR1 系列评估板 eMMC <b class='flag-5'>健康</b>管理案例开发手册:信息查询与寿命监控

    守护企业“电力健康”,安科瑞电能质量治理方案揭秘

    在现代企业中,大量变频器、精密设备和新能源设施在运行中会产生**谐波污染、电压波动**等“电力亚健康”问题。这不仅导致电费增加、设备过热损耗,还可能引发生产中断。安科瑞电气作为深耕智能电力领域
    的头像 发表于 01-13 13:34 216次阅读
    守护企业“电力<b class='flag-5'>健康</b>”,安科瑞电能质量治理方案揭秘

    你的开关柜“猝死”了吗?开关柜健康预警与寿命诊断新革命

    如何提前识别开关柜的“亚健康状态?如何科学评估其剩余寿命?又如何实现从“被动抢修”向“主动预防”的转变?答案就藏在——智能健康分析与寿命诊断技术之中。
    的头像 发表于 12-03 09:40 482次阅读
    你的开关柜“猝死”了吗?开关柜<b class='flag-5'>健康</b>预警与寿命诊断新革命

    设备的状态监测可以通过哪些方式实现?

    设备状态监测的核心是 通过 “硬件传感 + 软件自检 + 通信反馈 + 远程联动”,实现对设备 “健康状态、运行状态、安全状态” 的全维度感
    的头像 发表于 11-07 09:44 1209次阅读

    广电计量携手南山研究院打造大健康产业新生态

    10月19日, “南山研究院南海四周年系列活动”在广东省南山医药创新研究院(简称“南山研究院”)成功举办。期间,南山研究院与广电计量等多家单位联合共建的华南医学
    的头像 发表于 10-23 17:42 1382次阅读

    如何根据设备健康状态数据进行分析决策?

    要根据设备健康状态数据做好分析决策,需先明确数据核心价值,再通过 “数据预处理→多维度分析→风险评估→决策落地” 的闭环流程推进,既依托技术工具挖掘数据规律,又结合生产实际确保决策可行。
    的头像 发表于 08-20 10:07 1046次阅读
    如何根据设备<b class='flag-5'>健康</b><b class='flag-5'>状态</b>数据进行分析决策?

    ArkUI-X跨平台技术落地-华为运动健康(一)

    理解成为一个独立的内部数据存储模块,具备增、删、改、查健康数据以及实现端云数据同步的功能)。但是由于历史原因,当前三端的数据平台无法做到代码复用,有各自的接口和逻辑实现,所以如何去除健康二级页面(如睡眠
    发表于 06-18 22:53

    绕线电机启动状态到双馈状态过渡过程的研究

    状态到双馈状态过渡过程的研究.pdf【免责声明】本文系网络转载,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请第一时间告知,删除内容!
    发表于 06-12 13:40

    精准监测,健康无忧--XC3576H工控主板赋能亚健康检测仪

    在快节奏的现代生活中,亚健康问题逐渐成为困扰人们健康的隐形杀手。疲劳、失眠、免疫力下降等问题频发,却往往因难以察觉而延误调理。智能亚健康检测仪通过高科技手段,帮助用户实时了解身体状况,提前预警潜在
    的头像 发表于 05-28 17:56 707次阅读
    精准监测,<b class='flag-5'>健康</b>无忧--XC3576H工控主板赋能<b class='flag-5'>亚健康</b>检测仪

    浅析AI数据采集和标注在运动健康领域的落地应用

    ​在健康意识日益提升与科技快速发展的双重驱动下,运动健康领域正迎来智能化变革浪潮。从竞技体育的精准训练到大众健康的个性化管理,从运动损伤的智能预防到康复治疗的数字化升级,AI驱动已成为
    的头像 发表于 05-28 17:39 1224次阅读
    浅析AI数据采集和标注在运动<b class='flag-5'>健康</b>领域的落地应用