0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浪潮存储亚健康状态监控功能保障用户数据服务的可靠、高效

科技绿洲 来源:浪潮存储 作者:浪潮存储 2022-05-09 14:40 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

“亚健康”这个词不仅在生活中被熟知,而且大家经常使用的信息系统中也会经常遇到;亚健康状态,顾名思义,是存储系统介于健康状态和故障状态之间的一种状态,系统仍在运行且功能正常但处于降级模式的一种情况,它的存在会造成系统性能严重低于预期。

浪潮存储基于对亚健康状态的研究,在分布式存储平台进行技术创新,研发了亚健康状态监控功能,对硬件、系统、网络等进行实时监测,当系统发现运行过程中存在亚健康状态时,可快速定位原因、上报、并对处于亚健康的部件进行必要的处理,降低亚健康状态对存储系统的影响,保障用户数据服务的可靠、高效。

过去因大部分应用系统规模较小,一般会将亚健康状态划归到故障进行处理,系统在这种情况下虽处于亚健康状态,但仍可以对外提供服务,处于亚健康的部件却被当成故障处理扩大了亚健康状态的影响范围,有时甚至会导致系统不可提供服务,也造成了资源浪费。近十年,随着新技术的快速发展,以及分布式系统部署规模的增加,亚健康状态对于存储系统的破坏已经越来越显著,之前亚健康状态处理方式已经不适合现在的大规模系统。亟待更加智能、高效的机制来保障存储系统健康运行。

亚健康状态是隐形的系统杀手

以网络亚健康为例,网卡故障、驱动程序故障、设备故障、接线松动、温度过高过低等都可能引起网络亚健康状态,尽管产生网络亚健康状态的原因众多,但其对外表现的现象相对简单,主要是网络时延的增加和网络丢包率的增加。如下为网络丢包率和时延对分布式存储系统性能的影响。

在一个分布式存储系统中,单个节点网络丢包率或网络时延增加时,存储系统的性能会极快速的下降,5%的丢包率或50ms时延,就足以使存储系统性能下降一半左右。

从网络亚健康实例中可以看出,亚健康状态对系统的危害,微小的一个亚健康状态,对系统性能的影响都是巨大的。此外CPU、内存、硬盘模块、网卡等硬件部件、操作系统以及软件运行均有可能进入亚健康状态。

浪潮存储基于大量来自企业、大学、实验室等案例的亚健康状态的研究,进行了故障分类和根因分析,可以看出,硬件亚健康状态占比33%,网络亚健康状态占比38%,这两类故障占比超过整体的70%。

亚健康状态监控

让分布式存储运行更稳定

基于对亚健康状态的表象根因等分析与研究,浪潮在分布式存储上实现了亚健康状态监控功能,对硬件亚健康状态、系统亚健康状态以及网络亚健康状态的实时监控,当系统发现运行过程中存在亚健康状态时,可快速定位亚健康状态的原因、上报故障、并对亚健康的部件进行必要的处理(如尝试恢复、隔离部件等),最大限度的降低亚健康状态对存储系统的影响。

浪潮分布式存储AS13000配置了亚健康状态监控之后可以进行亚健康状态监控告警服务的同时还具有如下优势:

01精准定位

亚健康状态的场景复杂,症状、根因众多,检测难度大。亚健康状态监控系统通过建立硬件亚健康检测、网络亚健康检测以及系统亚健康检测的机制,有效的覆盖了亚健康状态的各种检测场景,再加上检测信息的精准分析,能更精准的定位亚健康状态。

02快速处理

存储系统长期以亚健康状态的状态运行,会影响整体性能,监控功能可以在短期内发现亚健康状态,并及时做出必要的处理。以往为了确保系统运行的稳定性,运维人员预计需要每周执行一次巡检脚本,对整个集群进行健康巡检。这种方式一方面时效性差,平均3-4天才可以发现问题;另一方面是巡检脚本检测并不全面。亚健康状态监控可以150秒内发现网络亚健康状态并进行网口隔离处理、30分钟内发现系统亚健康状态并告警、60分钟内发现磁盘温度异常并告警等;平均发现系统亚健康状态并处理的时间缩短了四分之三,并且检测的项目更全面、结果更准确。

具备亚健康状态监控功能的分布式存储AS13000,已经在金融、通信、教科研、医疗等行业规模部署,在运行过程中亚健康状态监控功能快速响应机制,降低了亚健康状态对存储系统的影响与运维成本,保障了客户业务,让企业轻松应对数字经济时代的海量数据挑战。

审核编辑:彭菁
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 浪潮
    +关注

    关注

    1

    文章

    490

    浏览量

    25479
  • 存储系统
    +关注

    关注

    2

    文章

    437

    浏览量

    41946
  • 数据服务
    +关注

    关注

    0

    文章

    43

    浏览量

    10239
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    如何打破“亚健康”的电源供应链关系?

    在国家大力倡导高质量发展与新质生产力的背景下,电源行业的自主创新却面临一个深层次的梗阻:电源供应链关系的“亚健康状态。 当回款周期以月为单位延长,当价格博弈取代技术协同,当信任缺失成为国产替代
    的头像 发表于 02-04 11:35 353次阅读
    如何打破“<b class='flag-5'>亚健康</b>”的电源供应链关系?

    宏景智驾成为四省边际交易数据中心首位数据服务

    近日,宏景智驾正式获授为 “四省边际交易数据中心” 首位数据服务商,并顺利完成数据资产登记。衢州市数据局党组成员(副处长级)周建良向宏景智驾颁发了
    的头像 发表于 12-29 09:55 692次阅读

    CW32F030片上FLASH闪存存储器物理区域的划分

    域主要用于存放应用程序代码和用户数据用户可编程。 2、启动程序存储器,共 2.5KB,地址空间为 0x0010 0000 - 0x0010 09FF。该区域主要用于存储 BootLo
    发表于 12-23 08:28

    针对CW32芯片内部flash能存用户数据吗?

    针对CW32芯片,内部flash能存用户数据吗?就是如果不想加外部的flash,内部多余的flash能给外部使用吗?有相关的示例么?写入也需要按页擦之后再写入吗?
    发表于 12-09 08:13

    ZeroNews 如何关注用户数据安全

    ZeroNews 通过控制平面与边缘节点协同,保障用户数据安全与透明传输。
    的头像 发表于 11-13 19:17 640次阅读
    ZeroNews 如何关注<b class='flag-5'>用户数据</b>安全

    AI 服务器备用电源:高效可靠与智能的未来保障

    电子发烧友网综合报道 随着人工智能技术的飞速发展,AI 服务器已成为数据中心的核心引擎。然而,算力需求的指数级增长也带来了前所未有的电源挑战。在 AI 服务器的运行中,备用电源系统不仅需要保障
    的头像 发表于 10-09 02:38 5422次阅读

    淘宝/天猫:使用订单查询API实时追踪包裹状态,自动推送物流通知至用户

    实现包裹状态的实时监控,并自动推送物流更新通知给用户,从而优化服务流程。本文将逐步介绍如何利用淘宝/天猫的开放平台API实现这一功能,确保
    的头像 发表于 09-10 16:55 1485次阅读
    淘宝/天猫:使用订单查询API实时追踪包裹<b class='flag-5'>状态</b>,自动推送物流通知至<b class='flag-5'>用户</b>

    提升AI数据服务存储性能:永铭电容器如何保障读写速度与数据完整性

    服务器SSD存储的核心功能与挑战AI数据服务器作为当前IT硬件的焦点领域,其存储系统日益复杂且至关重要。为了满足海量
    的头像 发表于 09-01 10:03 753次阅读
    提升AI<b class='flag-5'>数据服务</b>器<b class='flag-5'>存储</b>性能:永铭电容器如何<b class='flag-5'>保障</b>读写速度与<b class='flag-5'>数据</b>完整性

    如何在下载程序时保护flash中的用户数据不被覆盖?

    使用stm32cubeide或stm32cubeprogrammer烧写程序,stlink下载器,芯片stm32h743,芯片内部flash的0x08100000地址中写有用户数据,如何在重新烧写
    发表于 08-14 06:38

    电商API安全最佳实践:保护用户数据免受攻击

    。本文将系统介绍电商API安全的最佳实践,帮助您保护用户数据免受常见攻击。文章结构清晰,分步讲解关键措施,确保内容真实可靠,基于行业标准如OWASP API安全指南。 1. 使用HTTPS加密所有通信 API通信必须全程加密,防止数据
    的头像 发表于 07-14 14:41 754次阅读
    电商API安全最佳实践:保护<b class='flag-5'>用户数据</b>免受攻击

    聚徽上架式工控一体机的工业级存储技术:数据安全与高效读写保障

    工控一体机凭借其卓越的工业级存储技术,在数据安全与高效读写方面表现出色,为工业生产提供了坚实的数据保障。 二、聚徽上架式工控一体机工业级
    的头像 发表于 06-24 16:18 661次阅读

    精准监测,健康无忧--XC3576H工控主板赋能亚健康检测仪

    在快节奏的现代生活中,亚健康问题逐渐成为困扰人们健康的隐形杀手。疲劳、失眠、免疫力下降等问题频发,却往往因难以察觉而延误调理。智能亚健康检测仪通过高科技手段,帮助用户实时了解身体状况,
    的头像 发表于 05-28 17:56 665次阅读
    精准监测,<b class='flag-5'>健康</b>无忧--XC3576H工控主板赋能<b class='flag-5'>亚健康</b>检测仪

    STM32与CSNP32GCR01-BOW在按摩仪器中的协同应用解决方案

    一次,同步用户数据至云端(如使用记录上传),平衡功耗与实时性需求。 3. 安全与可靠性增强 1. 数据加密 :利用STM32的AES-256加密模块对敏感用户数据(如使用习惯、
    发表于 05-20 18:03

    使用Prometheus与Grafana实现MindIE服务可视化监控功能

    在 MindIE 服务化运行过程中,为了及时掌握服务的运行状态、性能表现以及发现潜在问题,提供了服务监控指标查询接口(普罗 (Prometh
    的头像 发表于 04-21 11:48 2487次阅读
    使用Prometheus与Grafana实现MindIE<b class='flag-5'>服务</b>可视化<b class='flag-5'>监控</b><b class='flag-5'>功能</b>

    气压温度流量监测系统功能特点与应用

    、自动监控。 利用高效网关和采集服务,轻松实现点到亿点的数据采集处理,利用大数据技术实现海量数据
    发表于 04-21 11:39