0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为什么存储系统的性能涉及到无数的IO环节?

lhl545545 来源:H3C 作者:H3C 2020-08-29 09:29 次阅读

性能一直是存储的核心话题,如果说可靠性是业务数据的生命线,那么性能就是业务加速发展的推进器。

存储系统的性能来自于软件和硬件的配合,硬件体系包括CPU、内存、网络、硬盘,组网方式,软件架构等等,所有这些软硬件协同作用的合力就表现为存储系统对外提供的性能吞吐能力。

相比于传统存储,分布式存储的性能问题尤为棘手,涉及到多个节点之间的数据转发,IO路径更长,因此对性能的影响点更多,更复杂。纯软件由于其硬件的多样性,往往出现性能体验的波动和不稳定,在某些配置上得到的性能数据,在最终用户得到的硬件配置上却不一定能达到。

面向场景 补齐影响性能的每块短板

新华三集团存储产品线X10000产品首席架构师陈钊介绍:“存储系统的性能问题是个典型的木桶效应,再解决当前短板之前,很难准确预知下一个短板;或者是否存在比当前发现的短板更短的短板。存储性能优化团队通过在整个存储IO路径协议栈上进行细致的打点分析,逐个排查性能瓶颈点,不断突破性能极限。”

“同时,我们深耕业务场景,比如广电、运营商、HPC等,专项进行性能优化,从硬件驱动到协议栈,一层一层分析系统瓶颈,逐项优化。H3C UniStor X10000存储一体机从用户场景出发,通过软硬件的联合调优,基于业务场景给出最佳的硬件典配,交付用户有保障的存储性能。”

除了针对各项场景应用进行定向优化精细开发,研发团队还介绍了X10000性能优化过程中的一个小小的难点……

不走回头路 用聪明的方法解决问题

原来,随着新的特性功能不断开发,加载了新功能后的产品,很有可能出现性能的倒退。那么,要怎样解决和避免这样的问题呢?

负责自动化性能看护系统的研发人员冯翔宇介绍,中央电视台和中科大洋联合poc测试是一次难忘的经历,当时,X10000存储系统在用户的测试环境中出现了性能回退。为了排查确切的引入问题源,测试团队重新对每一个列入问题单的性能影响因素进行了测试评估,整个周期持续了一月有余。

同时,针对新版本性能回退的主要矛盾,测试团队决定建立一套自动化性能系统。通过自动化CI集成,在性能倒退的最初就能识别并解决;当性能优化成果合入版本后,又刷新性能基线。从而使存储产品的性能能够不断提升。

冯翔宇介绍,性能自动化系统建立初期,测试团队查找和尝试了大量的开源工具和资料,决定了基于一个开源的基础框架。真正开展后却发现,框架虽然体系清晰,但是原生系统却是基于块业务实现的,且该系统实际上仅仅是一个预研阶段的产物,实际操作的资料基本没有。在初次部署时,便有层层报错。

测试团队花费了大量的时间梳理系统框架、终于建立了文件系统测试系统框架。然而,进行初步测试的过程中,却发现存储关注的性能数据分析和统计功能并不适配。

众所周知,存储产品的性能测试与硬件环境强相关,在保证性能测试数据能及时、有效提供的同时,还需要保证周边的测试环境、可供分析的perf数据准确抓取,这对于长期的性能稳定性至关重要。

为此,测试与开发团队内部专家反复沟通性能perf数据的抓取,建立可以反复、长期使用的perf数据库,确定抓取、命名、分类等准则;针对代码的简洁准确性、接口可复用继承性、异常流程处理等,测试人员反复考虑和优化已经调试走通的代码,对加强异常报错代码的提示信息也格外注重,快速解决问题。

团队的努力没有白费,经过反复的测验和不断集思广益优化,当前自动化测试系统具备一键完成自动安装、多个测试任务一键下发、性能数据准确收集等功能,让运维人员从性能测试环境确认、脚本确认、数据人力收集等诸多重复操作中解放,节约一半以上的人力投入,真正实现版本性能看护,为用户的业务开展提供最强加速度。

后记:披荆斩棘 初露锋芒

排查完性能问题之后的X10000存储系统,到客户的应用测试环境中,也表现出了优异的性能,为X10000在广电行业的破冰与开拓奠定了坚实的基础。

上文我们记载的是X10000性能研发过程中的一个小小的插曲,正如前文提到的,存储系统的性能涉及到无数的IO环节,只有我们扫除了每个IO环节上的瓶颈,才能造就存储系统优异稳定的性能,在这个不断排查瓶颈的过程中,研发中心上演了一幕幕感人的小故事,奠定了X10000存储系统的性能基础,铺就了X10000在多个行业开疆扩土的发展前景!
责任编辑:pj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10442

    浏览量

    206564
  • 软件
    +关注

    关注

    67

    文章

    4348

    浏览量

    85622
  • 存储系统
    +关注

    关注

    2

    文章

    381

    浏览量

    40703
收藏 人收藏

    评论

    相关推荐

    兆芯携手智云创新推出高性能NVMe企业级存储系统

    面向持续增长的数字化转型与应用创新发展需求,兆芯携手智云创新,基于兆芯高性能自主处理器平台成功推出多款信创存储产品,包括高性能NVMe企业级存储系统、HS6000系列企业级
    的头像 发表于 04-12 14:06 138次阅读

    如何去提高EtherCAT IO性能呢?

    进行EtherCAT IO性能优化涉及多个方面,包括硬件选择、网络配置、软件优化和应用程序设计。
    的头像 发表于 03-07 09:28 146次阅读

    什么是智能存储系统?对比传统存储柜,智能存储柜有哪些优点?

    智能存储系统(IntelligentStorageSystem)是一种先进的数据存储解决方案,它结合了硬件、软件和自动化管理功能,以实现对数据存储的高度优化、高效能、高可用性和可扩展性。是针对现代
    的头像 发表于 03-05 13:53 140次阅读
    什么是智能<b class='flag-5'>存储系统</b>?对比传统<b class='flag-5'>存储</b>柜,智能<b class='flag-5'>存储</b>柜有哪些优点?

    简单说一下阻塞IO、非阻塞IOIO复用的区别?

    对于计算机而言,任何涉及到计算机核心(CPU和内存)与其他设备间的数据转移的过程就是IO
    的头像 发表于 03-04 15:14 463次阅读
    简单说一下阻塞<b class='flag-5'>IO</b>、非阻塞<b class='flag-5'>IO</b>、<b class='flag-5'>IO</b>复用的区别?

    百度搜索内容HTAP表格存储系统

    整套存储设计需要解决的核心问题是——如何在OLTP存储系统中支持OLAP workflow?OLAP workflow在OLTP存储系统上带来的两个最主要的问题是:严重的IO放大率、存
    的头像 发表于 12-05 16:00 240次阅读
    百度搜索内容HTAP表格<b class='flag-5'>存储系统</b>

    平头哥SSD主控芯片镇岳510性能分析

    镇岳510芯片还针对云计算场景进行了深度优化,芯片与云存储软件系统紧密融合协作,有效降低数据读写的延时,为系统带来了更高的性能。例如,镇岳510在支持NVMe的队列级调度机制的同时,额
    发表于 11-22 11:36 324次阅读
    平头哥SSD主控芯片镇岳510<b class='flag-5'>性能</b>分析

    诚邀您参加2023云栖大会平头哥专场——以芯重塑云存储系统效能

    2023云栖大会定档 10月31日 期待与您在杭州云栖小镇 共度一场为期 3天 的科技盛会 平头哥邀请您参与话题专场 “软硬件协同,以芯重塑云存储系统效能” 日期:11月1日 时间:1520 会场
    的头像 发表于 10-23 11:55 411次阅读
    诚邀您参加2023云栖大会平头哥专场——以芯重塑云<b class='flag-5'>存储系统</b>效能

    曙光推出ParaStor分布式存储系统解决方案

    。在数据建模分析中,数据存储的压力会随之增长,存储系统往往需具备PB级的扩展能力和极高的读写性能,这对存储系统稳定性、可靠性和访问带宽都提出了严苛要求。 为应对石油勘探面临的挑战,中科
    的头像 发表于 10-21 09:25 614次阅读

    评估报告:全闪存HP 3PAR StoreServ 7450存储系统和第5代16Gb/s光纤通道

    电子发烧友网站提供《评估报告:全闪存HP 3PAR StoreServ 7450存储系统和第5代16Gb/s光纤通道.pdf》资料免费下载
    发表于 08-30 16:41 0次下载
    评估报告:全闪存HP 3PAR StoreServ 7450<b class='flag-5'>存储系统</b>和第5代16Gb/s光纤通道

    深入分析企业存储系统的架构、功能和技术特点

    企业存储系统需要具备高可用性和容错能力,保证数据安全和可靠性。其次,存储系统需要支持多种协议和文件格式,满足不同应用场景的需求。此外,存储系统还需要支持数据备份和恢复、快照和克隆等高级功能,提高数据管理和保护的效率。
    发表于 08-14 14:46 342次阅读
    深入分析企业<b class='flag-5'>存储系统</b>的架构、功能和技术特点

    查看linux系统磁盘io情况的办法是什么

    谈到 Linux 磁盘 I/O 的工作原理,我们了解到 Linux 存储系统 I/O 栈由文件系统层(file system layer)、通用块层( general block layer)和设备层(device layer)构成。
    发表于 08-01 10:14 1852次阅读

    微服务之间涉及到的数据依赖问题应该怎么处理呢?

    微服务,顾名思义,就是将我们程序拆分为最小化单元来提供服务。在一体化系统中,各个微服务也是不可能独立存在的,那么微服务之间涉及到的数据依赖问题,应该怎么处理呢?我们从场景入手来分析考虑此类问题。
    的头像 发表于 06-15 10:05 510次阅读
    微服务之间<b class='flag-5'>涉及到</b>的数据依赖问题应该怎么处理呢?

    登顶!华为OceanStor Pacific存储达成IO500榜单全球第一

    倍 的绝对优势,得分位列 10 节点榜单榜首,问鼎全球。 IO500是HPC(高性能计算)领域最具影响力的世界级存储排行榜,主要针对存储系统性能
    的头像 发表于 05-26 13:15 517次阅读

    优化智能存储适配器性能

    无论您是设置第一个存储系统配置还是经验丰富的专业人士,我们的存储适配器性能指南都可以帮助您配置存储适配器以获得最佳性能
    的头像 发表于 05-05 10:51 1058次阅读
    优化智能<b class='flag-5'>存储</b>适配器<b class='flag-5'>性能</b>

    在设计基于NAND的存储系统时选中所有框

    有人会认为设计一个基于NAND的存储系统是相当简单的。然而,这是一个极其复杂的过程,在此过程中需要进行一系列组件和权衡。没有一种适合所有解决方案的解决方案,尤其是在设计工业解决方案时。
    的头像 发表于 05-04 11:01 905次阅读