0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

IT技术厂商说的“5个9”到底有多牛?

工业互联网前线 来源:美国容错技术有限公司 作者:美国容错技术有限 2021-04-07 11:06 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

从事信息化产业研究多年,身边不乏熟悉的IT技术厂商。在与他们的技术专家交流过程中经常会聊到产品可用性问题。这时他们会说自己的产品有多好,可用性高达“5个9”。那么,“5个9”到底有多牛?

按照年度可用性计算:365天x24小时x60分钟x99.999%=5.256分钟。换句话讲,他们的产品允许一年非计划停机时间约为5分钟,厉害不厉害?当然厉害。可用性够吗?我看未必。随着企业数字化转型升级,更复杂的业务需求对服务器可用要求将越来越高,甚至根本不允许任何非计划停机。因此,仅仅是高可用性,其实是满足不了日趋智能化的工业时代需求。

按照高可用性的定义,本质是允许非计划内停机出现的,只是尽可能通过技术手段来减少停工时间,保持服务的高度可用性。

目前高可用性对停机划分分为两种,一是不可修复系统,系统的平均寿命指系统发生失效前的平均工作(或存储)时间或工作次数,也称为系统在失效前的平均时间,记为MTTF(Mean Time To Failure)。二是可修复系统,系统的寿命是指两次相邻失效(故障)之间的工作时间,而不是指整个系统的报废时间。平均寿命即是平均无故障时间,也称为系统平均失效间隔,记为MTBF(Mean Time Between Failure)。可修复产品的平均修复时间,就是从出现故障到修复中间的这段时间记为MTTR(Mean Time To Repair)平均修复时间。MTTR越短表示易恢复性越好。

那么,容错性和高可用性有什么区别?容错性指的是故障容许度(Fault tolerance),是使系统在部分组件(一个或多个)发生故障时仍能正常运作的能力。容错性能保障即使系统组件出现故障,也能快速的切换到备用系统,并保证系统的正常运营能力。对比高可用性强调恢复能力,容错性是不允许这种情况发生,其目标是预防故障,做到即使出现故障也能快速切换,保证业务系统正常运行。

在传统信息化时代,服务器主要承载的是对可用性和可靠性要求不高的业务应用,如ERP、OA、CRM或MES等。随着智能制造的推进,传统业务系统向工业现场延伸,服务器正在承担起越来越多的场景功能,这些场景不仅智能化程度越来越高,计算需求越来越密集,而且对实时性要求也很高。

比如在工业智能化控制系统中根本不允许出现任何故障问题,因为这可能带来一系列重大工业安全事故。在无人自动化驾驶系统中,时刻需要采集和分析周边环境数据并进行实时分析,及时反馈到中控系统以保障自动驾驶过程的安全。因此,时代对硬件性能的要求不同了。作为服务器厂商,必须适应由故障恢复到故障预防的趋势变化,打造容错性能更好的服务器平台。

在早期计算机系统不是特别可靠的情况下,为做到故障预防,企业通常采用的是双机容错机制,即购买两台配置完全一样的服务器冗余级联,一旦主机出现故障,就快速切换到从机上,从而保证业务的正常运营。但这种部署方式不仅成本高、效率低,而且实施过程十分复杂,一旦出现断电等意外情况,就完全无抵抗力。

那么,怎么才能保证在部署成本更低、实施更简单的前提下,让系统具备更好的容错性能?全球容错技术领导厂商Stratus是这么做的!

上图是Stratus公司打造的一种全面集成的持续可用性平台——ftServer,为企业关键应用提供更稳定可靠的平台。

为保障平台的高可靠性和可用性,ftServer通过部署一对冗余节点,两个相同的客户可更换单元(CRU)——其中每一个客户可更换单元均有自己的处理器、内存和存储。所有冗余组件和子系统打包为单一系统,从而降低了许可成本并简化了管理。

Stratus具有独特的冗余现场可编程门阵列、数据路径和同步固件,即使硬件组件出现故障,也能够提供确保持续可用性所需的处理器同步、数据复制和逻辑,系统会在不同节点间自动复制数据。一个节点发生故障时,运行在上面的虚拟机会自动在另一个节点上重启(高可用性模式)或恢复(容错模式)。

同时,为增强平台的兼容性并降低成本,ftServer不仅使用通用化的x86芯片组、DIMM和驱动器,还使用标准分发包装的操作系统和虚拟化软件,从而简化了管理并缩短了价值实现时间。ftServer自动化的自监控、告警、自诊断和补救功能是通过主动服务架构实现的。通过简化ftServer监控和管理,以及筛选需要釆取行动的问题,Stratus可节省公司时间以及减少工作量。

为尽可能减少停机维护时间,ftServer旨在实现服务性,它的可热插拔CRU无需关闭系统即可拔下,并且无需使用特殊工具即可更换。这一点以及自动数据重新同步使ftServer适于在远程制造位置或IT资源有限的位置部署。

对IT硬件系统而言,没有绝对的可靠性,只有相对的可用性。容错性的目标是预防故障,可用性的目标是恢复故障,目标虽然不一致,但是殊途同归。随着工业智能化时代的开启,就当前企业需求看,“预防故障”显然比“故障恢复”更有吸引力,因为在不确定、复杂性的时代,企业更希望能提前掌握不可预知的风险,让一切可控。

原文标题:观察|漫谈高可用性与容错性

文章出处:【微信公众号:工业IoT】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • IT
    IT
    +关注

    关注

    2

    文章

    959

    浏览量

    65545
  • 容错
    +关注

    关注

    0

    文章

    28

    浏览量

    15121

原文标题:观察|漫谈高可用性与容错性

文章出处:【微信号:IndustryIOT,微信公众号:工业互联网前线】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    这款嵌入式工控机,它到底在哪?

    “批量部署”的优选,既能满足复杂场景需求,又能大幅降低开发门槛,让产品应用落地更高效。   现在,让我们一起来看下,它到底有何过人之处? ▍常用接口“全配齐” 开发者最烦“接口不够”?而这款嵌入式工控机直接把工业
    的头像 发表于 12-03 11:11 121次阅读
    这款嵌入式工控机,它<b class='flag-5'>到底</b><b class='flag-5'>牛</b>在哪?

    5G网络通信哪些技术痛点?

    ,这些技术使得5G网络能够满足未来物联网、智能制造、自动驾驶等领域对高速、低时延、高可靠性的通信需求。 5G网络通信哪些技术痛点?
    发表于 12-02 06:05

    汉威科技薄膜铂电阻温度传感器到底有多强

    测量温度简单吗?简单却也不简单,为了测得准,人类已经努力了上千年!薄膜铂电阻温度传感器到底有多强?为何是高端温度传感器的代表?
    的头像 发表于 11-28 11:51 500次阅读

    电磁干扰“江湖三兄弟”:EMC、EMI、EMS 到底有啥区别?

    电磁干扰“江湖三兄弟”:EMC、EMI、EMS 到底有啥区别?
    的头像 发表于 08-20 15:16 1841次阅读
    电磁干扰“江湖三兄弟”:EMC、EMI、EMS <b class='flag-5'>到底有</b>啥区别?

    性能强就强吗?启明智显5G CPE直接用实测数据说话!

    谁家卖产品都会说自己的产品厉害,但是拿到手就翻车,也就那么回事。我们也经常说启明智显5GCPE性能有顶,性价比多高。光说也说服不了人
    的头像 发表于 07-01 18:03 1920次阅读
    你<b class='flag-5'>说</b>性能强就强吗?启明智显<b class='flag-5'>5</b>G CPE直接用实测数据说话!

    漫画科普 | 功率放大器到底有哪些应用?带你解锁功放经典应用场景!(一)

    漫画科普 | 功率放大器到底有哪些应用?带你解锁功放经典应用场景!(一)
    的头像 发表于 06-20 20:00 780次阅读
    漫画科普 | 功率放大器<b class='flag-5'>到底有</b>哪些应用?带你解锁功放经典应用场景!(一)

    超低功耗蓝牙模组的功耗到底有

    对于BLE(低功耗蓝牙)产品方案来说,功耗低,决定着你的产品待机、使用寿命是多久,或者是多久需要充一次电,推荐一非常的好用的评估nordicBLE功耗的工具: 利用我们的这个工具,只需要把你
    发表于 05-27 22:37

    实测 PTR54LS05低功耗到底有

    实测 PTR54LS05低功耗到底有低?
    发表于 04-27 10:57

    智能盒子到底是什么东西?昇腾310深度测评:为何能成为行业新宠?

    让人摸不着头脑的“智能盒子”。各位搞技术、搞工程的朋友,咱们在工作中是不是经常听到“智能盒子”这个说法?每次听到这个词,我猜很多人心里都在犯嘀咕:这东西到底啥玩意儿?难道就是装了
    的头像 发表于 04-27 10:46 1499次阅读
    智能盒子<b class='flag-5'>到底</b>是什么东西?昇腾310深度测评:为何能成为行业新宠?

    电烙铁焊锡到底有没有毒

    电烙铁焊锡到底有没有毒?无铅?铅? 电烙铁焊锡有毒吗? 网友吐槽称,他在PCB工厂用电烙铁焊锡一年整了,都感觉到身体开始不舒服了,腹部有点胀,焊锡有毒吗?是不是会铅中毒。 其实这个还要看工作中
    的头像 发表于 02-12 09:27 4991次阅读

    TLC2578芯片中FS与SDI到底有什么作用?

    ,还有就是一点不太懂的就是:TLC2578芯片中FS与SDI到底有什么作用。手册看了半天还是不懂!求解!谢谢!
    发表于 01-22 06:51

    RK3506到底有多香?抢先看核心板详细参数配置

    RK3506到底有多香?触觉智能已推出RK3506核心板,抢先了解核心板详细参数配置!
    的头像 发表于 01-18 11:33 3196次阅读
    RK3506<b class='flag-5'>到底有</b>多香?抢先看核心板详细参数配置

    24位或者高分辨率的AD到底有什么用呢?

    的AD,如24位的AD,其分辨率达到很低的uV级别,我们如何考究其精度?而且AD的精度受到诸多因素的影响,其中参考源的稳定度和供电电源的稳定度对精度影响很大,参考源最低0.05%的精度,那么24位的分辨率所可以达到的精度却是要大打折扣的,请问在这样的情况下,24位或者高分辨率的AD
    发表于 01-07 06:49

    差分输入和和单端输入在本质上到底有什么区别?

    和和单端输入在本质 上到底有什么区别? 因为,ADC采集的信号说到底是AINP - AINN,不管单端还是差分,采集的信号都是这两pad的差值。 2:将单端信号接在ADC的差分输入接口上可以用
    发表于 12-23 07:31

    TFP401APZP到底有没有HSYNC输出?

    请教下TI的大牛,TFP401APZP这颗IC到底有没有HSYNC输出?实测发现HSYNC无输出,是要做什么设置么?!
    发表于 12-20 07:28