0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

华为云服务治理 | 服务治理的一般性原则

与时俱进的科技 来源:与时俱进的科技 作者:与时俱进的科技 2023-01-18 18:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

华为云服务治理 | ** 服务治理的一般性原则**

服务治理通常是指通过限流、熔断等手段,保障微服务的可靠运行,即运行时治理。更加宽泛的服务治理还包括微服务持续集成(开源软件管理、自动化测试等),微服务部署最佳实践(滚动升级、灰度发布等),微服务可观测性能力(日志、监控、告警等)构建等。

华为云微服务治理专题主要探讨运行时治理。接下来我们探讨故障处理的一般性原则。

故障识别

在用户看来,故障场景和正常场景是非常容易区分的。在服务治理的角度,识别故障则非常困难。

以调用超时为例,产生调用超时的原因非常多,包括:(1)服务端部分接口处理慢,导致超时,而其他接口处理正常;(2)服务端故障,网络不可达,可能是短暂的,也可能是持续的;(3)服务端内存、CPU高,导致处理变慢;(4)大量并发请求在服务端排队,当请求被处理的时候,已经超过了很长的时间;(5)客户端并发建立连接,内存、CPU增高,导致请求握手超时等。这些不同类型的错误,从调用者看起来,都体现为一样的行为。

以错误码为例,服务端返回503错误,也可能包含很多不一样的原因。比如系统未就绪,正在启动过程中,下次重试就可以访问;或者服务出现内存泄漏等原因,导致无法进行响应;当服务内部的一些部件不可用的时候,也可能返回503错误码。

基于上述原因,服务治理能够识别少量的故障类型,而无法识别更细维度的故障原因。

故障反馈

高并发场景下,相对于单个请求处理的时延,故障反馈过程非常缓慢。比如单个请求处理只需要几个毫秒,但是检测到请求超时,至少需要几秒时间。如果减少超时时间,检测就会变得很不准确,通常会由于系统调度延迟,让超时时间出现大范围的波动。而且请求超时会触发一些系统资源,比如HTTP连接的关闭和重建,引起更大范围的超时。再比如依赖于CPU、内存或者请求TPS的监控数据,一般是通过异步线程在后台周期性进行统计实现的,当统计数据反馈到服务治理策略的时候,相比较请求时延,已经过去很长时间了,这个时候再去实施治理策略,得到的反馈数据已经不足以支持治理策略的实施。

服务治理的一般原则

故障识别困难、故障反馈缓慢导致了在故障场景下,不能像处理正常功能逻辑一样,通过复杂的逻辑,比如转移故障、采集更多历史数据计算最优解等保障本次请求尽可能成功。也不能假设一个实际无法模拟验证的故障,然后针对这个故障进行保护。

服务治理策略需要结合大量的实践来进行验证,总结起来有几个非常核心的原则:

· 快速失败优先于保障本次请求成功。通过快速失败降低故障的影响时间,减少故障对于系统资源的占用,让系统能够快速恢复到正常的处理水平。

· 治理策略的逻辑应该采用无状态算法,不依赖于其他微服务或者中间件,只依赖于本服务的内部状态就能够实施,避免依赖于复杂的错误检测机制。这个原则使得服务治理的策略依赖于相对实时的故障数据,减少治理策略本身的处理时间,让治理策略的前提和结果变得更好预测。

· 治理策略的实施条件和结果必须可以通过模拟的方式进行验证。虽然故障识别是非常困难的,但是任何治理策略都需要假设他出现的场景是什么,这个场景发生的时候,故障表现是什么,依赖于故障场景、故障表现来执行治理策略,并且可以评估不同治理策略对同样的故障场景和故障表现得出的保护效果。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    218

    文章

    36312

    浏览量

    263039
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    代微服务全家桶AlibabaCloud+SpringCloud实战

    ,是套 跨治理体系 。 第层:跨服务网格。 Istio或MSP已经支持多集群联邦。你的微
    发表于 05-18 17:04

    华为发布全球政务服务解决方案,助力全球政务服务和城市治理全面开启智能化

    的未来图景。活动期间,华为重磅发布"网智办"政务服务全球解决方案,助力全球政务服务和城市治理全面开启智能化。 在国家政务
    的头像 发表于 03-06 16:53 1156次阅读
    <b class='flag-5'>华为</b>发布全球政务<b class='flag-5'>服务</b>解决方案,助力全球政务<b class='flag-5'>服务</b>和城市<b class='flag-5'>治理</b>全面开启智能化

    深化阿里生态合作 优化治理能力再获权威认可

    前言2026年2月5日,阿里上海大区合作伙伴年度颁奖仪式圆满举办,科技凭借在优化治理领域的深厚技术积淀、丰富的行业落地成果与卓越的
    的头像 发表于 02-09 17:29 1265次阅读
    深化阿里<b class='flag-5'>云</b>生态合作 <b class='flag-5'>云</b>优化<b class='flag-5'>治理</b>能力再获权威认可

    什么是企业服务器-计算

    企业服务器是指为企业提供的基于计算技术的服务器解决方案。华纳
    的头像 发表于 12-29 17:57 1255次阅读

    服务交易评价

    用户在元服务的交易决策,同时也能帮助开发者了解用户反馈,促进服务质量的改进。 功能覆盖范围 在华为应用市场上架的元服务。 已开通华为支付。
    发表于 12-29 10:35

    知声荣获2025人工智能治理示范案例

    服务业协会联合组织征集的《北京人工智能治理案例集》在会议期间正式发布。知声"基于医疗大模型和医学知识图谱技术打造可信可靠的医学AI应用"凭借其创新的技术架构和卓越的治理实践,荣获"人
    的头像 发表于 11-10 17:28 1127次阅读

    四维图新亮相2025国际前瞻人工智能安全与治理大会

    日前,2025国际前瞻人工智能安全与治理大会在北京举行。作为数据治理领域的典型代表,四维图新打造的“‘车’数据协同治理,赋能车企高质量发展”案例(以下简称案例),入选《人工智能
    的头像 发表于 11-08 17:20 1625次阅读

    华为推动宜兴城市安全治理范式转型

    随着我国城市化进入深度发展阶段,城市安全治理已成为关乎民生福祉和城市可持续发展的核心议题。城市安全建设正从单风险防控向多领域渗透、深层次突破的多元化阶段转型,亟需通过智能化手段破解数据孤岛、协同壁垒等难题。在此背景下,人工智能与城市
    的头像 发表于 10-30 11:09 963次阅读

    华纳VPS容器服务网格流量管理:实现微服务高效路由

    网格技术优化香港VPS的流量管理,从东西向流量控制到金丝雀发布实施,全方位解析提升服务稳定性与安全的核心策略。无论您是运维工程师还是架构师,这些实战经验都将帮助您在跨境业务部署中实现更精细的服务
    的头像 发表于 10-16 17:09 727次阅读

    中兴通讯数据治理能力获得国际权威认可

    近日,在杭州举办的2025全球数据管理峰会上,中兴通讯凭借其领先的企业级数据治理体系与卓越实践,荣膺大会颁发的“数据治理最佳实践奖”,标志着其数据治理能力获得国际权威认可。
    的头像 发表于 10-15 17:18 1649次阅读

    如何评估谐波治理措施的效果?

    评估谐波治理措施的效果,需围绕 “ 合规、设备保护、经济、稳定性 ” 四大核心目标,通过 “数据对比、设备监测、经济核算、长期跟踪” 多维度验证,确保治理后谐波含量符合国标要求,且
    的头像 发表于 10-14 17:04 1285次阅读

    华为发布全新升级星河AI MSP服务解决方案

    华为数据通信创新峰会2025(HNS 2025)欧洲站期间,MSP(Managed Service Provider,管理服务提供商)高层圆桌会议在慕尼黑成功举办。会上,华为发布全
    的头像 发表于 10-13 09:44 1178次阅读

    软通动力携手华为推出AI知识引擎与数据工程融合创新解决方案

    华为开发者大会2025中,软通动力携手华为华为昇腾AI、盘古大模型、ModelArts等为技术底座,全新升级数据
    的头像 发表于 06-28 17:07 1864次阅读

    华为开发者大会2025(HDC 2025)亮点:华为发布盘古大模型5.5 宣布新代昇腾AI服务上线

    HarmonyOS、昇腾AI服务、盘古大模型等最新科技创新成果。 在主题演讲中,华为常务董事、华为计算CEO张平安宣布基于CloudMa
    的头像 发表于 06-20 20:19 4803次阅读
    <b class='flag-5'>华为</b>开发者大会2025(HDC 2025)亮点:<b class='flag-5'>华为</b><b class='flag-5'>云</b>发布盘古大模型5.5 宣布新<b class='flag-5'>一</b>代昇腾AI<b class='flag-5'>云</b><b class='flag-5'>服务</b>上线

    电压暂降(晃电)危害解析与末端治理实践:安科瑞ARD系列抗晃电装置解决方案

    电压骤降从电力供应源头治理到整条生产线的治理、设备级的治理,再到设备控制级的治理治理费用以数量级的比例下降。因此从
    的头像 发表于 06-11 09:15 1389次阅读
    电压暂降(晃电)危害解析与末端<b class='flag-5'>治理</b>实践:安科瑞ARD系列抗晃电装置解决方案