0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

2021GOPS全球运维大会落幕七牛云分享AIOps探索经验

话说科技 来源:话说科技 作者:话说科技 2022-01-11 10:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

11月19日,为期两天的2021 GOPS全球运维大会完美落幕。大会由高效运维社区(GreatOPS)和开放运维联盟(OOPSA)、RPA时代社区联合主办,于上海举行。七牛云受邀出席了此次大会,七牛云运维架构师敖文武在会中为大家分享了七牛云关于AIOps的探索与实践经验。

2021 GOPS全球运维大会,主要面向运维行业的中高端技术人员,目的在于帮助运维人员系统学习了解相关知识体系,让创新技术推动社会进步。七牛云成立至今始终坚定不移地推动开发者生态的建设。七牛云团队运营着数十个面向开发者的社群,主张技术共享并发起各类技术传播的活动,如架构师实践日、Niu Talk 数据科学系列论坛等,在全球开发者社区有着深远的影响力和领导力,对AIOps也进行了探索、实践与思考,拥有着丰富的行业经验。

七牛云敖文武分别从 AI 和运维 OPS 的关系、七牛云内部AIOps探索和实践、七牛云对AIOps的思考与总结分三个方面进行了讲解与分享。敖文武指出,运维在故障处理流程中的各个环节,如问题发现、检测、分析、根因定位和响应处理等,其中在整个流程中根因定位分析所占时间长达 60%,严重依赖运维专家的知识和经验。而七牛云「PISA」产品,能够进行梳理数据建模分析,构建出关键业务调用链路,并通过动态阈值计算,预测未来服务分数等算法能力。实现快速根因定位,有效缩短MTTR 40%,并逐步在运维内部落地,进一步优化了根因定位分析占时长的问题。

从运维角度,为什么需要 AIOps?

poYBAGHc5viAGy6LAAB0Ae5TFxo22.jpeg

整个故障处理过程中,问题定位所需要的时间占比达到 60%。

在实践中,MTTK (Mean Time to Know) 环节严重依赖运维专家的知识和经验,且难以口口相传,这也从一定程度上影响了实践的效果与人才的培养。

所以,我们需要一种方法将专家知识和经验沉淀下来,实现更加高效的定位和决策。

七牛云内部的探索和实践

内部在 AIOPS 上针对如何快速定位问题上做了一些探索和落地实践:

系统可观测性

依托“PISA”智能服务分析,构建系统可观测性。SRE 专家经验知识沉淀,加速问题定位。

业务健康评分

多维度 KPI 指标占比评分计算,主动综合预测业务健康和趋势预测。

告警智能降噪

针对不同告警规则做指标数据分类,降低告警风暴,提升告警准确度。

动态阈值

静态指标弊端很多,无法适应流量峰值周期,集群规模一直在变化。静态的阈值要么是设置过低、要么是过高。所以我们采用时序检测算法、训练指标历史数据,有效识别周期性异常波动。

pYYBAGHc5viANHbtAABC-6myGXc68.jpeg

可观测性核心要素:1、Metrics 指标性统计

度量应用某一类信息的正确率、成功率、流量等,这是我们常见的应用单个统计聚合。2、Tracing 分布式追踪

一次请求的范围,服务于服务,服务于组件之间的依赖追踪。3、Logging 日志记录

程序在执行的过程中间发生了一些日志,会包含报错信息、堆栈信息等详细日志内容。

poYBAGHc5vmAc7uWAAEFQvv5FCg13.jpeg

基于七牛云 Pandora 平台,构建智能运维分析工具「PISA」。「PISA」针对企业在数字信息化过程中,业务系统与 IT 系统割裂,面对IT 人员分析问题难,解决问题耗时长,各类监控软件数量繁多但无法协同等问题现状,需要有效连接企业的业务系统和 IT 系统,通过提升整体的可观测性、实时洞察隐患、快速根因定位、提前预知故障等手段,才能帮助企业提高系统稳定和减少损失。将传统的被动式运维变成主动式运营,让数据产生更高价值。

除此之外,在平台机器学习工具包上,还集成了大量的算法、能够进行管理模型和快速验证。虽然工程师直接做算法存在门槛,但却可以参与模型的训练,也能通过不同条件组合进行参数调整,特征优化以追求更好的效果表达。关于我们自己的思考和总结

pYYBAGHc5vmAVxc-AABifKGDuLc35.jpeg

数据维度越全面越好。

所有数据标准化越规范统一越好。

第三,场景(知识)越深入越好。如果本身对运维场景理解不是特别深,不理解场景当成产品功能去做的话,只能做出一个完整的产品功能,但很大概率上无法直接落地。因为线上环境复杂多元,而且非常依赖运维专家的能力和经验。AIOps 能够顺利落地,一定是在 SRE 或 DevOps 最佳实践中升华而来。

如何借助AI能力与运维场景进行一个数据维度全面、数据标准规范统一、场景知识深入的深度结合并顺利落地实现,是七牛云对AIOps的深刻思考与理解。

审核编辑:符乾江

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38085

    浏览量

    296331
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136216
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    2025乐鑫科技全球开发者大会圆满落幕

    2025 年 11 月 25–26 日,第四届乐鑫全球开发者大会圆满落幕。两天时间里,围绕 “从到端的智能创新”,乐鑫科技 (688018.SH) 携手
    的头像 发表于 12-05 10:35 162次阅读

    恩智浦受邀出席第全球IC企业家大会

    日前,第二十二届中国国际半导体博览会(IC China 2025)在北京顺利举办。恩智浦半导体副总裁袁文博受邀出席了同期举办的第全球IC企业家大会,并围绕全球半导体发展趋势、边缘A
    的头像 发表于 12-04 10:44 526次阅读

    奥托立夫亮相第届汽车新供应链大会

    2025年11月25-26日,第届汽车新供应链大会在上海成功举办。本届大会以“新质引领・竞合共生”为主题,汇聚全球汽车供应链领域的领军人物,共同探讨新质生产力如何重塑研发制造、锻造核
    的头像 发表于 11-28 17:45 1339次阅读

    2025格科全球合作伙伴大会圆满落幕

    2025年10月31日,格科全球合作伙伴大会在浙江嘉善圆满落幕。来自政府的领导、国内外知名品牌终端、代理商、模组厂、平台合作伙伴等核心客户,以及国内外的晶圆制造、镀膜、封测、半导体设备、材料、软硬件服务等合作伙伴代表齐聚一堂,共
    的头像 发表于 11-05 17:25 570次阅读

    魔视智能亮相2025奇瑞全球创新大会

    近日,以“创新·智领全球”为主题的奇瑞全球创新大会在安徽芜湖隆重举行。大会围绕“全球共研、全球
    的头像 发表于 10-29 16:30 431次阅读

    2025四图新Evolution创想大会共话场LIVE圆满落幕

    10月28日,2025四图新Evolution创想大会在北京举办,以“AI与汽车智能化的交织创想”为主题的共话场LIVE同期举办。本次共话场论坛汇聚了来自整车企业、智能驾驶科技公司、车联网科技公司
    的头像 发表于 10-29 14:57 1391次阅读

    图新精彩亮相2025云栖大会

    9月24日,全球数字技术领域年度盛会2025云栖大会在杭州云栖小镇国际会展中心正式拉开帷幕。作为智能出行领域的先进企业,四图新受邀参展,并与战略合作伙伴阿里携手亮相前沿应用馆3号馆
    的头像 发表于 09-25 16:50 622次阅读

    图新邀您共赴2025云栖大会

    2025云栖大会将于9月24日-26日在杭州云栖小镇国际会展中心盛大启幕,以“智一体 碳硅共生”为主题,呈现科技与应用、商业与创新的深度融合。四图新将在3号馆重磅亮相,携智能出行领域领先技术与行业解决方案,与
    的头像 发表于 09-12 16:40 1885次阅读

    发布灵矽 AI:600ms超低延迟,重塑智能硬件语音交互新范式

    “功能附加”跃升为“核心必备竞争力”的开始。 据 Canalys 预测,2025 年全球个人智能音频设备出货量将突破 5.33 亿台。然而,尽管市场高速增长,但大多数语音交互体验产品依然普遍存在延迟高、功能封闭、情感缺失等问题。灵矽 AI 基于
    的头像 发表于 08-15 15:33 701次阅读
    <b class='flag-5'>七</b><b class='flag-5'>牛</b><b class='flag-5'>云</b>发布灵矽 AI:600ms超低延迟,重塑智能硬件语音交互新范式

    信诺2025产业生态伙伴大会圆满落幕

    近日,信诺在合肥举行“创新共生 质赢未来”2025产业生态伙伴大会,政府领导、业界专家、全球产业链伙伴齐聚一堂,共谋合作共赢新篇章。
    的头像 发表于 05-27 11:45 2849次阅读

    图新亮相2025大湾区车联网大会

    近日,2025第十一届中国(大湾区)车联网大会“第二届车路发展论坛”在广州举行,四图新受邀发表主题演讲,分享在车路领域的时空数据创新应用与探索
    的头像 发表于 05-16 18:10 748次阅读

    智慧城轨新标杆,上海兆越携重磅方案亮相轨交运大会

    中国城市轨道交通智慧运大会圆满落幕,上海兆越通讯携轨道交通智慧运网络通信方案参展,展示了端到端的通信网络,满足轨道交通运场景下的需求,
    的头像 发表于 05-16 15:09 705次阅读
    智慧城轨新标杆,上海兆越携重磅方案亮相轨交运<b class='flag-5'>维</b><b class='flag-5'>大会</b>

    软通动力闽港数字经济合作论坛暨A.I³探索大会圆满落幕

    此前,4月29-30日,第三届闽港经济合作论坛暨A.I³探索大会在福州数字中国会展中心圆满落幕。作为本次论坛的重要承办单位,软通动力以“全栈智能·生态共赢”为核心,通过前沿产品矩阵展示、战略布局发布、多维度合作签约等亮点环节,全
    的头像 发表于 05-08 14:35 580次阅读

    华为生态大会之智能驾驶用户大会 华为联合四图新共探车企智能化落地

    4月10日-11日,以“聚力共创,加速行业智能跃迁”为主题的华为生态大会2025在安徽芜湖举办。大会期间,作为重要战略合作伙伴,四图新受邀与华为
    的头像 发表于 04-11 09:26 1278次阅读
    华为<b class='flag-5'>云</b>生态<b class='flag-5'>大会</b>之智能驾驶用户<b class='flag-5'>大会</b> 华为<b class='flag-5'>云</b>联合四<b class='flag-5'>维</b>图新共探车企智能化落地

    2025新思科技SNUG全球用户大会即将开幕

    全球半导体行业年度科技盛会——2025新思科技SNUG全球用户大会,即将于太平洋时间2025年3月19至20日在美国圣克拉拉会议中心隆重举办。作为连续第35届SNUG全球
    的头像 发表于 03-19 11:32 858次阅读