0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

2021GOPS全球运维大会落幕七牛云分享AIOps探索经验

话说科技 来源:话说科技 作者:话说科技 2022-01-11 10:10 次阅读

11月19日,为期两天的2021 GOPS全球运维大会完美落幕。大会由高效运维社区(GreatOPS)和开放运维联盟(OOPSA)、RPA时代社区联合主办,于上海举行。七牛云受邀出席了此次大会,七牛云运维架构师敖文武在会中为大家分享了七牛云关于AIOps的探索与实践经验。

2021 GOPS全球运维大会,主要面向运维行业的中高端技术人员,目的在于帮助运维人员系统学习了解相关知识体系,让创新技术推动社会进步。七牛云成立至今始终坚定不移地推动开发者生态的建设。七牛云团队运营着数十个面向开发者的社群,主张技术共享并发起各类技术传播的活动,如架构师实践日、Niu Talk 数据科学系列论坛等,在全球开发者社区有着深远的影响力和领导力,对AIOps也进行了探索、实践与思考,拥有着丰富的行业经验。

七牛云敖文武分别从 AI 和运维 OPS 的关系、七牛云内部AIOps探索和实践、七牛云对AIOps的思考与总结分三个方面进行了讲解与分享。敖文武指出,运维在故障处理流程中的各个环节,如问题发现、检测、分析、根因定位和响应处理等,其中在整个流程中根因定位分析所占时间长达 60%,严重依赖运维专家的知识和经验。而七牛云「PISA」产品,能够进行梳理数据建模分析,构建出关键业务调用链路,并通过动态阈值计算,预测未来服务分数等算法能力。实现快速根因定位,有效缩短MTTR 40%,并逐步在运维内部落地,进一步优化了根因定位分析占时长的问题。

从运维角度,为什么需要 AIOps?

poYBAGHc5viAGy6LAAB0Ae5TFxo22.jpeg

整个故障处理过程中,问题定位所需要的时间占比达到 60%。

在实践中,MTTK (Mean Time to Know) 环节严重依赖运维专家的知识和经验,且难以口口相传,这也从一定程度上影响了实践的效果与人才的培养。

所以,我们需要一种方法将专家知识和经验沉淀下来,实现更加高效的定位和决策。

七牛云内部的探索和实践

内部在 AIOPS 上针对如何快速定位问题上做了一些探索和落地实践:

系统可观测性

依托“PISA”智能服务分析,构建系统可观测性。SRE 专家经验知识沉淀,加速问题定位。

业务健康评分

多维度 KPI 指标占比评分计算,主动综合预测业务健康和趋势预测。

告警智能降噪

针对不同告警规则做指标数据分类,降低告警风暴,提升告警准确度。

动态阈值

静态指标弊端很多,无法适应流量峰值周期,集群规模一直在变化。静态的阈值要么是设置过低、要么是过高。所以我们采用时序检测算法、训练指标历史数据,有效识别周期性异常波动。

pYYBAGHc5viANHbtAABC-6myGXc68.jpeg

可观测性核心要素:1、Metrics 指标性统计

度量应用某一类信息的正确率、成功率、流量等,这是我们常见的应用单个统计聚合。2、Tracing 分布式追踪

一次请求的范围,服务于服务,服务于组件之间的依赖追踪。3、Logging 日志记录

程序在执行的过程中间发生了一些日志,会包含报错信息、堆栈信息等详细日志内容。

poYBAGHc5vmAc7uWAAEFQvv5FCg13.jpeg

基于七牛云 Pandora 平台,构建智能运维分析工具「PISA」。「PISA」针对企业在数字信息化过程中,业务系统与 IT 系统割裂,面对IT 人员分析问题难,解决问题耗时长,各类监控软件数量繁多但无法协同等问题现状,需要有效连接企业的业务系统和 IT 系统,通过提升整体的可观测性、实时洞察隐患、快速根因定位、提前预知故障等手段,才能帮助企业提高系统稳定和减少损失。将传统的被动式运维变成主动式运营,让数据产生更高价值。

除此之外,在平台机器学习工具包上,还集成了大量的算法、能够进行管理模型和快速验证。虽然工程师直接做算法存在门槛,但却可以参与模型的训练,也能通过不同条件组合进行参数调整,特征优化以追求更好的效果表达。关于我们自己的思考和总结

pYYBAGHc5vmAVxc-AABifKGDuLc35.jpeg

数据维度越全面越好。

所有数据标准化越规范统一越好。

第三,场景(知识)越深入越好。如果本身对运维场景理解不是特别深,不理解场景当成产品功能去做的话,只能做出一个完整的产品功能,但很大概率上无法直接落地。因为线上环境复杂多元,而且非常依赖运维专家的能力和经验。AIOps 能够顺利落地,一定是在 SRE 或 DevOps 最佳实践中升华而来。

如何借助AI能力与运维场景进行一个数据维度全面、数据标准规范统一、场景知识深入的深度结合并顺利落地实现,是七牛云对AIOps的深刻思考与理解。

审核编辑:符乾江

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26486

    浏览量

    264136
  • 机器学习
    +关注

    关注

    66

    文章

    8136

    浏览量

    130649
收藏 人收藏

    评论

    相关推荐

    深南电路2024年全球合作伙伴大会在广州圆满落幕

    4月11日,深南电路2024年全球合作伙伴大会在广州召开。大会以“数智驱动发展 技术共创未来”为主题,深南电路高层管理者与100多家全球核心合作伙伴代表,及深南相关部门骨干员工出席
    的头像 发表于 04-14 09:36 270次阅读

    商汤科技作亮相2024全球开发者先锋大会

    2024全球开发者先锋大会(GDC)在上海圆满落幕。商汤科技作为业内翘楚,其大装置执行总监成功和产品总监陈希受邀参加了此次大会的分论坛活动,就大模型前沿开发、智能计算创新等议题发表了深
    的头像 发表于 03-29 10:24 223次阅读

    Nullmax出席全球开发者先锋大会同期活动分享新一代自动驾驶形态思考

    3月23日-24日,2024全球开发者先锋大会(GDC)在上海举行。由岩山科技旗下岩芯数智主办的大会同期活动“大模型技术创新与应用探索讲坛”顺利召开,来自政、企、学各界的专家与领军人物
    的头像 发表于 03-26 10:17 150次阅读

    华为发布5G-A八大创新实践,助力全球运营商因地制宜

    MWC24 巴塞罗那期间,华为发布了5G-A八大创新实践,助力全球运营商因地制宜,基于自身网络情况多路径构建5G-A网络。
    的头像 发表于 02-29 10:00 220次阅读

    Commvault SHIFT大会·中国站圆满落幕

    1月18日,Commvault SHIFT 大会 · 中国站圆满落幕!本次大会以“驱动网络弹性新转变”为主题,Commvault携手行业专家,通过主题演讲、客座分享、观点碰撞等形式,为参会者带来网络弹性前沿趋势、创新方法和最佳实
    的头像 发表于 01-23 14:46 497次阅读

    【限量门票】繁荣生态,人才先行︱首届OpenHarmony人才生态大会即将在上海召开

    OpenHarmony人才生态大会,交流碰撞人才培养思路,共享最新人才培养实践案例。期待更多的高校、伙伴与贡献者加入OpenHarmony社区,探索OpenHarmony的未来方向。 报名至现场参会可获得精美礼品
    发表于 12-04 16:30

    【报名开启】繁荣生态,人才先行︱首届OpenHarmony人才生态大会即将在上海召开

    探索交流。 产业发展离不开人才培养,为培养更多创新型人才,壮大OpenHarmony生态新兴力量,生态伙伴联合高校共同打造人才培养闭环生态链。本次大会大咖云集,将邀请高校教师、共建单位伙伴、社区专家
    发表于 12-04 16:23

    邀请函 | 安富利邀您参加艾迈斯欧司朗探索大会2023

    光芒万丈,感知未来! 安富利邀请您参加 艾迈斯欧司朗探索大会 ams OSRAM Technology Forum 恭请各位莅临现场 11月29日 期待与您邂逅在深圳! 大会将重点探讨 汽车出行
    的头像 发表于 11-20 15:50 286次阅读
    邀请函 | 安富利邀您参加艾迈斯欧司朗<b class='flag-5'>探索</b>者<b class='flag-5'>大会</b>2023

    打造智能化运维极致体验 软通动力AIOps体系亮相GOPS全球运大会

    10月26-27日,由高效运维社区(GreatOPS)和 DevOps 时代社区联合主办的GOPS 全球运大会(第二十一届)在上海召开。软通动力受邀参与本次盛会, 高级架构师靳秋出席“AIO
    的头像 发表于 10-28 16:10 298次阅读

    创新驱动未来 全球新能源汽车扁线电机产业大会圆满落幕

    产业大会 于 9月21日 在 上海嘉定凯悦酒店 圆满落幕大会汇聚了众多政府协会、海内外新能源汽车、整车厂、电机厂、扁线电机原材料、扁线电机设备厂及自动化产线、检测机构、扁线电机工艺制造及相关技术提供商、院校/研究机构、投资机
    发表于 10-07 14:15 371次阅读
    创新驱动未来 <b class='flag-5'>全球</b>新能源汽车扁线电机产业<b class='flag-5'>大会</b>圆满<b class='flag-5'>落幕</b>

    以实践拓边界,2023年第四届轻流无代码探索大会圆满落幕

    2023年7月6日,由轻流主办的千人规模线下盛会「无代码·无边界 2023·76Day|轻流无代码探索大会」于上海顺利举行。本届大会以“无代码实践”为主题,以“1+7”的会议形式:一场主会加七大
    的头像 发表于 07-10 18:09 181次阅读
    以实践拓边界,2023年第四届轻流无代码<b class='flag-5'>探索</b>者<b class='flag-5'>大会</b>圆满<b class='flag-5'>落幕</b>

    2023年第四届无代码探索大会,轻流邀您一同聆听无代码数字化实践分享

    7月6日,轻流第四届76Day无代码探索大会将回归线下,于上海盛大举办。 据悉,此届无代码探索大会将以“实践”为核心,聚焦无代码技术,召集HR、CTO、CEO等不同角色的职场个体,
    的头像 发表于 06-20 16:01 358次阅读

    相约7月6日,轻流第四届无代码探索大会即将在上海开幕

    7月6日,轻流第四届76Day无代码探索大会将回归线下,于上海盛大举办。 据悉,此届无代码探索大会将以“实践”为核心,聚焦无代码技术,召集HR、CTO、CEO等不同角色的职场个体,
    的头像 发表于 06-19 11:20 454次阅读

    扬杰科技||CESC中国(江苏)国际储能大会圆满落幕

    扬杰科技 YANGJIETECHNOLOGY CESC国际储能展完美落幕   展会概况       2023年6月14日至16日,为期三天的CESC中国(江苏)国际储能大会暨智慧储能技术及应用展览会
    的头像 发表于 06-17 17:45 579次阅读
    扬杰科技||CESC中国(江苏)国际储能<b class='flag-5'>大会</b>圆满<b class='flag-5'>落幕</b>

    美国柏恩获颁2022 全球运营卓越奖

    美国柏恩 Bourns 全球知名电子组件领导制造供货商,今日宣布获颁全球知名代理商 TTI, Inc. 所颁发的最高荣誉- 2022 全球运营卓越奖。该奖项的设计是 TTI, Inc. 对供货商
    的头像 发表于 05-18 14:40 394次阅读