0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

优秀的运维架构师需要具备什么

工程师人生 来源:工程师吴畏 2019-04-03 16:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

首先我们总结下,关于谈到何为一名合格的运维运营工程师,大概就是几点:

具备一定运营技能;要有运营意识;主动性要强;学习能力要跟得上。

大家都会发现这些条件基本是主观性方面的占的多一些,而与客观沾边的貌似只有一点:学习能力问题。运营技能差可以培养,运营意识差可以培养,主动性差也可以受环境影响,可以熏陶。

而学习能力完全是一个人综合能力的体现,这一点个人觉得客观性占绝大部分。最近发生的一系列事情,我颇有感触,合格与不合格的运营工程师就差在这里,接下来我就简单的跟大家分享一下。

回归到我们OPS生产线运营中来,大家分析一下自己的工作经历,都会发现我们之前做过一些“傻事”,比如:

运营过程中RM掉lib目录及关键的数据文件目录;Drop掉数据库,甚至就连自己远程管理的服务器,比如做一些安全策略等导致自己也连接不到自己的服务器,诸如此类。

这些都是大家成长的过程,通过时间的推移,我们都能吸取教训并总结经验。可以说大家都会经过“0”和“1”的过程,这些貌似我们都没有什么区分。

但是,大家有没有总结一下,“1”到“N”的过程,大家静下心来仔细想想,自己的“N”是个位数或者是十位数或者甚至是百位数,你会觉得有哪些感触呢?

我想里面就能体现你的经验,更重要的是从这些经验中学到了多少知识,这些将成为你的综合能力素质。

优秀的运维架构师

回归我们的主题,一名OPS架构师,学习能力占了主要一部分(其实其他行业包括任何事情等等这都是关键一点)。如果这块缺失,仅凭一些生产线的经验教训,而不去反思,并充中总结出更多的经验来,想成为一个架构师那都是不现实的。

那么优秀的OPS架构师我个人觉得有四部分组成:

具备一定的沟通和协调能力;

具有突发故障应急处理能力;

要有不断反思的能力;

要有很强的知新能力。

下面我们来具体说一下。

1. 沟通和协调能力

具备一定的沟通和协调能力,这个跟性格有关系,但是,做OPS久了你就会知道,如果你还没具备一定的沟通和协调能力,那么趁早撤出这个行业,因为这个职业不适合你。

我们从OPS的ITIL管理可以看到,几乎每个流程都是需要沟通和协调的。就拿最基本的变更管理来说,所有的产品上线最后一个关口就是要进入到生产线部署。

那么,如何协调好研发和测试等资源?做到合理的安排及变更过程中的井然有序?这个完全是OPS的架构师或者说运营工程师来驱动,他会影响变更的成败。

所以,如果每次变更总是有问题,那么就要找找自己的问题,这个跟技术能力没有多大的关系,关键在于你是否具备的沟通和协调资源的能力。

2. 突发故障应急处理能力

具备一定的突发故障的应急处理能力。这个要求比较高,其实,这个能力主要有两个体现:要有一定的技术能力;要有生产线运营经验。

技术能力,后天个人不断学习去获取;而生产线运营经验,这些都是血的教训得来的,这个就是之前我们说的“N”,不过,并不见得“N”越多越好:

而是“N”中,所有的事故或者事件类型的都不重复,或者说相关类型的不能重复,这是最好的。

也就是,我们要从之前教训中不断学习和武装自己,让自己变得更强大,每当有新的问题发生或者降临到你的身上,你具备快速的处理事件的一二三理念,很好的运用事故处理的343法则,这是应急处理的能力的关键点。

作为一名优秀的OPS架构师,毫无疑问以客户为导向,服务可持续性为宗旨,要做的事情就是,快速恢复服务,后续排查问题。这个看得简单,其实在实际运营中,往往被大家疏忽,所以,这点看,你是否具备了。

3. 不断反思的能力

具备反思能力,其实这点说的有点严重了。不过,我还是不得不唠叨几句。在OPS运营过程中,大家往往都会用任务太多了,事情太多了来搪塞自己、以及领导。

从来没有静下心来想想,我这段时间做了什么?有什么问题?需要有什么改进?还会有哪些问题会产生?等等这些问题,我们考虑了多少?不得而知。

设身处地的想想,如果你每天处在忙碌的工作中,除了身心疲惫,还会有什么?除了叹气还是叹气。如何改变这个局面,从泥潭中拔出来,不是靠别人,而是靠自己,只有自己想明白了,所有的问题都迎刃而解了。

优秀的OPS架构师,需要时刻关注自己所做的一切,要认真对待每一件事情,任何的生产线的架构调整、细节变化需要记录下来,一天工作下来需要给自己的脑子休息一下,让脑子想放电影一样过一下一天所经历的事情,哪些是痛点问题,哪些是意外,这些都要整理出来。

这样长年累月,你就会发现你的知识库就丰富了,应对生产线的能力也轻松的不少。如果现在你觉得生产线运营很累,那请歇歇脚,关注一下这方面的问题。

4. 很强的知新能力

具有很强的知新能力,这是一个优秀的OPS架构师必备条件,也是我为什么放到最后一点来讲的一个原因。一般情况下具备前面三个条基本具备了架构师的条件了,可以称得上是一个OPS架构师了。

那么,知新能力为什么这么重要?因为这关系到,是止步于“好”,还是变得“优秀”。

打个比方,好的棋盘手能够看到下一步对方怎么走,会走其中的两到三步,而优秀的棋盘手却能看到五步、十步或者更多,这就是好和优秀的区别。

优秀的架构师,在做好生产线运营的同时,他会花很大的尽力来优化平台架构,来驱动研发来改进平台,使之做得更好。

同时,他会结合生产线新运营特点及问题,会提出更适合平台运营的架构,让平台做的更好的扩展性,从而提高了这个OPS的运营效率。

另一方面,知新能力就是要有很强的同行业运营现状的分析能力,能够很快将市场上的新技术运用到我们的测试环境中,不断的储备自己的知识库,并驱动整个团队及相关的兄弟部门。

这一点看是很难,其实要做到并不难,难是难在你所维护的生产线稳定了没有?温饱问题解决了没有?如果还没解决,那离小康生活还有一段距离呢,那就先解决重点问题,做好架构师前面的三点,面包自然就会有了。

小结

好了,说了这么多,我简单总结一下,一个合格的运营工程师发展成一名合格的OPS架构师,到最后成为优秀的OPS架构师,需要经历风风雨雨,历尽艰辛万苦。

或许未来的某一天,当你静静的反思,你会发现你已经成功了,因为,你关注了过程,而不再是结果,所以,你收获了。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 架构师
    +关注

    关注

    0

    文章

    47

    浏览量

    4880
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    光伏电站管理系统这种管理模式的应用

    光伏电站管理系统针对不同光伏电站的模式、技术架构和功能模块有着不同的类别,其中各功能模块通过数据交互与流程衔接实现协同运作,来实现对
    的头像 发表于 11-18 15:40 177次阅读
    光伏电站<b class='flag-5'>运</b><b class='flag-5'>维</b>管理系统这种<b class='flag-5'>运</b><b class='flag-5'>维</b>管理模式的应用

    光伏电站智能平台是如何解决传统核心痛点的?

    通过建设光伏电站智能平台实现智能化管理,是应对传统模式痛点、提升电站综合效益的一种有
    的头像 发表于 11-04 17:41 442次阅读
    光伏电站智能<b class='flag-5'>运</b><b class='flag-5'>维</b>平台是如何解决传统<b class='flag-5'>运</b><b class='flag-5'>维</b>核心痛点的?

    Zabbix与Prometheus监控系统的对比

    在当今云原生和微服务架构盛行的时代,监控系统已成为工程不可或缺的核心工具。面对市场上众多监控解决方案,Zabbix和Prometheus作为两大主流选择,各自拥有独特的优势和适用
    的头像 发表于 09-18 14:57 397次阅读

    Ceph集群部署与完全指南

    作为一名资深工程,我见证了太多企业在存储架构选型上的纠结。传统的NAS/SAN方案成本高昂,扩展性差;而云存储又面临厂商锁定的风险。直到我深入研究Ceph后,才真正理解什么叫"软
    的头像 发表于 08-29 17:18 999次阅读

    设备管理信息化平台解决方案

    对于某些大型工厂来说,设备故障是需要尽量避免的,就算是出现故障也要尽快维护,避免影响到生产计划。某废气处理设备厂商便提供驻地的售后服务,安排工程轮流待在工厂进行运
    的头像 发表于 08-14 10:15 367次阅读
    设备<b class='flag-5'>运</b><b class='flag-5'>维</b>管理信息化平台解决方案

    三大核心网络设备的要点

    作为工程,熟练掌握网络设备的管理和维护是构建稳定IT基础架构的关键。本文将深入探讨交换机、路由器和防火墙这三大核心网络设备的
    的头像 发表于 07-22 16:35 733次阅读

    Tenstorrent 首席架构师:未来 RISC-V 会是计算机的主流

    强,适合定制化需求等。在 7 月 17 日第五届(2025)RISC-V 中国峰会的主论坛上,Tenstorrent 首席架构师 Wei-Han Lien 表示,Tenstorrent 投入了大量人力
    发表于 07-17 11:26 1399次阅读

    自动化工具Terraform和Ansible的区别

    在现代云原生时代,基础设施即代码(Infrastructure as Code,IaC)已成为工程的核心技能。面对复杂的多云环境和日益增长的基础设施需求,传统的手动配置方式已无法满足快速、可靠
    的头像 发表于 07-09 09:59 969次阅读

    AI集成管理平台的架构与核心构成解析

    在数字化转型浪潮下,企业IT基础设施规模不断扩大,系统架构日益复杂,传统依赖人工的模式面临着响应速度慢、故障定位难、成本高等诸多挑战
    的头像 发表于 06-12 17:04 561次阅读

    光伏管理系统架构设计及其应用分析

    数据监测、故障诊断、任务管理以及设备信息管理等,这些是光伏管理中的重点内容,一款专业的综合性管理平台,需要集成上述多种功能,才能实现
    的头像 发表于 06-10 11:34 480次阅读
    光伏<b class='flag-5'>运</b><b class='flag-5'>维</b>管理系统<b class='flag-5'>架构</b>设计及其应用分析

    选择光伏电站管理系统需要重点注意哪些?

    选择一款适合的光伏电站管理系统,对于光伏电站来说,不仅是提升智能管理水平的需要,同时也是促进效益增收的有效方法。因此根据电站的实际情
    的头像 发表于 06-06 20:09 345次阅读
    选择光伏电站<b class='flag-5'>运</b><b class='flag-5'>维</b>管理系统<b class='flag-5'>需要</b>重点注意哪些?

    一个优秀的射频测试工程需要具备哪些技能?

    一个优秀的射频测试工程需要具备哪些技能?在无线技术高速发展的今天,射频(RF)测试工程是确保通信设备性能与用户体验的关键角色。从复杂的调
    的头像 发表于 05-16 10:08 1548次阅读
    一个<b class='flag-5'>优秀</b>的射频测试工程<b class='flag-5'>师</b><b class='flag-5'>需要</b><b class='flag-5'>具备</b>哪些技能?

    一个优秀的嵌入式软件“架构师” — AWFlow

    在大型项目的软件开发过程中,模块化开发面临着接口设计不合理、代码冲突以及模块间不兼容等问题,导致团队协作效率低下。为了解决这些问题,嵌入式软件“架构师”—AWFlow,应运而生!在大型项目
    的头像 发表于 02-10 16:44 782次阅读
    一个<b class='flag-5'>优秀</b>的嵌入式软件“<b class='flag-5'>架构师</b>” — AWFlow

    英特尔前Xeon首席架构师加盟高通

    高通公司近日宣布,英特尔前Xeon服务器处理器首席架构师Sailesh Kottapalli已正式加入高通,并担任高级副总裁一职。此举被视为高通进军数据中心CPU市场的重要一步
    的头像 发表于 01-15 15:30 725次阅读

    除尘设备智慧物联网系统方案

    为保障除尘设备的安全可靠运行,往往需要设备制造商提供及时高效的服务,以跟进生产工作的除尘需求,确保对废气进行过滤和净化,使之达到排放标准。但在实际工作中,设备数量多且分布广的特点,对有限的
    的头像 发表于 12-19 17:46 816次阅读