0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

写一个自动化重启服务脚本

阿铭linux 来源:阿铭linux 作者:阿铭 2022-11-22 10:12 次阅读

我们搞运维的总幻想着,任何线上问题都能靠它自己自愈,它只需要在发生问题时自动解决问题后通知一下我们即可!

这不,今天就有这样一个小需求,对你来说一定非常简单。

【需求】

写一个自动化重启服务脚本,当访问日志频繁出现502状态码时,重启php-fpm服务。

提示:

假定Ngnix访问日志路径为/data/logs/www_access.log

重启php-fpm服务的命令为systemctl restart php-fpm

访问日志片段(里面的200就是状态码)

123.52.13.247 - [30/Jul/202203:15 +0800]bbs.aabcc.cn "/thread-2403963-2-198.html" 200 "http://bbs.aabcc.cn/thread-2403963-1-198.html" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.159 Safari/537.36"
171.8.172.146 - [30/Jul/202203:15 +0800]bbs.aabcc.cn "/thread-2430178-2-7.html" 200 "http://bbs.aabcc.cn:8234/thread-2430178-8-7.html" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.159 Safari/537.36"
171.8.173.103 - [30/Jul/202203:15 +0800]bbs.aabcc.cn "/forum.php?mod=viewthread&action=printable&tid=2407976" 200 "http://bbs.aabcc.cn:8784/forum.php?mod=viewthread&tid=2407976&extra&ordertype=2" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.159 Safari/537.36"
123.52.13.247 - [30/Jul/202203:15 +0800]bbs.aabcc.cn "/thread-2396686-1-245.html" 200 "http://bbs.aabcc.cn/thread-2396686-2-245.html" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.159 Safari/537.36"

脚本可以每分钟执行一次,脚本执行时截取上一分钟的日志,可以计算总日志行数,和出现502的行数,计算比例,这里我给大家定一个比例吧,超过20%就算是有问题啦

【解析】

首先,给出思路:

每分钟执行脚本,将过去一分钟的日志截取出来;

然后分析这一分钟内的日志,计算日志总行数,计算状态码为502的日志行数;

两个数字相除,计算百分比;

拿到百分比数字和20相比较;

高于20执行重启php-fpm服务的命令;

先看第一个需求点,如何拿到过去一分钟的日志?

看日志片段吧,很明显日志里有一个时间字段 "30/Jul/202203:15"

过去一分钟,就是拿当前的分钟减去一分钟,date就可以实现啊 :

date -d "-1 min" +%Y:%H:%M

为了过滤的更加精准,建议在最后面再加个:

所以,从访问日志中截取过去一分钟的日志可以这样做:

last_t=`date -d "-1 min" +%Y:%H:%M"`
tail -n 10000 /data/logs/www_access.log |grep "/${last_t}:"  > /tmp/last.log

解释一下,为什么tail -n 10000呢,因为如果访问日志很大的话,直接去grep会比较耗费时间,所以先将最后面的1w行截取出来,效率会高很多。

当然,这个1w是我预估的,大家也可以根据实际的日志量来评估这个数字,你也可以是1000行。

将过滤后的日志先存放到一个临时文件里,留着备用。

下面就该计算日志总行数,这个很简单,直接 wc -l /tmp/last.log 就行了。

而502状态码的日志行数,还需要使用grep:

grep  -c '" 502 "' /tmp/last.log

大家注意,502左右都带有空格,这是为了更加精准匹配,因为日志里很有可能其它地方包含502关键词。

拿到两个数字后,接下来就该计算百分比了。

百分比要精确到小数点后两位,所以不能直接使用shell中的数学运算,得借助于一个linux下的计算器bc,先看例子吧 :

echo "scale=2; 12*100/101"|bc

4ff15aca-6991-11ed-8abf-dac502259ad0.png

所以对应到本案例中,假设502行数用s502_c变量标记,最后1分钟日志总行数用last_1min_c标记,计算百分比,这样做:

echo "scale=2; ${s502_c}*100/${last_1min_c}"|bc

由于shell中的数学逻辑运算不能使用小数来比较,所以还需要将上面获取到的数字进一步包装,可以将其乘以100,也就是去掉点:

echo "scale=2; ${s502_c}*100/${last_1min_c}"|bc|sed 's/.//'

获取到这个数字后,然后再与2000进行比较。

之后,就是去做判断,若符合条件进行重启操作。

【参考答案】

脚本最终是这样的:

#!/bin/bash
logfile="/data/logs/www_access.log"
last_t=`date -d "-1 min" +%Y:%H:%M`
tail -n 10000 $logfile |grep "/${last_t}:"  > /tmp/last.log
last_1min_c=`wc -l /tmp/last.log|awk '{print $1}'`
s502_c=`grep  -c '" 502 "' /tmp/last.log`
p=`echo "scale=2; ${s502_c}*100/${last_1min_c}"|bc|sed 's/.//'`
if [ $p -gt 2000 ]
then
    echo "`date` 502日志大于20%,需要重启php-fpm服务" >> /tmp/restart_php-fpm.log
    systemctl restart php-fpm
fi




审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Linux
    +关注

    关注

    87

    文章

    10992

    浏览量

    206745
  • PHP
    PHP
    +关注

    关注

    0

    文章

    452

    浏览量

    26454
  • Shell
    +关注

    关注

    1

    文章

    358

    浏览量

    22903
  • FPM
    FPM
    +关注

    关注

    0

    文章

    5

    浏览量

    1263
收藏 人收藏

    评论

    相关推荐

    10个杀手级的Python自动化脚本

    今天浩道跟大家分享10个日常工作中用到的python自动化脚本。让你感受一番python简单强大之处!
    发表于 11-28 11:07 522次阅读

    自动化

    ,制造自动化代替人的体力劳动或脑力劳动仅仅是制造自动化功能目标体系的部分。制造自动化的功能目标是多方面的,已形成
    发表于 05-24 18:59

    支持ZigBee/INSTEON/X10协议 强大的家用自动化系统

    派上,并搞出些特殊的玩意儿。所以抓起你的树莓派,兼容型Smartenit自动化控制接口,搭起台ZBP服务器,就可以享受到强大又廉价的家
    发表于 07-08 12:42

    物联网怎么普及工业自动化

    ,这事网络可以让所谓的自动化和信息,“两改变fusion"视觉更具体的实现,自动化行业直以信息目标,在事情的基础网络,原来的
    发表于 03-16 09:22

    手机自动化测试方法

    脚本生成后点击调试按钮 8.点击左下角的启动键进行脚本回放,不要控制鼠标,此时鼠标会自动点击小萝贝控机大师进而控制手机进行手机APP自动化测试 `
    发表于 07-05 15:07

    手机自动化测试

    之前发布过小萝贝控机大师与按键精灵结合实现手机自动化测试的功能,小萝贝控机大师升级了实现了更多手机自动化测试的功能,如下:l手机功能自动化测试:录制脚本,检查点时点击小萝贝控机大师右边
    发表于 07-08 13:36

    自动化设备的前景和现状

    `随着劳动力成本的不断提高,越来越多的企业关注工厂自动化领域,也给这行业带来了发展商机。同时,如何提升服务水准也成了非标自动化机械行业
    发表于 05-30 09:42

    楼宇自动化

    楼宇自动化.zip,关于楼宇自动化的所有课件,共有56
    发表于 09-24 11:53

    步骤完成自动化测试

    ),有计划的部署和面对成功的挑战。按照以上 7 步骤,安排你的人员、工具和制定你的自动化测试项目计划,你将会通往条成功之路。
    发表于 07-19 06:12

    怎样shell脚本以实现Android7.1.2源码的自动编译呢

    怎样shell脚本以实现Android7.1.2源码的自动编译呢?
    发表于 03-04 06:32

    【Banana PI Leaf S3开发板试用体验】开发板WIFI联网与远程脚本自动化执行

    发现问题。无论从互联网上下载文件或是从局域网服务器上下载文件,均无异常就这么着用了。 四、做成自启动脚本开机自动连接wifi与执行 为了更进步的
    发表于 10-18 19:47

    自动化测试脚本开发技巧

    开发自动化测试脚本的技巧和心得软件测试 增量式调试脚本 录制测试脚本,和其他的软件开发成果一样,会变得非常大。为了可以成功的回放,需要调试几百行的代码,为了参数化的
    发表于 03-26 16:24 53次下载

    在Linux下如何优雅的开机自动重启脚本

    1.简介 经常碰到机器断电之后需要重启一大堆服务,为了防止这种事情发生,设置开机自启的脚本十分的重要,我们习惯性的做法就是编写一个重启脚本
    的头像 发表于 08-17 09:15 4228次阅读

    服务自动重启的原因及解决方法

    最近有很多站长反馈香港服务器出现自动重启的情况,是什么原因导致服务自动重启呢?今天就和大家探讨
    的头像 发表于 03-24 10:53 6967次阅读

    keil自动化编译脚本

    这是一个 keil 的自动化编译脚本,可被其他脚本或程序调用,接收参数并按参数编译 keil 工程,而不必打开 keil 软件,实现程序上的自动化
    的头像 发表于 10-16 17:04 596次阅读
    keil<b class='flag-5'>自动化</b>编译<b class='flag-5'>脚本</b>