0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

linux定时任务如何判断文件差异?

Q4MP_gh_c472c21 来源:写个解 作者:吴解君 2021-03-17 10:05 次阅读

本文能学到•busybox为例粗略跟踪软件执行过程方法•如何判断文件差异•cron 对任务计划文件要求

1. 背景

无意中瞟一眼出厂产品的日志文件 /app/recode 大小居然有9MB,按照设计每10min执行任务检查/app/recode文件大小,该文件不会超过4MB,超过此大小则压缩处理,仅保留最近的日志内容。立马着手检查linux定时任务cron运行情况。

2. 初步排查

执 crontab -e 查看定时任务配置情况,其实是以root权限打开 var/spool/cron/crontabs/root 文件,第二行是本背景该执行的脚本,乍看一下没有任何问题。检查 /var/log/message 看是否有被执行的记录,“cat /var/log/message | grep cron”,干干净净!!!的确没被执行。

本来事情到此为止只算工程师一个平常无奇的日常,不过10min后再查看 /app/recode 居然从9MB变成4KB,/var/log/message也有执行记录,发生了什么?

3. 分析

为了分析具体原因,准备一新烧录的板卡作为排查对象。怀疑方向有三个,这三方面都是引起任务计划不被执行的诱因:crontab file格式不正确

文件系统被改写

crontab file所属用户不合法

3.1. x11 crontab file 格式不正确

crontab file文件位于 var/spool/cron/crontabs/root,当使用crontab -e命令打开该文件,不做任何修改并退出,cron任务计划能被运行。怀疑var/spool/cron/crontabs/root文件里可能包含不合法字符或语法不正确,如:文件末尾有 、 、一行里有多个空格会影响cron解析该文件。于是执行如下步骤排查:1.备份配置文件cp var/spool/cron/crontabs/root var/spool/cron/crontabs/root.bak;

2.执行crontab -e;

3.cron任务计划是否被执行,需查看记录watch -n 1 cat /var/log/message。

4.计算两文件md5是否一致md5sum var/spool/cron/crontabs/root var/spool/cron/crontabs/root.bak;

结果:文件一致。

证明:“crontab file 格式不正确”不是诱因。

3.2. x12 文件系统被改写

crontab -e虽然没有修改var/spool/cron/crontabs/root,但无法证明它有没有改写文件系统其他文件。于是在一块重新烧录镜像的板卡执行如下步骤排查:获取文件系统所有文件的MD5保存为/tmp/a.txt;

find arch bin etc home lib media opt root sbin tmp usr var -name “*” | xargs md5sum 》 /unuse/a.txt

执行crontab -e;

获取文件系统所有文件的MD5保存为/tmp/b.txt;

find arch bin etc home lib media opt root sbin tmp usr var -name “*” | xargs md5sum 》 /unuse/b.txt比较a.txt和b.txt是否一致,从而证明crontab -e是否修改文件系统内容

结果:a.txt,b.txt文件一致。 证明:“x12 文件系统被改写”不是诱因。

3.3. x13 crontab file所属用户不合法

产品的cron是busybox的组件,源码面前无秘密。开始跟踪crond执行过程。 在busybox源码的miscutils/crond.c添加若干 “printf(”LINE %d“, __ LINE __);”跟踪程序运行。cron在前台运行,执行crond -f var/spool/cron/crontabs/root; 发现947行没有被执行,且文件指针是0;推断:var/spool/cron/crontabs/root没有被读取。

跟踪文件读取函数load_crontab发现438行的if第二个条件不满足,DEAMON_UID是0,只有当sbuf.st_uid也等于0时才能执行文件读取,实际返回1000。变量sbuf.st_uid表示文件所属用户的UID。

•修改crontab file文件的UID和GID都是0,chown 0:0 /var/spool/cron/crontabs/root;

•重新启动crond:crond -f var/spool/cron/crontabs/

•10min后在/var/log/message里看到任务计划执行痕迹

Jan 10 1200 (none) cron.info crond[854]: USER root pid 3506 cmd /usr/bin/compresslog.shJan 10 1200 (none) cron.info crond[854]: USER root pid 3508 cmd /usr/local/bin/recode_check.shJan 10 1200 (none) cron.info crond[854]: USER root pid 5007 cmd /usr/local/bin/recode_check.shJan 10 1200 (none) cron.info crond[854]: USER root pid 6506 cmd /usr/local/bin/recode_check.sh结果:修改“crontab file所属用户”有效,任务计划可以正常运行。 证明:“crontab file所属用户不合法”是诱因

4. 推断过程

看到这个1000我已经觉察到问题根本原因,看我娓娓道来。/etc/passwd记录linux用户所属UID、GID。UID=0、GID=0属于root用户。passwd有若干ID号,普通预设的用户的UID、GID在1~999,adduser创建的用户ID从1000开始,启动crond守护进程时会根据当前用名去/var/spool/cron/crontabs/目录下寻找与用户名同名的文件,顺带检查该文件的所属用户UID,只有文件存在、UID相同才读取该文件。按照设想,那么crontab -e执行后应该会修改用户所属ID,下面是实验步骤。再修改用户组为 1000 “chown 1000:root /var/spool/cron/crontabs/root”

观察crontab -e执行前后文件所属用户是否改变

实践和设想一致:crontab会修改文件所属用户。

5. 为什么测试阶段没发现问题

我的Linux系统开发环境普通用户编码从1000开始,为避免使用root用户误操作危害开发环境,一切文件均在普通用户环境下编辑,为有编辑权限,曾执行过 chown up /var/spool/cron/crontabs/root(不理解cron设计者为什么要去检查文件所属UID,即使当前已经是root权限),这个up就是我的用户名,up的UID=1000。之所以在软件测试阶段未发现问题,原因在于任务计划默认10min才执行一次,为缩短测试时间而修改任务计划执行频率,提高测试效率,修改方法就是crontab -e编辑 /var/spool/cron/crontabs/root。 当初只注重recode_check.sh执行的正确性。

原文标题:揪出元凶:linux定时任务crontab居然没执行

文章出处:【微信公众号:嵌入式ARM】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Linux
    +关注

    关注

    87

    文章

    10986

    浏览量

    206718
  • 代码
    +关注

    关注

    30

    文章

    4554

    浏览量

    66726

原文标题:揪出元凶:linux定时任务crontab居然没执行

文章出处:【微信号:gh_c472c2199c88,微信公众号:嵌入式微处理器】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    QNX与Linux基础差异对比

    对于QNX系统和Linux系统的内核差异,我们抛开宏内核、微内核之类的争议不谈。单纯从开发应用的角度而言,QNX和Linux系统的差异到底有多大,在开发的时候需要注意哪些细节问题?
    发表于 04-17 10:52 52次阅读

    使用TC21x的GPT实现1m计时器执行定时任务,怎么配置GTM和GPT?

    专家们好,我想使用TC21x的GPT实现1m计时器执行定时任务,不知道怎么配置GTM和GPT?
    发表于 02-06 06:47

    鸿蒙原生应用/元服务开发-长时任务

    。 2.声明后台模式类型。 在module.json5配置文件中为需要使用长时任务的UIAbility声明相应的长时任务类型。 { \"module\": { ... \"
    发表于 01-09 10:52

    Linux系统文件比较工具集合

    Linux系统中,文件比较是一种常见的任务,用于比较两个文件之间的差异文件比较可以帮助我们找
    的头像 发表于 01-02 13:53 313次阅读

    鸿蒙原生应用/元服务开发-短时任务

    ; } 3.获取短时任务剩余时间。查询本次短时任务的剩余时间,用以判断是否继续运行其他业务,例如应用有两个小任务,在执行完第一个小任务
    发表于 12-28 16:13

    HarmonyOS后台任务管理开发指南上线!

    时的操作步骤。 ①了解相关机制及规格,实现更高效开发。 ○ 申请时机:应用需要在前台或退至后台 5 秒内申请短时任务。 ○ 数量限制:一个应用同一时刻最多支持申请 3 个。 ○ 配额机制:一个应用有一定时
    发表于 11-29 09:58

    定时器如何实现定时任务

    1.1、单次定时任务实现 boost 的asio库里有几个定时器,老的有 deadline_timer , 还有三个可配合 C++11 的 chrono
    的头像 发表于 11-09 17:20 363次阅读

    基于Django的Celery异步任务定时任务的实战教程

    Django与Celery是基于Python进行Web后端开发的核心搭配,在运营开发(即面向企业内部)的场景中非常常见。 下面是基于Django的Celery异步任务定时任务的实战教程,大家觉得
    的头像 发表于 11-02 10:45 295次阅读
    基于Django的Celery异步<b class='flag-5'>任务</b>和<b class='flag-5'>定时任务</b>的实战教程

    ucos iii定时任务有什么用?

    ucos iii 的定时任务有什么用,通过定时任务定时与普通的调用系统定时函数定时有什么区别?
    发表于 10-07 06:16

    Unix和Linux差异

    摘要:程序员都知道,Linux 不是 Unix,不过二者之间确实存在关系,即 Linux 系统是从 Unix 派生出来的,而 Linux 是一个类 Unix 的操作系统。那么,二者之间具体存在哪些明显的
    发表于 09-04 12:42 302次阅读

    H3C交换机配置定时任务

    H3C交换机配置定时任务
    的头像 发表于 06-21 09:21 948次阅读

    如何使用Spring scheduling task简化定时任务功能的实现?

    很多时候,我们有这么一个需求,需要在每天的某个固定时间或者每隔一段时间让应用去执行某一个任务
    的头像 发表于 05-22 16:48 717次阅读
    如何使用Spring scheduling task简化<b class='flag-5'>定时任务</b>功能的实现?

    python定时任务实践

    由于程序需求,监测配置变化需要设置定时任务,每分钟执行一次,对任务持久化要求不高,不需要时可以关闭定时任务
    的头像 发表于 05-20 17:53 774次阅读
    python<b class='flag-5'>定时任务</b>实践

    Linux如何使用cron进行定时任务的操作

    按计划执行命令对于计算机来说非常重要,因为假如我亲自去执行一些任务的话,可能会因为多方面因素不能按时执行,所以定时任务就显得非常重要了! cron就是一个能够执行定时任务的命令,其实该命令本身不难,下面小编带您详细了解!
    的头像 发表于 05-12 16:27 1784次阅读

    使用SCP和Rsync在Linux中传输文件

    Linux 中,有时需要将文件从一台计算机传输到另一台计算机。为了完成这个任务,有两个主要的工具可以使用:SCP 和 Rsync。本文将介绍如何使用这两个工具在 Linux 中传输
    的头像 发表于 05-12 14:32 744次阅读