0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Linux内核维护者的真相与误解

Linux爱好者 来源:Linux News搬运工 作者:Linux News搬运工 2021-03-03 15:28 次阅读

自 2020 年 1 月发布 5.5 内核之后,到现在已经有近 87,000 个 patch,来自于近 4600 名开发者,都被合并到 mainline 仓库中了。review 所有这些 patch 的工作,对于愿意花时间的内核开发者来说也都是一项艰巨的任务,所以是否要接受合并 patch,这个决定权就被委托给了各个子系统的维护者(maintainer)来代理决定,他们每个人都对内核中这一部分的改动具有部分或者完整的决定权。

这些维护者们就被记录在一个叫 MAINTAINERS 的文件中(当然是这个名字)。但是,MAINTAINERS 文件也需要维护,它能很好地反映现实情况吗?MAINTAINERS 文件的存在目的,并不仅仅是为了让大家给维护者点赞。开发者们需要用它来确定该把 patch 发到哪里。

get_maintainer.pl 脚本通过查看这个 patch 修改了的文件,就可以生成一系列邮件地址来发送 patch,从而让这一过程变得更加自动化。如果这个文件中有错误信息的话,就可能会让 patch 发送到错误的地方去,所以我们需要这个文件能保持更新。

最近,编者收到 Jakub Kicinski 的建议,他认为可以比较 一下 MAINTAINERS 中的各个条目和现实世界中的工作的吻合程度,应该能得到一些线索。于是折腾了一会儿 Python 之后,我们就得到了一个新的分析脚本。

Digging into MAINTAINERS

统计下来,MAINTAINERS 文件中已经列出了 2280 个 "subsystems (子系统)"。每一个子系统都包括一个它所涵盖的文件和目录列表。我们可以查看这些文件的 commit 信息来这个子系统中都有谁在进行工作。

撰写 patch 显然属于工作内容之一,但其他活动也得算,比如处理 patch (可以从 Signed-off-by tag 来得到这个信息) 或 review patch (根据 Reviewed-by 或 Acked-by)。

我们牺牲了一些 CPU 挖矿的时间,得到了一个大概统计值,也就是各个子系统中明确列出的维护者最后一次在该子系统中实际做了有效工作的时间是什么时候。

对于那些想看细节的人来说,可以直接看这个完整结果(https://lwn.net/Articles/842419/)。

不过,我们可以缩小数据范围,在这个文件中挑选出一些我们更感兴趣的内容。例如,有 367 个子系统在整个 Git 历史中都没有维护者,或维护者从未出现过(没有包括那些没有文件的 "子系统"–见下文)。

在这些子系统中,很多已经过了它本身的黄金时期,比如现在 3c59x 网卡维护者根本没有多少工作可做。网络开发人员也不会收到很多 ATM 的 patch 了,Palm Treo 也不需要有多少支持工作了,苹果最近也很少发布基于 M68k 的系统了,Arm 软驱(floppy drive)也没有多少人还在使用了,S3 Savage 显卡也不再是以前人们所必备的设备了。

这几百项中,很多可能都代表着可以完全删除的代码。类似的结论也可以从另一个列表中得到 (https://lwn.net/Articles/842424/),那个列表中都是没有列出维护者的子系统。当然,其中一些子系统本身也不太对头,有一个子系统简单地命名为 "ABI/API",指向了 linux-api 邮件列表。实际上有一个文件是与这个 "子系统 " 相关的,kernel/sys_ni.c,这个文件会对那些未实现的系统调用进行处理。因此,这个条目的存在价值,是为了让开发者在添加新的系统调用时会抄送 linux-api 邮件列表。

"Arm subarchitectures " 条目也是类似情况。一些无维护者的子系统,比如 framebuffer 层,可能后续会有人愿意接手从而复活。

reiserfs 文件系统缺乏维护者,但似乎仍有一些用户。其他的子系统,比如 DECnet 或 Matrox framebuffer,可能最好的处理就是不去管它了(或干脆删除掉)。

MAINTAINERS 文件中列出的一些 "子系统" 没有任何文件需要修改。

一个有趣的例子是 "embedded Linux",据说由 Paul Gortmaker、Matt Mackall 和 David Woodhouse 维护。鉴于嵌入式 Linux 的成功,我们都认为他们的工作非常出色。"device number registry" 声称是有维护的,但这里只包含一个链接,指向一个不存在的网页。

"disk geometry and partition handling" 这一条中的 URL 仍然有效,但这些网页似乎已经有十多年没有更新了,可以看出最近 Zip 驱动器的 geometry 并没有什么进展。

man page 这些手册页面倒是有积极维护的,但它们不在内核代码树中。

Help needed

从目前的结果可以得出几个结论。一个是很多内核子系统现在并不是真的需要有人来维护,相反,其中一些可能需要被删除掉。另一个结论是,也许 MAINTAINERS 文件本身需要清理一下。但还有一个有价值的问题,那就是从这些数据是否可以看出是否有一些子系统从新的维护者中获益匪浅的呢?

为了回答这个问题,我们又花费了一些本来可以用来挖矿的 CPU 时间,来寻找符合这些标准的子系统。

没有列出维护者,或者所谓的维护者已经在该子系统中至少 6 个月没有活动了。

自 2020 年 1 月发布 5.5 内核以来,至少有 50 个提交跟这个子系统有关。

这个搜索的目的是找出那些仍在进行某种活跃开发,但没有活跃的、明确指定的子系统。

搜索结果可以分为几类。有些 MAINTAINERS 的条目中包含了大量的文件,使得 commit 数量看起来比真实情况要多了不少。

例如,名为 "ASYNCHRONOUS TRANSFERS/TRANSFORMS (IOAT) API "的子系统跟 drivers/dma 下的所有文件都有关,"DMA GENERIC OFFLOAD ENGINE SUBSYSTEM" 也包含这些文件。

该子系统则由 Vinod Koul 积极维护。有两个子系统属于这一类,在下面的表格中,"Activity" 列表示维护者最后一次我们看到他的活动时间(如果有的话),而 "Commits" 则显示了自 5.5 以来影响到这个子系统的 commit 次数。

Subsystem Activity Commits
ASYNCHRONOUS TRANSFERS/TRANSFORMS (IOAT) API —— 536
HISILICON NETWORK SUBSYSTEM DRIVER 2019-11-16 258

这些子系统或者不是一个单独的实体(entity),或者应该减少其覆盖的文件清单,要以符合现实情况。

还有一些子系统的维护者使用的是公司电子邮件别名。比如 "DIALOG SEMICONDUCTOR DRIVERS" 的维护者是 support.opensource@diasemi.com,这个地址显然不会出现在任何实际的 patch commit 中。不过在该子系统内看进去的话,可以看到许多来自 diasemi.com 邮件地址的许多 review,所以该子系统不能说是真的没人维护。

这个类别包含:

Subsystem Activity Commits
DIALOG SEMICONDUCTOR DRIVERS —— 120
QUALCOMM ATHEROS ATH9K WIRELESS DRIVER —— 65
WOLFSON MICROELECTRONICS DRIVERS —— 146

与之相关的是有些子系统的维护者信息是过时的,指定的维护者并不活跃,但往往是来自同一公司的其他人接替了他的工作,并承担事实上的维护工作。

这些包括:

Subsystem Activity Commits
HISILICON NETWORK SUBSYSTEM 3 DRIVER (HNS3) 2019-11-16 234
HISILICON SECURITY ENGINE V2 DRIVER (SEC2) 2020-06-18 55
LINUX FOR POWER MACINTOSH 2018-10-19 71
MELLANOX ETHERNET INNOVA DRIVERS —— 93
MELLANOX MLX4 IB driver —— 70
OMAP HWMOD DATA 2016-06-10 102
QCOM AUDIO (ASoC) DRIVERS 2018-05-21 125
TEGRA I2C DRIVER 2018-05-30 56

最后,还有一些子系统似乎真的缺少维护者,它们通常的 commit 是由其他的子系统维护者来合并,或者是通过少数几个终极维护者来最终合入的。

它们是:

Subsystem Activity Commits
ARM/UNIPHIER ARCHITECTURE —— 73
DRBD DRIVER 2018-12-20 51
FRAMEBUFFER LAYER —— 402
HMM - Heterogeneous Memory Management 2020-05-19 54
I2C SUBSYSTEM HOST DRIVERS —— 434
MARVELL MVNETA ETHERNET DRIVER 2018-11-23 65
MEDIA DRIVERS FOR RENESAS - VIN 2019-10-10 56
MUSB MULTIPOINT HIGH SPEED DUAL-ROLE CONTROLLER 2020-06-24 54
NFC SUBSYSTEM —— 72
PROC FILESYSTEM —— 171
PROC SYSCTL 2020-06-08 51
QLOGIC QLGE 10Gb ETHERNET DRIVER 2019-10-04 77
STAGING - REALTEK RTL8188EU DRIVERS 2020-07-15 121
STMMAC ETHERNET DRIVER 2020-05-01 174
UNIVERSAL FLASH STORAGE HOST CONTROLLER DRIVER —— 277
USB NETWORKING DRIVERS —— 119
X86 PLATFORM DRIVERS - ARCH —— 119

对于一直关注相关领域的人来说,上面的列表并不出乎预料。frameebuffer 子系统是一个已知有问题的领域,由于缺乏维护,"soft scrollback" 功能最近就被从 framebuffer 驱动中移除了。

不少人仍然需要使用这段代码,但它越来越难以与内核的图形驱动集成起来使用,很少有人有兴趣去深入研究它。事实上,I2C host driver 确实有一个事实上的维护者,它就是 Wolfram Sang,他也维护着 core I2C 子系统。他一直希望有人能帮助他维护这些驱动程序,但似乎没有人愿意帮助他,所以他在有时间的时候就也负责维护这些驱动程序。

/proc 是一个有趣的例子,每个人都依赖它,但没有人负责维护它。HMM 也很有趣,创建者当初花了很多精力来把 HMM 功能合入 mainline,但现在似乎转向去忙其他事情了。

以上这些地方,看起来都是有抱负的内核开发者可以参与进来提供帮助的地方。那么那些在 MAINTAINERS 文件中没有记录的子系统呢?如果我们用快速脚本来查找一下内核树中所有的未被 MAINTAINERS 文件包含的文件,我们得到的文件列表包含超过 2800 个文件。其中自然包括 MAINTAINERS 文件本身。其余的绝大多数都是 include/下的头文件,其中大部分可能都有维护者,应该添加到 MAINTAINER 文件中相应的条目下。

不过令人沮丧的是,在 kernel/目录下有 72 个文件没有列出维护者。这当然不是现实情况。SYSV IPC 代码是没有维护者的,这反映了它普遍不受欢迎。

其余大部分未维护的文件都在 tools/ 或 samples/ 目录下。比较难找出来的是 MAINTAINERS 中号称会包含的文件中,其实有一些并不是由指定的人维护的。这种情况经常出现在那些指定包含整个目录树的条目中。例如,编者被列为需要处理 Documentation/目录,但肯定不能说我真的是在 "维护" 这么多文件。类似的情况在内核树中很多地方都有。

如果有人希望从这些数据中得出一些整体性的结论,那么可能会是这些:MAINTAINERS 文件肯定有一些黑暗的角落,这些角落本身也可能需要一些维护(其中一些已经在做了)。内核中一些缺乏维护者的部分,仍然是可以使用的,而另一些则已经过于古老都不需要维护了。不过,大多数情况下,内核中的子系统都有指定的维护者,而且他们中的大多数人至少都在努力维护他们负责的代码。The situation could be a lot worse。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Linux
    +关注

    关注

    87

    文章

    10943

    浏览量

    206546
  • 自动化
    +关注

    关注

    28

    文章

    5000

    浏览量

    77649
  • python
    +关注

    关注

    51

    文章

    4657

    浏览量

    83380

原文标题:Linux 内核维护者的真相与误解

文章出处:【微信号:LinuxHub,微信公众号:Linux爱好者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    开源项目维护者分论坛圆满举办

    开源维护者——一个被严重误解的群体,在一个开源项目中,开源维护者 往往拥有很高的权限,比如合并其他人的代码,又或者是无须经过他人review就可以提交,当这些人的心态炸裂,就会发生诸如删库跑路、恶意
    的头像 发表于 12-22 18:20 233次阅读
    开源项目<b class='flag-5'>维护者</b>分论坛圆满举办

    诚邀报名|来开源项目维护者论坛,为项目可持续发展贡献您的声音

    2023开放原子开发者大会 . OPENATOM DEVELOPERS CONFERENCE 开源项目维护者论坛 2023.12.17 开源维护者是一个被严重误解的群体。在开源项目中,他们通常拥有
    的头像 发表于 12-14 16:05 158次阅读

    Linux内核UDP收包为什么效率低

    现在很多人都在诟病Linux内核协议栈收包效率低,不管他们是真的懂还是一点都不懂只是听别人说的,反正就是在一味地怼Linux内核协议栈,他们的武器貌似只有DPDK。 但是,即便
    的头像 发表于 11-13 10:38 221次阅读
    <b class='flag-5'>Linux</b><b class='flag-5'>内核</b>UDP收包为什么效率低

    如何优化Linux内核UDP收包效率低

    很多人都在诟病Linux内核协议栈收包效率低,不管他们是真的懂还是一点都不懂只是听别人说的,反正就是在一味地怼Linux内核协议栈,他们的武器貌似只有DPDK。 但是,
    的头像 发表于 11-10 10:51 244次阅读
    如何优化<b class='flag-5'>Linux</b><b class='flag-5'>内核</b>UDP收包效率低

    linux内核源代码详解

     在安装好的Linux系统中,内核的源代码位于/ust/src/linux.如果是从GNU网站下载的Linux内核的tar文件,则展开以后在
    发表于 09-06 17:01 2次下载

    Linux内核如何使用结构体和函数指针?

    我将结合具体的Linux内核驱动框架代码来展示Linux内核如何使用结构体和函数指针。
    的头像 发表于 09-06 14:17 524次阅读
    <b class='flag-5'>Linux</b><b class='flag-5'>内核</b>如何使用结构体和函数指针?

    Linux内核中描述I2C的四个核心结构体

    I2C核心维护了i2c_bus结构体,提供了I2C总线驱动和设备驱动的注册、注销方法,维护了I2C总线的驱动、设备链表,实现了设备、驱动的匹配探测。此部分代码由Linux内核提供。
    的头像 发表于 09-04 09:35 729次阅读
    <b class='flag-5'>Linux</b><b class='flag-5'>内核</b>中描述I2C的四个核心结构体

    Linux内核的编译主要过程

    Linux内核的编译主要过程: 配置、编译、安装 。
    发表于 08-08 16:02 453次阅读
    <b class='flag-5'>Linux</b><b class='flag-5'>内核</b>的编译主要过程

    万千设备,linux内核如何知道?

    linux内核设备的注册由device_register()函数完成,这个函数是linux设备驱动模型的核心函数
    的头像 发表于 07-12 08:52 483次阅读
    万千设备,<b class='flag-5'>linux</b><b class='flag-5'>内核</b>如何知道?

    Linux内核的作用

    Linux操作系统是当今世界上最为广泛使用的开源操作系统之一,内核则是一个操作系统的核心和灵魂所在。对于一名Linux驱动开发者来说,了解Linux
    发表于 07-06 11:46 1077次阅读
    <b class='flag-5'>Linux</b><b class='flag-5'>内核</b>的作用

    Linux内核内存泄漏怎么办

    Linux内核开发中,Kmemleak是一种用于检测内核中内存泄漏的工具。
    发表于 07-04 11:04 560次阅读

    Linux内核的编译和运行

    想让Linux内核代码跑起来,得先搭建编译和运行代码的环境。
    发表于 06-23 11:56 329次阅读
    <b class='flag-5'>Linux</b><b class='flag-5'>内核</b>的编译和运行

    如何编译Linux内核rpm包

    进入github官网,搜索linux,使用git下载最新版本,或者其它版本的内核代码。
    发表于 06-07 16:24 751次阅读
    如何编译<b class='flag-5'>Linux</b><b class='flag-5'>内核</b>rpm包

    Linux内核移植教程

    半导体厂商会从 Linux内核官网下载某个版本,将其移植到自己的 CPU上,测试成功后就会将其开放给该半导体厂商的 CPU开发者。开发者下载其提供的 Linux内核,然后将其移植到自己
    的头像 发表于 04-19 11:20 722次阅读
    <b class='flag-5'>Linux</b><b class='flag-5'>内核</b>移植教程

    Linux内核结构介绍

    通常情况下,Linux内核的结构被认为包含以下11个主要层次。
    的头像 发表于 04-14 11:59 773次阅读