Linux 6.2 近日合并了一个重要补丁,该补丁能够将一个核心内核函数速度提升 715 倍。

从合并的注释可知,贡献此补丁的维护者 Zhen Lei 来自华为,他将 kallsyms_lookup_name () 的平均查找性能提高了 715 倍,从而使内核里面旧实现的时间复杂度从 O (n) 升级到 O (log (n)),大幅减少查找时间,同时还保留了 /proc/kallsyms 上旧的实现支持。 kallsyms_lookup_name () 函数用于根据名称查找符号的地址,并可用于查找内核符号表中的任何符号。

Zhen Lei 曾在较早的补丁中描述了kallsyms_lookup_name () 的优化思路:
目前,要搜索一个符号,我们需要将 'kallsyms_names' 中的符号一个一个展开,然后使用展开后的字符串进行比较。这种算法的时间复杂度是 O (n)。
如果我们像地址一样按升序对名称进行排序,则可以使用二分查找。这种算法的时间复杂度是 O (log (n))。
为了不改变 “/proc/kallsyms” 的实现,表 kallsyms_names [] 仍然按照升序与地址一一对应存储。
添加数组 kallsyms_seqs_of_names [],以排序后的 names 序号为索引,对应的内容为排序后的地址序号。例如:假设 NameX 在数组 kallsyms_seqs_of_names [] 中的索引为 'i',kallsyms_seqs_of_names [i] 的内容为 'k',则 NameX 对应的地址为 kallsyms_addresses [k]。kallsyms_names [] 中的偏移量是 get_symbol_offset (k)。
请注意,使用此方法内存使用量将增加 (4 * kallsyms_num_syms) 字节,接下来的两个补丁将减少 (1 * kallsyms_num_syms) 字节并正确处理 CONFIG_LTO_CLANG=y 的情况。
性能测试结果:(x86)
Before:
min=234, max=10364402, avg=5206926
min=267, max=11168517, avg=5207587
After:
min=1016, max=90894, avg=7272
min=1014, max=93470, avg=7293
kallsyms_lookup_name () 的平均查找性能提高了 715 倍。
因此,该补丁带来的唯一缺点是将内存占用量增加 3 * kallsyms_num_syms。 Linux 6.2 的模块代码还包含一个小的启动优化,将启动时间缩短了大约 30 毫秒。 相关链接:https://git.kernel.org/pub/scm/linux/kernel/git/torvalds/linux.git/commit/?id=3ba2c3ff98ea8bfb219288dbacf2a23a902c751b
审核编辑 :李倩
-
Linux
+关注
关注
88文章
11628浏览量
218007 -
函数
+关注
关注
3文章
4406浏览量
66851
原文标题:华为开发者贡献Linux内核补丁,将核心内核函数速度提升715倍
文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
GCC -O0 编译内核:调试党的 “救命神器”,这些优势 90% 开发者没吃透!
基于 DR1M90 的 Linux-RT 内核开发:从编译配置到 GPIO / 按键应用实现(1)
Linux内核printk日志级别全解析:从参数解读到实操配置
【免费送书】成为硬核Linux开发者:《Linux 设备驱动开发(第 2 版)》
【书籍评测活动NO.67】成为硬核Linux开发者:《Linux 设备驱动开发(第 2 版)》
deepin亮相2025中国Linux内核开发者大会
RK3506开发板Xenomai内核RT-Linux实时性系统适配教程与性能实测,实测仅7μs稳定延时
Linux内核参数调优方案
国产!全志T113-i 双核Cortex-A7@1.2GHz 工业开发板—Linux-RT应用开发案例
迅为RK3568开发板OpeHarmony学习开发手册1.1-内核移植优化
华为正式启动HarmonyOS 6开发者Beta
物联网工程师为什么要学Linux?
树莓派4 性能大比拼:标准Linux与实时Linux 4.19内核的延迟测试

华为开发者贡献Linux内核补丁,将核心内核函数速度提升715倍
评论