0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

解析Linux内核页表管理中那些鲜为人知的秘密

Linux阅码场 来源:Linux内核远航者 作者:Linux内核远航者 2021-06-11 16:32 次阅读

1.开场白

环境:

处理器架构:arm64

内核源码:linux-5.11

ubuntu版本:20.04.1

代码阅读工具:vim+ctags+cscope

通用操作系统,通常都会开启mmu来支持虚拟内存管理,而页表管理是在虚拟内存管理中尤为重要,本文主要以回答几个页表管理中关键性问题来解析Linux内核页表管理,看一看页表管理中那些鲜为人知的秘密。

2.页表的作用是什么?

1)地址转换

将虚拟地址转换为物理地址

2)权限管理

管理cpu对物理页的访问,如读写执行权限

3)隔离地址空间

隔离各个进程的地址空间,使其互不影响,提供系统的安全性

打开mmu后,对没有页表映射的虚拟内存访问或者有页表映射但是没有访问权限都会发生处理器异常,内核选择杀死进程或者panic;通过页表给一段内存设置用户态不可访问, 这样可以做到用户态的用户进程不能访问内核地址空间的内容;而由于用户进程各有一套自己的页表,所以彼此看不到对方的地址空间,更别提访问,造成每个进程都认为自己拥有所有虚拟内存的错觉;通过页表给一段内存设置只读属性,那么就不容许修改这段内存内容,从而保护了这段内存不被改写;对应用户进程地址空间映射的物理内存,内核可以很方便的进行页面迁移和页面交换,而对使用虚拟地址的用户进程来说是透明的;通过页表,很容易实现内存共享,使得一份共享库很多进程都可以映射到自己地址空间使用;通过页表,可以小内存加载大应用程序运行,在运行时按需加载和映射。..

3.页表的存放在哪?

页表存放在物理内存中,打开mmu之后,如果需要修改页表,需要将页表所在的物理地址映射到虚拟地址才能访问页表(如内核初始化后会将物理内存线性映射,这样通过物理地址和虚拟地址的偏移就可以获得页表物理地址对应的虚拟地址)。

4. 页表项中存放是虚是实?

页表基地址寄存器和各级页表项中存放的都是物理地址,而不是虚拟地址。

5. 开启mmu后地址转换过程?

虚拟地址转换物理地址的过程:打开mmu后,cpu访问的都是虚拟地址,当cpu访问一个虚拟地址的时候,会通过cpu内部的mmu来查询物理地址,mmu首先通过虚拟地址在tlb中查找,如果找到相应表项,直接获得物理地址;如果tlb没有找到,就会通过虚拟地址从页表基地址寄存器保存的页表基地址开始查询多级页表,最终查询到找到相应表项,会将表项缓存到tlb中,然后从表项中获得物理地址。

6. Linux内核为何使用多级页表?

1)使用一级页表结构优劣:

优势:

只需要2次访问内存(一次访问页表,一次访问数据),效率高,实现简单

劣势:

需要连续的大块内存存放每个进程的页表(如32位系统每个进程需要4M页表),浪费内存,虚拟内存越大页表越大,内存碎片化的时候很难分配到连续大块内存,大多数虚拟内存并没有使用。

2)使用多级页表结构优劣:

优势:

1.节省内存

2.可以按需分配各级页表

3.可以离散存储页表

劣势:

需要遍历多级页表,需要多次访问内存,实现复杂度高点

3)Linux内核综合考虑:

典型的以时间换空间,可以将各级页表放到物理内存的任何地方,无论是硬件遍历还是内核遍历,比一级页表更复杂,但是为了节省内存,内核选择多级页表结构。

7.减小多级页表遍历的优化?

1)mmu中添加tlb

来缓存最近访问的页表表项,根据程序的时间和空间的局部性原理,tlb能有很高的命中率。

2)使用巨型页

减少访存次数(如使用1G或2M巨型页),可以减少tlb miss和缺页异常。

8. 硬件做了哪些事情?

遍历页表,将va转换为pa,页面权限管理

涉及到的硬件为:

mmu

->功能:查询tlb或者遍历页表

tlb

->功能:缓存最近转换的页表条目

页表基地址寄存器 如ttbr0_el1 ttbr1_el1

->功能:存放页表基地址(物理地址)作为mmu遍历多级页表的起点

mmu进行多级页表遍历时当发现虚拟地址的最高bit为1时使用 ttbr1_el1作为遍历起点,最高bit为0时使用 ttbr0_el1作为遍历起点。

9. 软件做了哪些事情?

1)应用程序

访问虚拟内存即可如执行指令、读写内存, 没有权限管理页表

不管虚拟内存如何转换为物理内存,对应用来说透明。

2)Linux内核

填写页表,将页表基地址告诉mmu

内核初始化建立内核页表,实现缺页异常等机制为用户任务按需分配并映射页表。

当然,内核也可以遍历页表,如缺页异常时遍历进程页表。

10. 内核中涉及到的页表基地址?

内核:

idmap_pg_dir 恒等映射页表(va=pa 映射2M)

init_pg_dir 粗粒度内核页表

swapper_pg_dir 主内核页表

用户:

tsk->mm->pgd用户进程fork的时候分配私有的pgd页,用于保存pgd表项(仅仅分配了第一级页表)。

11. 页表填写/切换时机

1)内核页表填充

内核初始化过程:

物理地址 -> 恒等映射(建立恒等映射页表和粗粒度内核页表) ->打开mmu -> paging_init(建立细粒度的内核页表和内存线性映射) -> 。..

恒等映射阶段:

将恒等映射页表idmap_pg_dir 地址保存到ttbr0_el1

将 粗粒度内核页表init_pg_dir 地址保存到ttbr1_el1

paging_init阶段:

将内核主页表swapper_pg_dir 地址保存到ttbr1_el1

paging_init之后丢弃idmap_pg_dir 和init_pg_dir 页表的使用。

2)用户页表填充

访问时缺页填充:

用户进程访问已经申请的虚拟内存时,发生缺页,缺页处理程序中为进程分配各级页表等物理页并建立页表映射关系。

进程切换时切换进程页表:

switch_mm的时候切换tsk->mm->pgd到ttbr0_el1以及asid 到ttbr1_el1,从而完成了进程地址空间切换。

12.页表遍历过程

下面以arm64处理器架构多级页表遍历作为结束(使用4级页表,页大小为4K):

Linux内核中 可以将页表扩展到5级,分别是页全局目录(Page Global Directory, PGD), 页4级目录(Page 4th Directory, P4D), 页上级目录(Page Upper Directory, PUD),页中间目录(Page Middle Directory, PMD),直接页表(Page Table, PT),而支持arm64的linux使用4级页表结构分别是 pgd, pud, pmd, pt ,arm64手册中将他们分别叫做L0,L1,L2,L3级转换表,所以一下使用L0-L3表示各级页表。

tlb miss时,mmu会进行多级页表遍历遍历过程如下:

1.mmu根据虚拟地址的最高位判断使用哪个页表基地址寄存器作为起点:当最高位为0时,使用ttbr0_el1作为起点(访问的是用户空间地址);当最高位为1时,使用ttbr1_el1作为起点(访问的是内核空间地址)mmu从相应的页表基地址寄存器中获得L0转换表基地址。

2.找到L0级转换表,然后从虚拟地址中获得L0索引,通过L0索引找到相应的表项(arm64中称为L0表描述符,内核中叫做PGD表项),从表项中获得L1转换表基地址。

3.找到L1级转换表,然后从虚拟地址中获得L1索引,通过L1索引找到相应的表项(arm64中称为L1表描述符,内核中叫做PUD表项),从表项中获得L2转换表基地址。

4.找到L2级转换表,然后从虚拟地址中获得L2索引,通过L2索引找到相应的表项(arm64中称为L2表描述符,内核中叫做PUD表项),从表项中获得L3转换表基地址。

5.找到L3级转换表,然后从虚拟地址中获得L3索引,通过L3索引找到页表项(arm64中称为页描述符,内核中叫做页表项)。

6.从页表项中取出物理页帧号然后加上物理地址偏移(VA[11,0])获得最终的物理地址。

原文标题:Linux内核页表管理-那些鲜为人知的秘密

文章出处:【微信公众号:Linux阅码场】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 内核
    +关注

    关注

    3

    文章

    1309

    浏览量

    39833
  • Linux
    +关注

    关注

    87

    文章

    10981

    浏览量

    206687

原文标题:Linux内核页表管理-那些鲜为人知的秘密

文章出处:【微信号:LinuxDev,微信公众号:Linux阅码场】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Linux内核内存管理架构解析

    内存管理子系统可能是linux内核中最为复杂的一个子系统,其支持的功能需求众多,如页面映射、页面分配、页面回收、页面交换、冷热页面、紧急页面、页面碎片管理、页面缓存、页面统计等,而且对
    的头像 发表于 01-04 09:24 305次阅读
    <b class='flag-5'>Linux</b><b class='flag-5'>内核</b>内存<b class='flag-5'>管理</b>架构<b class='flag-5'>解析</b>

    获取Linux内核源码的方法

    (ELF1/ELF1S开发板及显示屏)Linux内核是操作系统中最核心的部分,它负责管理计算机硬件资源,并提供对应用程序和其他系统组件的访问接口,控制着计算机的内存、处理器、设备驱动程序和文
    的头像 发表于 12-13 09:49 284次阅读
    获取<b class='flag-5'>Linux</b><b class='flag-5'>内核</b>源码的方法

    内核中的电源管理

    之前介绍的电源管理机制基本都是在Linux中实现的,可以看到很复杂,各种框架,明明一个操作非要转来转去,而且在内核里面实现,跟内核的各种框架又纠缠不清,什么consumer、Frame
    的头像 发表于 11-29 09:33 393次阅读
    微<b class='flag-5'>内核</b>中的电源<b class='flag-5'>管理</b>

    Linux内核UDP收包为什么效率低

    现在很多人都在诟病Linux内核协议栈收包效率低,不管他们是真的懂还是一点都不懂只是听别人说的,反正就是在一味地怼Linux内核协议栈,他们的武器貌似只有DPDK。 但是,即便
    的头像 发表于 11-13 10:38 237次阅读
    <b class='flag-5'>Linux</b><b class='flag-5'>内核</b>UDP收包为什么效率低

    如何优化Linux内核UDP收包效率低

    很多人都在诟病Linux内核协议栈收包效率低,不管他们是真的懂还是一点都不懂只是听别人说的,反正就是在一味地怼Linux内核协议栈,他们的武器貌似只有DPDK。 但是,
    的头像 发表于 11-10 10:51 272次阅读
    如何优化<b class='flag-5'>Linux</b><b class='flag-5'>内核</b>UDP收包效率低

    Linux内核如何使用结构体和函数指针?

    我将结合具体的Linux内核驱动框架代码来展示Linux内核如何使用结构体和函数指针。
    的头像 发表于 09-06 14:17 554次阅读
    <b class='flag-5'>Linux</b><b class='flag-5'>内核</b>如何使用结构体和函数指针?

    告诉你电容器那些鲜为人知秘密

    说到电容器,各位肯定不会陌生,它是电子设计中最基本的物理器件,与电阻和电感一样属于电子系统的基础部件。
    的头像 发表于 09-05 16:31 501次阅读
    告诉你电容器<b class='flag-5'>那些</b><b class='flag-5'>鲜为人知</b>的<b class='flag-5'>秘密</b>

    Linux内核的内存管理详解

    内存管理的主要工作就是对物理内存进行组织,然后对物理内存的分配和回收。但是Linux引入了虚拟地址的概念。
    发表于 08-31 14:46 425次阅读
    <b class='flag-5'>Linux</b><b class='flag-5'>内核</b>的内存<b class='flag-5'>管理</b>详解

    Linux内核的作用

    Linux操作系统是当今世界上最为广泛使用的开源操作系统之一,内核则是一个操作系统的核心和灵魂所在。对于一名Linux驱动开发者来说,了解Linux
    发表于 07-06 11:46 1197次阅读
    <b class='flag-5'>Linux</b><b class='flag-5'>内核</b>的作用

    Linux内核内存泄漏怎么办

    Linux内核开发中,Kmemleak是一种用于检测内核中内存泄漏的工具。
    发表于 07-04 11:04 580次阅读

    linux内核源码编译

    ,也不能对Minix开发者所作的设计进行修改,基于此linus开始了开发自己的操作系统,并于1991年年底在internet上发布了早期版本,由此Linux内核诞生。Linux内核的主
    发表于 06-27 15:37 551次阅读
    <b class='flag-5'>linux</b><b class='flag-5'>内核</b>源码编译

    Linux内核实现内存管理的基本概念

    本文概述Linux内核实现内存管理的基本概念,在了解基本概念后,逐步展开介绍实现内存管理的相关技术,后面会分多篇进行介绍。
    发表于 06-23 11:56 518次阅读
    <b class='flag-5'>Linux</b><b class='flag-5'>内核</b>实现内存<b class='flag-5'>管理</b>的基本概念

    Linux系统内核概述

    Linux 内核Linux 操作系统的主要组件,也是计算机硬件与其进程之间的核心接口。它负责两者之间的通信,还要尽可能高效地管理资源。
    发表于 06-09 09:29 344次阅读
    <b class='flag-5'>Linux</b>系统<b class='flag-5'>内核</b>概述

    在最熟知的芯片,解析最不为人知秘密--Nordic的蓝牙芯片nRF52832。

    /nRF51422升级而来,nRF52832是Cortex-M4F内核,并且拥有非常大的RAM和Flash,还有更多的功能以及更好的RF性能。nRF52832性能参数:功耗每一代新的BLE SoC出来,必定
    发表于 05-17 16:34

    Linux内核进程管理与调度:策略优化与实践分析

    一个与之相关的优先级,如果有多个可执行的进程等待CPU资源,那么具有更高优先级的进程将优先被调度执行。今天就给大家讲解一下Linux内核中的进程管理和调度,文章内容较长,大家记得先赞后看。
    发表于 05-08 09:42 588次阅读
    <b class='flag-5'>Linux</b><b class='flag-5'>内核</b>进程<b class='flag-5'>管理</b>与调度:策略优化与实践分析