0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

研究一下linux内存管理

Linux爱好者 来源:LemonCode 2020-05-20 09:17 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

过去的一周有点魔幻,有印象的有三个新闻:天猫总裁绯闻事件,蘑菇街裁员,不可能打工的周某也放出来了。三件事,两件和互联网行业相关,好像外面的世界很是精彩啊!吃瓜归吃瓜,学习还是不能落下。

连续写了两周的「微服务」有点腻,不过这个系列还会继续写。今天来带大家研究一下Linux内存管理。

对于精通CURD的业务同学,内存管理好像离我们很远,但这个知识点虽然冷门(估计很多人学完根本就没机会用上)但绝对是基础中的基础。

这就像武侠小说中的内功修炼,学完之后看不到立竿见影的效果,但对你日后的开发工作是大有裨益的,因为你站的更高了。

文中所有示例图都是我亲手画的,画图比码字还费时间,但大家看图理解比文字更直观,所以还是画了。需要高清示例图片的同学,文末有获取方式自取。

再功利点的说,面试的时候不经意间透露你懂这方面知识,并且能说出个一二三来,也许能让面试官对你更有兴趣,离升职加薪,走上人生巅峰又近了一步。

前提约定:本文讨论技术内容前提,操作系统环境都是x86架构的 32 位Linux系统。

虚拟地址

即使是现代操作系统中,内存依然是计算机中很宝贵的资源,看看你电脑几个T固态硬盘,再看看内存大小就知道了。

为了充分利用和管理系统内存资源,Linux采用虚拟内存管理技术,利用虚拟内存技术让每个进程都有4GB互不干涉的虚拟地址空间。

进程初始化分配和操作的都是基于这个「虚拟地址」,只有当进程需要实际访问内存资源的时候才会建立虚拟地址和物理地址的映射,调入物理内存页。

打个不是很恰当的比方,这个原理其实和现在的某某网盘一样。假如你的网盘空间是1TB,真以为就一口气给了你这么大空间吗?那还是太年轻,都是在你往里面放东西的时候才给你分配空间,你放多少就分多少实际空间给你,但你和你朋友看起来就像大家都拥有1TB空间一样。

虚拟地址的好处

避免用户直接访问物理内存地址,防止一些破坏性操作,保护操作系统

每个进程都被分配了4GB的虚拟内存,用户程序可使用比实际物理内存更大的地址空间

4GB的进程虚拟地址空间被分成两部分:「用户空间」和「内核空间」

用户空间内核空间

物理地址

上面章节我们已经知道不管是用户空间还是内核空间,使用的地址都是虚拟地址,当需进程要实际访问内存的时候,会由内核的「请求分页机制」产生「缺页异常」调入物理内存页。

把虚拟地址转换成内存的物理地址,这中间涉及利用MMU内存管理单元(Memory Management Unit ) 对虚拟地址分段和分页(段页式)地址转换,关于分段和分页的具体流程,这里不再赘述,可以参考任何一本计算机组成原理教材描述。

段页式内存管理地址转换

Linux内核会将物理内存分为3个管理区,分别是:

ZONE_DMA

DMA内存区域。包含0MB~16MB之间的内存页框,可以由老式基于ISA的设备通过DMA使用,直接映射到内核的地址空间。

ZONE_NORMAL

普通内存区域。包含16MB~896MB之间的内存页框,常规页框,直接映射到内核的地址空间。

ZONE_HIGHMEM

高端内存区域。包含896MB以上的内存页框,不进行直接映射,可以通过永久映射和临时映射进行这部分内存页框的访问。

物理内存区划分

用户空间

用户进程能访问的是「用户空间」,每个进程都有自己独立的用户空间,虚拟地址范围从从0x00000000至0xBFFFFFFF总容量3G 。

用户进程通常只能访问用户空间的虚拟地址,只有在执行内陷操作或系统调用时才能访问内核空间。

进程与内存

进程(执行的程序)占用的用户空间按照「 访问属性一致的地址空间存放在一起 」的原则,划分成5个不同的内存区域。访问属性指的是“可读、可写、可执行等 。

代码段

代码段是用来存放可执行文件的操作指令,可执行程序在内存中的镜像。代码段需要防止在运行时被非法修改,所以只准许读取操作,它是不可写的。

数据段

数据段用来存放可执行文件中已初始化全局变量,换句话说就是存放程序静态分配的变量和全局变量。

BSS段

BSS段包含了程序中未初始化的全局变量,在内存中bss段全部置零。

堆heap

堆是用于存放进程运行中被动态分配的内存段,它的大小并不固定,可动态扩张或缩减。当进程调用malloc等函数分配内存时,新分配的内存就被动态添加到堆上(堆被扩张);当利用free等函数释放内存时,被释放的内存从堆中被剔除(堆被缩减)

栈stack

栈是用户存放程序临时创建的局部变量,也就是函数中定义的变量(但不包括static声明的变量,static意味着在数据段中存放变量)。除此以外,在函数被调用时,其参数也会被压入发起调用的进程栈中,并且待到调用结束后,函数的返回值也会被存放回栈中。由于栈的先进先出特点,所以栈特别方便用来保存/恢复调用现场。从这个意义上讲,我们可以把堆栈看成一个寄存、交换临时数据的内存区。

上述几种内存区域中数据段、BSS段、堆通常是被连续存储在内存中,在位置上是连续的,而代码段和栈往往会被独立存放。堆和栈两个区域在i386体系结构中栈向下扩展、堆向上扩展,相对而生。

你也可以在linux下用size命令查看编译后程序的各个内存区域大小:

[lemon ~]# size /usr/local/sbin/sshd text data bss dec hexfilename1924532 12412 4268962363840 2411c0/usr/local/sbin/sshd

内核空间

在x86 32位系统里,Linux 内核地址空间是指虚拟地址从0xC0000000开始到0xFFFFFFFF为止的高端内存地址空间,总计1G的容量, 包括了内核镜像、物理页面表、驱动程序等运行在内核空间 。

内核空间细分区域.

直接映射区

直接映射区Direct Memory Region:从内核空间起始地址开始,最大896M的内核空间地址区间,为直接内存映射区。

直接映射区的896MB的「线性地址」直接与「物理地址」的前896MB进行映射,也就是说线性地址和分配的物理地址都是连续的。内核地址空间的线性地址0xC0000001所对应的物理地址为0x00000001,它们之间相差一个偏移量PAGE_OFFSET = 0xC0000000

该区域的线性地址和物理地址存在线性转换关系「线性地址 =PAGE_OFFSET+ 物理地址」也可以用virt_to_phys()函数将内核虚拟空间中的线性地址转化为物理地址。

高端内存线性地址空间

内核空间线性地址从 896M 到 1G 的区间,容量 128MB 的地址区间是高端内存线性地址空间,为什么叫高端内存线性地址空间?下面给你解释一下:

前面已经说过,内核空间的总大小 1GB,从内核空间起始地址开始的 896MB 的线性地址可以直接映射到物理地址大小为 896MB 的地址区间。

退一万步,即使内核空间的1GB线性地址都映射到物理地址,那也最多只能寻址 1GB 大小的物理内存地址范围。

请问你现在你家的内存条多大?快醒醒都 0202 年了,一般 PC 的内存都大于 1GB 了吧!

所以,内核空间拿出了最后的 128M 地址区间,划分成下面三个高端内存映射区,以达到对整个物理地址范围的寻址。而在 64 位的系统上就不存在这样的问题了,因为可用的线性地址空间远大于可安装的内存。

动态内存映射区

vmalloc Region该区域由内核函数vmalloc来分配,特点是:线性空间连续,但是对应的物理地址空间不一定连续。vmalloc分配的线性地址所对应的物理页可能处于低端内存,也可能处于高端内存。

永久内存映射区

Persistent Kernel Mapping Region该区域可访问高端内存。访问方法是使用alloc_page (_GFP_HIGHMEM)分配高端内存页或者使用kmap函数将分配到的高端内存映射到该区域。

固定映射区

Fixing kernel Mapping Region该区域和 4G 的顶端只有 4k 的隔离带,其每个地址项都服务于特定的用途,如ACPI_BASE等。

内核空间物理内存映射

回顾一下

上面讲的有点多,先别着急进入下一节,在这之前我们再来回顾一下上面所讲的内容。如果认真看完上面的章节,我这里再画了一张图,现在你的脑海中应该有这样一个内存管理的全局图。

内核空间用户空间全图

内存数据结构

要让内核管理系统中的虚拟内存,必然要从中抽象出内存管理数据结构,内存管理操作如「分配、释放等」都基于这些数据结构操作,这里列举两个管理虚拟内存区域的数据结构。

用户空间内存数据结构

在前面「进程与内存」章节我们提到,Linux进程可以划分为 5 个不同的内存区域,分别是:代码段、数据段、BSS、堆、栈,内核管理这些区域的方式是,将这些内存区域抽象成vm_area_struct的内存管理对象。

vm_area_struct是描述进程地址空间的基本管理单元,一个进程往往需要多个vm_area_struct来描述它的用户空间虚拟地址,需要使用「链表」和「红黑树」来组织各个vm_area_struct。

链表用于需要遍历全部节点的时候用,而红黑树适用于在地址空间中定位特定内存区域。内核为了内存区域上的各种不同操作都能获得高性能,所以同时使用了这两种数据结构。

用户空间进程的地址管理模型:

wm_arem_struct

内核空间动态分配内存数据结构

在内核空间章节我们提到过「动态内存映射区」,该区域由内核函数vmalloc来分配,特点是:线性空间连续,但是对应的物理地址空间不一定连续。vmalloc分配的线性地址所对应的物理页可能处于低端内存,也可能处于高端内存。

vmalloc分配的地址则限于vmalloc_start与vmalloc_end之间。每一块vmalloc分配的内核虚拟内存都对应一个vm_struct结构体,不同的内核空间虚拟地址之间有4k大小的防越界空闲区间隔区。

与用户空间的虚拟地址特性一样,这些虚拟地址与物理内存没有简单的映射关系,必须通过内核页表才可转换为物理地址或物理页,它们有可能尚未被映射,当发生缺页时才真正分配物理页面。

动态内存映射

总结一下

Linux内存管理是一个非常复杂的系统,本文所述只是冰山一角,从宏观角度给你展现内存管理的全貌,但一般来说,这些知识在你和面试官聊天的时候还是够用的,当然也希望大家能够通过读书了解更深层次的原理。

本文可以作为一个索引一样的学习指南,当你想深入某一点学习的时候可以在这些章节里找到切入点,以及这个知识点在内存管理宏观上的位置。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Linux
    +关注

    关注

    88

    文章

    11874

    浏览量

    220043
  • 固态硬盘
    +关注

    关注

    12

    文章

    1664

    浏览量

    60827

原文标题:别再说你不懂 Linux 内存管理了,10 张图给你安排的明明白白

文章出处:【微信号:LinuxHub,微信公众号:Linux爱好者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    MAX1917评估套件:DDR内存电源管理解决方案

    MAX1917评估套件:DDR内存电源管理解决方案 在电子设计领域,为DDR内存提供稳定、高效的电源管理至关重要。MAX1917评估套件(EV kit)就是这样
    的头像 发表于 04-03 11:45 277次阅读

    MAX1917:DDR内存电源管理的理想选择

    MAX1917:DDR内存电源管理的理想选择 在电子设备的设计中,电源管理是至关重要的环。特别是对于DDR内存等对电源要求较高的组件,需要
    的头像 发表于 03-17 17:15 518次阅读

    深度解析 | DMA-BUF适配Android与RK特性核心Patch:高性能内存管理升级方案

    在嵌入式Linux与Android设备中,DMA-BUF作为跨进程、跨设备的内存共享核心机制,直接决定了图形渲染、视频编解码、相机采集等关键场景的性能表现。款针对dma-buf的核心补丁add
    的头像 发表于 03-16 08:16 3259次阅读
    深度解析 | DMA-BUF适配Android与RK特性核心Patch:高性能<b class='flag-5'>内存</b><b class='flag-5'>管理</b>升级方案

    Linux内核三大核心模块深度解析:调度、内存与I/O

    Linux内核作为操作系统的核心,其进程调度、内存管理和文件I/O三大模块共同决定了系统的性能与稳定性。无论是多核服务器的高并发处理,还是嵌入式设备的资源受限场景,深入理解这些底层机制都是进行性能调
    的头像 发表于 03-12 09:00 345次阅读
    <b class='flag-5'>Linux</b>内核三大核心模块深度解析:调度、<b class='flag-5'>内存</b>与I/O

    Linux内核伙伴系统内存申请函数详解:从原理到实战

    Linux 内核中,内存管理是整个系统稳定运行的基石,而伙伴系统(Buddy System) 作为内核物理内存分配的核心机制,更是驱动开发、内核模块开发的必备知识点。它通过 "2
    的头像 发表于 02-10 16:58 3795次阅读
    <b class='flag-5'>Linux</b>内核伙伴系统<b class='flag-5'>内存</b>申请函数详解:从原理到实战

    Linux扩充Swap交换空间:解决内存不足的实用指南,这些影响要注意!

    大家在使用 Linux 系统(比如常用的 Ubuntu)时,是不是偶尔会遇到 “内存不足” 的弹窗?比如运行大型编译任务、多开虚拟机、做数据分析,或者把 Linux 当服务器用的时候,物理内存
    的头像 发表于 02-09 16:33 732次阅读
    <b class='flag-5'>Linux</b><b class='flag-5'>下</b>扩充Swap交换空间:解决<b class='flag-5'>内存</b>不足的实用指南,这些影响要注意!

    瑞萨RA系列FSP库开发实战指南之SPI通讯协议的结构和功能

    以RA6M5为例,SPI的功能结构框图如下图所示。接下来我们大致地研究一下它的结构和功能。
    的头像 发表于 02-03 13:53 1149次阅读
    瑞萨RA系列FSP库开发实战指南之SPI通讯协议的结构和功能

    Linux如何防止内存冲突?

    在聊这个话题之前,我们先回忆一下单片机系统中是如何分配内存的?如果没有bootloader,那硬件环境起来之后就直接进入主程序运行,如果有引导程序bootloader,那就需要设置好跳转地址,否则设置不对,系统就无法启动了。
    的头像 发表于 01-30 16:51 1493次阅读
    <b class='flag-5'>Linux</b>如何防止<b class='flag-5'>内存</b>冲突?

    Linux 开发嵌入式必备命令速查表

    管理等环节轻松应对各种问题。今天,我们整理了Linux嵌入式开发必备命令速查表,让你篇文章就能快速查阅。
    的头像 发表于 01-19 09:06 1133次阅读
    <b class='flag-5'>Linux</b> <b class='flag-5'>下</b>开发嵌入式必备命令速查表

    【「Linux 设备驱动开发(第 2 版)」阅读体验】+读深入理解Linux内核内存分配

    *kmalloc(size_t size, int flags);”函数。 通过对这章的学习,深刻体会到Linux内核的内存分配管理机制博大精深,有些知识点还是初次触碰到,当然也有
    发表于 01-16 20:05

    浅浅问一下,嵌入式端是用protobuf?

    浅浅问一下,嵌入式那边是不是都在用 protobuf 啊?听人说性能好、省流量、序列化快,移植过去代码量好像也不大,乍听真是嵌入式传输协议的“理想型”。但真上手搞起来,可能就发现事情没那么简单
    的头像 发表于 12-17 10:16 347次阅读
    浅浅问<b class='flag-5'>一下</b>,嵌入式端是用protobuf?

    rk基于linux/android内存管理

    内存分布   U-Boot 由前级 Loader 加载到 CONFIG_SYS_TEXT_BASE 地址,初始化时会探明当前系统的总内存容 量, 32 位平台上认为最大 4GB 可用(但是不影响
    的头像 发表于 12-15 10:42 368次阅读
    rk基于<b class='flag-5'>linux</b>/android<b class='flag-5'>内存</b><b class='flag-5'>管理</b>

    “碰一下”支付终端应用在酒店:智能无卡入住与客房控制

    “碰一下”支付终端和“碰一下”支付机具今年已在各种餐饮零售门店推广应用。就连天波小编家附近的村口小超市也用上了“碰一下”支付终端。近日,卤味龙头企业绝味食品宣布,全国门店将接入“支付宝碰一下
    的头像 发表于 07-04 09:57 1056次阅读
    “碰<b class='flag-5'>一下</b>”支付终端应用在酒店:智能无卡入住与客房控制

    一下终端,让自助售货机秒变 “家里的冰箱”

    继刷脸支付后,支付宝近日又推出了新的支付方式——碰一下支付。只需将手机轻轻靠近支付宝“碰一下”支付终端,即可完成支付,比以往要先解锁手机,调出APP的付款码再支付的操作环节要便捷和省时许多。“碰一下
    的头像 发表于 06-18 10:49 2286次阅读
    碰<b class='flag-5'>一下</b>终端,让自助售货机秒变 “家里的冰箱”

    麻烦管理员帮忙注销一下这个账号

    我想要注销jf_00115938这个账号,不想用这个平台,出于隐私保护,麻烦管理员帮忙注销一下
    发表于 06-10 08:51