当前位置：移动技术网 > 科技>操作系统>Linux > 【原创】（十四）Linux内存管理之page fault处理

【原创】（十四）Linux内存管理之page fault处理

2019年12月30日 | 移动技术网科技 | 我要评论

背景

read the fucking source code! --by 鲁迅
a picture is worth a thousand words. --by 高尔基

说明：

kernel版本：4.14
arm64处理器，contex-a53，双核
使用工具：source insight 3.5， visio

1. 概述

上篇文章分析到malloc/mmap函数中，内核实现只是在进程的地址空间建立好了vma区域，并没有实际的虚拟地址到物理地址的映射操作。这部分就是在page fault异常错误处理中实现的。

linux内核中的page fault异常处理很复杂，涉及的细节也很多，malloc/mmap的物理内存映射只是它的一个子集功能，下图大概涵盖了出现page fault的情况：

下边就开始来啃啃硬骨头吧。

2. arm64处理

page fault的异常处理，依赖于体系结构，因此有必要来介绍一下arm64的处理。
代码主要参考：arch/arm64/kernel/entry.s。

arm64在取指令或者访问数据时，需要把虚拟地址转换成物理地址，这个过程需要进行几种检查，在不满足的情况下都能造成异常：

地址的合法性，比如以39有效位地址为例，内核地址的高25位为全1，用户进程地址的高25位为全0；
地址的权限检查，这里边的权限位都位于页表条目中；

从上图中可以看到，最后都会调到do_mem_abort函数，这个函数比较简单，直接看代码，位于arch/arm64/mm/fault.c：

/*
 * dispatch a data abort to the relevant handler.
 */
asmlinkage void __exception do_mem_abort(unsigned long addr, unsigned int esr,
                     struct pt_regs *regs)
{
    const struct fault_info *inf = esr_to_fault_info(esr);
    struct siginfo info;

    if (!inf->fn(addr, esr, regs))
        return;

    pr_alert("unhandled fault: %s (0x%08x) at 0x%016lx\n",
         inf->name, esr, addr);

    mem_abort_decode(esr);

    info.si_signo = inf->sig;
    info.si_errno = 0;
    info.si_code  = inf->code;
    info.si_addr  = (void __user *)addr;
    arm64_notify_die("", regs, &info, esr);
}

该函数中关键的处理：根据传进来的esr获取fault_info信息，从而去调用函数。struct fault_info用于错误状态下对应的处理方法，而内核中也定义了全局结构fault_info，存放了所有的情况。
主要的错误状态和处理函数对应如下：

static const struct fault_info fault_info[] = {
    { do_bad,       sigbus,  0,     "ttbr address size fault"   },
    { do_bad,       sigbus,  0,     "level 1 address size fault"    },
    { do_bad,       sigbus,  0,     "level 2 address size fault"    },
    { do_bad,       sigbus,  0,     "level 3 address size fault"    },
    { do_translation_fault, sigsegv, segv_maperr,   "level 0 translation fault" },
    { do_translation_fault, sigsegv, segv_maperr,   "level 1 translation fault" },
    { do_translation_fault, sigsegv, segv_maperr,   "level 2 translation fault" },
    { do_translation_fault, sigsegv, segv_maperr,   "level 3 translation fault" },
    { do_bad,       sigbus,  0,     "unknown 8"         },
    { do_page_fault,    sigsegv, segv_accerr,   "level 1 access flag fault" },
    { do_page_fault,    sigsegv, segv_accerr,   "level 2 access flag fault" },
    { do_page_fault,    sigsegv, segv_accerr,   "level 3 access flag fault" },
    { do_bad,       sigbus,  0,     "unknown 12"            },
    { do_page_fault,    sigsegv, segv_accerr,   "level 1 permission fault"  },
    { do_page_fault,    sigsegv, segv_accerr,   "level 2 permission fault"  },
    { do_page_fault,    sigsegv, segv_accerr,   "level 3 permission fault"  },
     ...
};

从代码中可以看出：

出现0/1/2/3级页表转换错误时，会调用do_translation_fault，实际中do_translation_fault最终也会调用到do_page_fault；
出现1/2/3级页表访问权限的时候，会调用do_page_fault；
其他的错误则调用do_bad，其中未列出来的部分还包括do_sea等操作函数；

do_translation_fault

do_page_fault

do_page_fault函数为页错误异常处理的核心函数，与体系结构相关，上图中的handle_mm_fault函数为通用函数，也就是不管哪种处理器结构，最终都会调用到该函数。

3. `handle_mm_fault`

handle_mm_fault用于处理用户空间的页错误异常：

进程在用户模式下访问用户虚拟地址，触发页错误异常；
进程在内核模式下访问用户虚拟地址，触发页错误异常；
从do_page_fault函数的流程图中也能看出来，当触发异常的虚拟地址属于某个vma，并且拥有触发页错误异常的权限时，会调用到handle_mm_fault函数，而handle_mm_fault函数的主要逻辑是通过__handle_mm_fault来实现的。

流程如下图：

3.1 `do_fault`

do_fault函数用于处理文件页异常，包括以下三种情况：

读文件页错误；
写私有文件页错误；
写共享文件页错误；

3.2 `do_anonymous_page`

匿名页的缺页异常处理调用本函数，在以下情况下会触发：

malloc/mmap分配了进程地址空间区域，但是没有进行映射处理，在首次访问时触发；
用户栈不够的情况下，进行栈区的扩大处理；

3.3 `do_swap_page`

如果访问swap页面出错（页面不在内存中），则从swap cache或swap文件中读取该页面。
由于在4.14内核版本中，do_swap_page调用的很多函数都是空函数，无法进一步的了解，大体的流程如下图：

3.4 `do_wp_page`

do_wp_page函数用于处理写时复制（copy on write），会在以下两种情况处理：

创建子进程时，父子进程会以只读方式共享私有的匿名页和文件页，当试图写的时候，触发页错误异常，从而复制物理页，并创建映射；
进程创建私有文件映射，读访问后触发异常，将文件页读入到page cache中，并以只读模式创建映射，之后发生写访问后，触发cow；

关键的复制工作是由wp_page_copy完成的：

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

linux系统怎么使用alias创建命令别名?

linux系统怎么使用alias创建命令别名？linux系统中有很多命令，今天我们就来看看alias命令的使用方法，详细请看下文介绍... 20-02-13 [阅读全文]
linux怎么快速创建创建一次性的计划任务?

linux怎么快速创建创建一次性的计划任务？linux系统总想要创建一次性任务，该怎么创建呢？下面我们就来看看详细的教程，需要的朋友可以参考下... 20-02... [阅读全文]
linux下文本编辑器vim的使用方法(复制、粘贴、替换、行号、撤销、多文件操作)

这篇文章主要介绍了linux下文本编辑器vim的使用方法，包括复制、粘贴、替换、行号、撤销、多文件操作,需要的朋友可以参考下... 20-02-16 [阅读全文]
Linux虚拟机怎么拍摄快照并管理?

Linux虚拟机怎么拍摄快照并管理？安装Linux虚拟机后，想要将操作步骤保存成快照，并管理，该怎么实现呢？下面我们就来看看详细的教程，需要的朋友可以参考下..... [阅读全文]
linux中crontab计划任务怎么删除?

linux中crontab计划任务怎么删除？linux中想要删除crontab计划任务，该怎么删除呢？下面我们就来看看详细的教程，需要的朋友可以参考下... 2... [阅读全文]
linux系统比windows系统声音小怎么办?

linux系统比windows系统声音小怎么办？电脑安装linux系统后，发现比windows系统的声音小，想要将声音变大，该怎么办呢？下面我们就来看看详细的教... [阅读全文]
linux怎么查看防火墙是否开启并清除防火墙规则?

linux怎么查看防火墙是否开启并清除防火墙规则？linux系统想要看看有没有开启防火墙，怎么删除防火墙规则？下面我们就来看看详细的教程，需要的朋友可以参考下.... [阅读全文]
centos7搭建wordpress博客

安装apache 启动apache 设置apache开机自启访问公网地址检测apache是否正常安装MySQL数据库启动MySQL数据库查看My... [阅读全文]
linux命令行,gcc,g++零基础

【上手由易到难，推荐wsl,虚拟机】 1、tdm gcc, mingw(dev c++) 2、wsl(Windows Subsystem for Lin... [阅读全文]
自动化运维工具Ansible之Roles测验详解

Ansible Roles 详解与实战案例主机规划添加用户账号说明： 1、运维人员使用的登录账号； 2、所有的业务都放在 /app/ 下「yu... [阅读全文]