没有废话,内存管理暂时告一段落,正式进入进程管理的内容。
内核通过 task_struct 描述进程
用命令 pstree 可以让内核以树形的结构把进程之间的关系列出来,如下图:
这是进程在内核中的结构形式,那么内核是如何来以树形结构管理描述这些进程的呢?用来描述进程的数据结构,可以理解为进程的属性。比如进程的状态、进程的标识(PID)等,都被封装在了进程描述符 task_struct 这个数据结构中。
struct task_struct {
......
/* -1 unrunnable, 0 runnable, >0 stopped: */
//任务状态。<0是不运行状态,=0是运行状态,>0是停止状态。
volatile long state;
......
//指向内核栈的指针
void *stack;
......
/*进程的调度策略,有6种。
*限期进程调度策略:SCHED_DEADLINE。
*实时进程调度策略:SCHED_FIFO,SCHED_RR。
*普通进程调度策略:SCHED_NORMAL,SCHED_BATCH,SCHED_IDLE。
*/
unsigned int policy;
......
//进程内存管理信息
struct mm_struct *mm;
struct mm_struct *active_mm;
......
//进程标识符,用来代表一个进程
pid_t pid;
......
//线程链表
struct list_head thread_group;
struct list_head thread_node;
struct completion *vfork_done;
......
/* Filesystem information: */
//文件系统信息
struct fs_struct *fs;
/* Open file information: */
//打开文件信息
struct files_struct *files;
......
/* CPU-specific state of this task: */
//进程的CPU状态,切换时,要保存到停止进程的task_struct中
struct thread_struct thread;
......
};
内核就是通过list_head链表把各个进程关系以树形结构管理起来的。
task_struct 结构体内容太多,这里只列出部分成员变量,感兴趣的读者可以去源码 include/linux/sched.h头文件查看。
task_struct 中的主要信息分类:
ARM64不用通过struct thread_info thread_info获取当前task_struct
static __always_inline struct task_struct *get_current(void)
{
unsigned long sp_el0;
asm ("mrs %0, sp_el0" : "=r" (sp_el0));
return (struct task_struct *)sp_el0;
}
#define current get_current()
可以看出 sp_el0 直接作为 task_struct 返回了。对于ARM64平台,记录当前进程的task_struct地址是利用sp0_el1寄存器,当内核执行进程切换时会把当前要运行的进程task_struct地址记录到该寄存器中。因此我们current查找task_struct时也是很简单了,不再用通过sp和thread_info去定位了。
volatile long state
-1是不运行的,=0是运行状态,>0是停止状态
Linux中的 ready 和 running 对应的都是TASK_RUNNING标志位,ready 表示进程正处在队列中,尚未被调度;running 则表示进程正在CPU上运行;
void *stack
指向内核栈的指针,内核通过 dup_task_struct 为每个进程都分配内核栈空间,并记录在此。
struct mm_struct *mm
与进程地址空间相关的信息。
task_struct 的分配和初始化
图中可知,上层应用通过各种方式创建进程时,最终都会通过 _do_fork 新建一个 task_struct。