上下文
首先,需要讲清楚什么是上下文。
每个任务运行前,CPU 都需要知道任务从哪里加载、又从哪里开始运行,这就涉及到 CPU 寄存器 和 程序计数器(PC):
- CPU 寄存器是 CPU 内置的容量小、但速度极快的内存;
- 程序计数器会存储 CPU 正在执行的指令位置,或者即将执行的指令位置。
这两个是 CPU 运行任何任务前都必须依赖的环境,因此叫做 CPU 上下文。
上下文切换
那么,什么是上下文切换呢?下面是一个上下文切换时需要履行的步骤:
- 将前一个 CPU 的上下文(也就是 CPU 寄存器和程序计数器里边的内容)保存起来;
- 然后加载新任务的上下文到寄存器和程序计数器;
- 最后跳转到程序计数器所指的新位置,运行新任务。
被保存起来的上下文会存储到系统内核中,等待任务重新调度执行时再次加载进来。
CPU 的上下文切换分三种:进程上下文切换、线程上下文切换、中断上下文切换。
系统调用
Linux 按照特权等级,把进程的运行空间分为内核空间和用户空间:
- 内核空间:具有最高权限,可以访问所有资源;
- 用户空间:只能访问受限资源,不能直接访问内存等硬件设备,必须借助系统调用。
进程可以在用户空间运行(叫作:进程用户态),也可以在内核空间运行(叫作:进程内核态)。从用户态到内核态需要系统调用完成。
系统调用过程中也会发生 CPU 上下文切换。CPU 寄存器会先保存用户态的状态,然后加载内核态相关内容。系统调用结束之后,CPU 寄存器要恢复原来保存的用户态,继续运行进程。所以,一次系统调用,发生两次 CPU 上下文切换。
需要注意的是,系统调用过程中,不涉及虚拟内存等进程用户态的资源,也不会切换进程。与通常所说的进程上下文切换不同:
- 进程上下文切换是指,从一个进程切换到另一个进程;
- 系统调用过程中一直是同一个进程在运行。
进程上下文切换
进程是由内核管理和调度的,进程的切换只能发生在内核态。 因此,进程的上下文不但包括虚拟内存、栈、全局变量等用户空间资源,还包括内核堆栈、寄存器等内核空间状态。所以,进程的上下文切换比系统调用多一个步骤:保存当前进程的内核状态和 CPU 寄存器之前,先把该进程的虚拟内存、栈等保存起来;加载下一个进程的内核态后,还需要刷新进程的虚拟内存和用户栈。保存上下文和恢复上下文需要内核在 CPU 上运行才能完成。
Linux 通过 TLB (Translation Lookaside Buffer) 管理虚拟内存到物理内存的映射关系。当虚拟内存更新后,TLB 也需要刷新,内存的访问速度会因此变慢。尤其在多处理器系统上,缓存被多个处理器共享,刷新缓存不仅影响当前处理器的进程,还会影响共享缓存的其他处理器进程。
Linux 会为每个 CPU 都维护一个就绪队列,将活跃进程(正在运行和正在等待 CPU 的进程)按照优先级和等待 CPU 时间来排序,然后选择最需要 CPU 的进程,也就是优先级最高和等待 CPU 时间最长的进程来运行。
进程切换时需要切换上下文,进程切换的场景有:
- 进程时间片耗尽;
- 系统资源不足(如内存不足);
- 进程通过睡眠函数 sleep 把自己挂起来;
- 当有优先级更高的进程运行时,为了去运行高优先级进程,当前进程会被挂起;
- 发生硬中断,CPU 上的进程会被挂起,然后去执行内核中的中断服务进程。
线程上下文切换
线程是调度的基本单位,而进程则是资源拥有的基本单位。
内核中的任务调度实际是在调度线程,进程只是给线程提供虚拟内存、全局变量等资源。线程上下文切换时,共享相同的虚拟内存和全局变量等资源不需要修改。而线程自己的私有数据,如栈和寄存器等,上下文切换时需要保存。
线程切换分两种情况:
- 前后两个线程属于不同进程;
- 前后两个线程属于同一个进程(速度更快,消耗更少资源)。
中断上下文切换
为了快速响应硬件的事件,中断处理会打断进程的正常调度和执行,然后调用中断处理程序,响应设备事件。在打断其他进程时,需要先将进程当前的状态保存下来,等中断结束后,进程仍然可以恢复回来。
跟进程上下文不同,中断上下文切换不涉及进程的用户态。所以,即便中断过程打断了一个正处在用户态的进程,也不需要保存和恢复这个进程的虚拟内存、全局变量等用户态资源。中断上下文,只包括内核态中断服务程序执行所必需的状态,也就是 CPU 寄存器、内核堆栈、硬件中断参数等。
对同一个 CPU 来说,中断处理比进程拥有更高的优先级,所以中断上下文切换不会与进程上下文切换同时发生。并且,由于中断会打断正常进程的调度和执行,所以大部分中断处理程序都短小精悍,以便可以尽快完成。
感谢
- 参考极客时间,倪朋飞老师的《Linux性能优化实战》之 03 | 基础篇:经常说的 CPU 上下文切换是什么意思?(上)
还不快抢沙发