Linux 进程替换原理：从 fork 到 exec 详解

进程替换是什么？

进程替换就是：一个正在运行的进程，用一个全新的可执行程序，完全替换掉自己当前的代码、数据和堆栈，但进程的 PID 保持不变。

简单来说，就像你正在用一个记事本，然后直接把它变成了一个浏览器 —— 窗口（PID）没变，但里面的程序已经完全换了。

我们先来看一个简单的演示，直观感受一下进程替换的效果。

#include <iostream>
#include <unistd.h>
using namespace std;
int main() {
    cout << "before: I am process, Mypid: " << getpid() << " Myppid: " << getppid() << endl;
    execl("/usr/bin/ls", "ls", "-l", "-a", NULL);
    cout << "after: I am process, Mypid: " << getpid() << " Myppid: " << getppid() << endl;
    return 0;
}

从结果能看到，execl 之后程序就变成 ls 了，原进程后续的代码不再执行，这就是进程替换。

进程替换原理

用 fork 创建子进程后，子进程执行的是和父进程相同的程序（但可能执行不同的代码分支）。为了让子进程执行另一个程序，我们通常会在子进程中调用一种 exec 函数。

当进程调用 exec 函数时，该进程的用户空间代码和数据会被新程序完全替换，并从新程序的启动例程开始执行。注意，调用 exec 并不会创建新进程，所以调用 exec 前后，进程的 PID 并未改变。

1. 进程替换会发生写时拷贝吗？

exec 替换不会触发写时拷贝（COW）。

COW 的触发前提：只有 fork() 创建子进程后，父子进程共享内存页，且某一方对共享页执行写入操作时，才会触发 COW。

exec 的本质：它会直接丢弃当前进程的代码段、数据段等所有用户空间内容，重新加载新程序，相当于销毁了原有的地址空间映射，不再与任何进程共享内存页。

子进程场景：fork() 后虽与父进程共享内存，但 exec() 会直接丢弃这些共享资源，无需写入，因此不触发 COW。

Linux 进程替换原理：从 fork 到 exec 详解

进程替换是什么？

进程替换原理

1. 进程替换会发生写时拷贝吗？

更多推荐文章

相关免费在线工具

2. 普通只读 vs COW 只读

3. exec 函数执行后，后续代码还会执行吗？

4. CPU 如何知道程序的入口地址？

5. 子进程进行程序替换后，会影响父进程的代码和数据吗？

exec 系列接口

1. execl

2. execlp

3. execv

4. execvp

5. execle

6. execvpe

exec 系列库函数与系统调用的关系

其他问题

问题：exec 系列函数只能执行系统命令吗？能不能执行自己写的程序？

问题：为什么我们的可执行程序、脚本，都能跨语言调用呢？

exec*有着加载器的作用

问题：父进程如何通过 exec*给子进程传递命令行参数和环境变量

putenv（新增环境变量）

问题：如何彻底替换环境变量？

更多推荐文章

相关免费在线工具

Linux 进程替换原理：从 fork 到 exec 详解

进程替换是什么？

进程替换原理

1. 进程替换会发生写时拷贝吗？

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2. 普通只读 vs COW 只读

3. exec 函数执行后，后续代码还会执行吗？

4. CPU 如何知道程序的入口地址？

5. 子进程进行程序替换后，会影响父进程的代码和数据吗？

exec 系列接口

1. execl

2. execlp

3. execv

4. execvp

5. execle

6. execvpe

exec 系列库函数与系统调用的关系

其他问题

问题：exec 系列函数只能执行系统命令吗？能不能执行自己写的程序？

问题：为什么我们的可执行程序、脚本，都能跨语言调用呢？

exec*有着加载器的作用

问题：父进程如何通过 exec*给子进程传递命令行参数和环境变量

putenv（新增环境变量）

问题：如何彻底替换环境变量？

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具