Linux 性能实战：为什么使用写入时复制（COW）机制 | 极客日志

Linux 性能实战：为什么使用写入时复制（COW）机制

Linux 内存管理中的写入时复制（COW）机制允许进程间共享只读内存页，仅在写入时触发物理页复制。动态库加载时，代码段和常量段被多个进程共享，而可写数据段初始共享，修改后私有化。这种延迟分配策略大幅降低了多进程环境下的内存消耗，使 fork 操作更高效，提升了系统整体内存利用率。其核心设计原则为“先共享，按需复制”，通过页面错误自动驱动资源分配。

疯疯癫癫发布于 2026/3/17更新于 2026/7/2035 浏览

为什么 Linux 要使用写入时复制（COW）？从动态链接库内存共享讲清楚设计原则

在分析 Linux 内存时，很多工程师都会看到类似现象：

一个进程加载了 20MB 的动态库
启动 10 个相同进程
系统内存却没有增加 200MB，而只增加了很少一部分

这是 Linux 内存管理中一个非常核心的机制：写入时复制（Copy-On-Write, COW）。

但很多人有几个疑问：

动态库不是每个进程都要用吗？为什么不分别加载？
为什么不是一开始就分开，而是'写的时候才复制'？
动态库哪些内存共享，哪些不共享？
这个机制背后的设计原则是什么？

本文从工程视角，一步一步讲清楚。

一、先理解：进程的虚拟内存结构

一个进程的虚拟内存典型结构如下：

虚拟内存空间
+------------------+
| code segment     | 代码段（.text）
+------------------+
| rodata segment   | 只读数据段
+------------------+
| data segment     | 已初始化全局变量
+------------------+
| bss segment      | 未初始化全局变量
+------------------+
| heap             | malloc 分配
+------------------+
| mmap region      | 动态库映射
+------------------+
| stack            |
+------------------+

动态库（.so）通过 mmap 加载到 mmap region。

二、动态库加载后，哪些内存是共享的？

假设动态库 libexample.so 大小为 2MB，它的内部结构是：

libexample.so
.text    1.5MB ← 代码段（只读）
.rodata  0.3MB ← 常量段（只读）
.data    0.1MB ← 可写全局变量
.bss     0.1MB ← 可写全局变量

关键区别：

段	是否共享	原因
.text	✅ 共享	只读，不会修改
.rodata	✅ 共享	只读
.data	❌ 私有（COW）	可能修改
.bss	❌ 私有（COW）	可能修改

也就是说：

2MB 动态库中，大约 1.8MB 是共享的
只有 0.2MB 可能变成私有

这就是内存节省的来源。

三、关键机制：写入时复制（COW）

Linux 并不会一开始就复制 data/bss，而是：

先共享，写的时候再复制

流程如下：

进程 A 加载 libexample.so
进程 B 加载 libexample.so
共享物理页

相关免费在线工具

Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online
JSON 压缩
通过删除不必要的空白来缩小和压缩JSON。在线工具，JSON 压缩在线工具，online
JSON美化和格式化
将JSON字符串修饰为友好的可读格式。在线工具，JSON美化和格式化在线工具，online

动态库：
代码段 1.5MB
数据段 0.5MB

每进程占用：
代码段 1.5MB
数据段 0.5MB
总内存：100 × 2MB = 200MB

共享：
代码段：1.5MB
数据段初始共享部分（尚未被写入的页）：0.45MB
私有部分（被实际写入后触发 COW 的页）：100 × 0.05MB = 5MB
总内存：1.95MB + 5MB ≈ 7MB

方案	内存
立即复制	200MB
COW	7MB

97%

可能修改 → 立即复制

真正修改 → 才复制

pid = fork();

parent process
child process
共享所有物理页
parent write
child write
复制页

libc.so       3MB
libstdc++     2MB
libQt         20MB

25MB

25MB × 50 = 1250MB

≈ 25MB + 少量私有页

可能修改 → 复制

真正修改 → 才复制

write ↓
page fault ↓
kernel copy page ↓
resume execution

pmap -x <pid>

smem -r

动态库加载
只读段
可写段
共享物理页
共享物理页
共享物理页
进程写入
page fault
复制页
私有页

Linux 性能实战：为什么使用写入时复制（COW）机制

为什么 Linux 要使用写入时复制（COW）？从动态链接库内存共享讲清楚设计原则

一、先理解：进程的虚拟内存结构

二、动态库加载后，哪些内存是共享的？

三、关键机制：写入时复制（COW）

更多推荐文章

相关免费在线工具

四、为什么不一开始就复制？

方案 A：立即复制

方案 B：COW（Linux 实际方案，对比最坏情况与典型情况）

五、更重要的原则：延迟分配（Lazy Allocation）

六、fork() 是 COW 的经典应用

七、动态库如何影响多个进程内存占用

八、从物理页角度看共享关系

九、总结：COW 的本质设计原则

原则 1：最大化共享

原则 2：延迟成本（Lazy）

原则 3：用 page fault 驱动资源分配

十、一句话理解 COW（工程师版本）

十一、实践验证

十二、最终总结图

总结

更多推荐文章

相关免费在线工具

Linux 性能实战：为什么使用写入时复制（COW）机制

为什么 Linux 要使用写入时复制（COW）？从动态链接库内存共享讲清楚设计原则

一、先理解：进程的虚拟内存结构

二、动态库加载后，哪些内存是共享的？

三、关键机制：写入时复制（COW）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

四、为什么不一开始就复制？

方案 A：立即复制

方案 B：COW（Linux 实际方案，对比最坏情况与典型情况）

五、更重要的原则：延迟分配（Lazy Allocation）

六、fork() 是 COW 的经典应用

七、动态库如何影响多个进程内存占用

八、从物理页角度看共享关系

九、总结：COW 的本质设计原则

原则 1：最大化共享

原则 2：延迟成本（Lazy）

原则 3：用 page fault 驱动资源分配

十、一句话理解 COW（工程师版本）

十一、实践验证

十二、最终总结图

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具