Linux 进程内存分配：malloc、brk、mmap 与 overcommit | 极客日志

Cjava

Linux 进程内存分配：malloc、brk、mmap 与 overcommit

`malloc()` 并不直接等于物理内存分配，它通常先走堆和 `brk()`，大块请求则转向 `mmap()`。通过查看 `/proc/[pid]/maps`、`strace` 和 `vm.overcommit_memory` 可以看到：默认 `overcommit=0` 时，分配上限受物理内存和系统策略限制；切到 `overcommit=1` 后，内核会先接受虚拟内存申请，`malloc()` 和直接 `mmap()` 的可申请上限都会大幅上升，但仍受分配器实现和地址空间碎片化影响。

片刻发布于 2026/6/300 浏览

Linux 进程内存分配：malloc、brk、mmap 与 overcommit

调用 malloc() 之后，内存并不是立刻'从物理 RAM 里掏出来'的。真正起作用的是进程的虚拟地址空间，malloc() 只是站在分配器这一层，把请求转成 brk() 或 mmap() 等内核接口。这个分配器怎么选、overcommit 怎么影响结果，实际跑一遍会比只看概念清楚得多。

看看进程的虚拟内存长什么样

进程的内存布局可以直接看 /proc/[pid]/maps：

$ cat /proc/14799/maps
00400000-00402000 r-xp 00000000 00:45 41291688 vaflmalloc
00402000-00403000 r--p 00001000 00:45 41291688 vaflmalloc
00403000-00404000 rw-p 00002000 00:45 41291688 vaflmalloc
00404000-00425000 rw-p 00000000 00:00 0 [heap]
...

这里能看到几块典型区域：

代码段 (r-xp)：可执行指令。
数据段 (r--p)：已初始化的全局变量、静态变量。
堆 (rw-p [heap])：malloc() 常用的空间来源。
映射区：共享库、文件映射，或者 mmap() 出来的匿名内存。
栈 (rw-p [stack])：局部变量和函数调用现场。
特殊区域：比如 [vvar]、[vdso]、[vsyscall]，和内核加速路径有关。

虚拟地址空间里通常会有不少空洞。它们不是'没用的垃圾区'，而是还没被进程占上的地址段。内核分配新映射时，往往就是从这些空隙里挑地方。单次能分到多大，最后还是要看地址空间是否还够完整。

`malloc()` 到底走哪条路

小块分配：先看堆，再用 `brk()` 扩一下

小块内存通常先从堆里找。比如：

void *ptr = malloc(10 * 1024);

分配器大致会这么做：

先检查当前堆里有没有现成的空闲块。
不够的话，调用 brk() 把堆顶往上推。
给这块内存补上分配器自己的元数据。
把可用指针返回给调用者。

用 strace 看会更直观：

$ strace -e brk ./our_program
brk(NULL) = 0x403000
brk(0x424000) = 0x424000

第一次是查当前 program break，也就是堆顶。第二次是申请把堆顶抬高。

大块分配：直接 `mmap()` 更省事

当请求变大以后，malloc() 往往不再硬挤堆，而是直接走 mmap()。下面这个例子分配 20MB：

相关免费在线工具

Keycode 信息
查找任何按下的键的javascript键代码、代码、位置和修饰符。在线工具，Keycode 信息在线工具，online
Escape 与 Native 编解码
JavaScript 字符串转义/反转义；Java 风格 \uXXXX（Native2Ascii）编码与解码。在线工具，Escape 与 Native 编解码在线工具，online
JavaScript / HTML 格式化
使用 Prettier 在浏览器内格式化 JavaScript 或 HTML 片段。在线工具，JavaScript / HTML 格式化在线工具，online
JavaScript 压缩与混淆
Terser 压缩、变量名混淆，或 javascript-obfuscator 高强度混淆（体积会增大）。在线工具，JavaScript 压缩与混淆在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online

void *ptr = malloc(20 * 1024 * 1024);

$ strace -e mmap ./our_program
mmap(NULL, 20971520, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0)= 0x7f3700858000

void* ptr = malloc(100ULL * 1024 * 1024 * 1024);
if(ptr)
    printf("Success!\n");
else
    printf("Failed!\n");

$ cat /proc/sys/vm/overcommit_memory
0

$ sysctl -w vm.overcommit_memory=1
vm.overcommit_memory = 1

# 直接 mmap 分配 125TB
mmap(NULL, 137438953472000, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0)= 0x7f4db1b34000

# malloc 尝试分配 70TB
mmap(NULL, 76965814472704, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0)= 0x39835adaf000

方法	Overcommit 禁用	Overcommit 启用
malloc()	~45 GB	~70 TB
Direct mmap()	~45 GB	~125 TB

Linux 进程内存分配：malloc、brk、mmap 与 overcommit

Linux 进程内存分配：malloc、brk、mmap 与 overcommit

看看进程的虚拟内存长什么样

`malloc()` 到底走哪条路

小块分配：先看堆，再用 `brk()` 扩一下

大块分配：直接 `mmap()` 更省事

更多推荐文章

相关免费在线工具

为什么申请 100GB 会失败

把 `overcommit` 打开，会发生什么

直接 `mmap()` 和 `malloc()` 的上限不一样

这些实验能说明什么

元数据是有成本的

阈值不是固定死的

真正卡你的，经常不是 RAM 本身

最大能分到多少

对嵌入式和内核开发更有用的部分

更多推荐文章

相关免费在线工具

Linux 进程内存分配：malloc、brk、mmap 与 overcommit

Linux 进程内存分配：malloc、brk、mmap 与 overcommit

看看进程的虚拟内存长什么样

malloc() 到底走哪条路

小块分配：先看堆，再用 brk() 扩一下

大块分配：直接 mmap() 更省事

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

为什么申请 100GB 会失败

把 overcommit 打开，会发生什么

直接 mmap() 和 malloc() 的上限不一样

这些实验能说明什么

元数据是有成本的

阈值不是固定死的

真正卡你的，经常不是 RAM 本身

最大能分到多少

对嵌入式和内核开发更有用的部分

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

`malloc()` 到底走哪条路

小块分配：先看堆，再用 `brk()` 扩一下

大块分配：直接 `mmap()` 更省事

把 `overcommit` 打开，会发生什么

直接 `mmap()` 和 `malloc()` 的上限不一样