Linux 进程概念：环境变量与进程地址空间 | 极客日志

C算法

Linux 进程概念：环境变量与进程地址空间

介绍 Linux 环境变量基本概念、常见变量及操作命令，讲解通过代码和系统调用获取设置环境变量的方法。同时深入解析程序地址空间，区分虚拟地址与物理地址，分析父子进程内存独立性，并阐述 mm_struct 结构与虚拟内存管理的重要性，说明虚拟地址空间在解决安全风险、地址不确定及效率问题上的作用。

观心发布于 2026/3/26更新于 2026/7/2143 浏览

一、环境变量

1、基本概念

环境变量 (environment variables) 一般是指在操作系统中用来指定操作系统运行环境的一些参数。
如：我们在编写 C/C++ 代码的时候，在链接的时候，从来不知道我们的所链接的动态静态库在哪里，但是照样可以链接成功，生成可执行程序，原因就是有相关环境变量帮助编译器进行查找。
环境变量通常具有某些特殊用途，还有在系统当中通常具有全局特性。

2、常见环境变量

PATH: 指定命令的搜索路径。
HOME: 指定用户的主工作目录 (即用户登陆到 Linux 系统中时，默认的目录)。
SHELL: 当前 Shell，它的值通常是/bin/bash。

3、查看环境变量方法

使用 echo $NAME 命令，其中 NAME 为环境变量名称。

测试 PATH

创建 hello.c 文件

#include <stdio.h>

int main() {
    printf("hello world!\n");
    return 0;
}

对比 ./hello 执行和直接 hello 执行。
为什么有些指令可以直接执行，不需要带路径，而我们的二进制程序需要带路径才能执行？
将我们的程序所在路径加入环境变量 PATH 当中，例如：export PATH=$PATH:/path/to/hello。
对比测试。
还有什么方法可以不用带路径，直接就可以运行呢？

测试 HOME

用 root 和普通用户，分别执行 echo $HOME，对比差异。
执行 cd ~; pwd，对应 ~ 和 HOME 的关系。

4、和环境变量相关的命令

echo: 显示某个环境变量值。
export: 设置一个新的环境变量。
env: 显示所有环境变量。
unset: 清除环境变量。
set: 显示本地定义的 shell 变量和环境变量。

5、环境变量的组织方式

每个程序都会收到一张环境表，环境表是一个字符指针数组，每个指针指向一个以'\0'结尾的环境字符串。

6、通过代码如何获取环境变量

命令行第三个参数

#include <stdio.h>

int main(int argc,  *argv[],  *env[]) {
     i = ;
     (; env[i]; i++) {
        (, env[i]);
    }
     ;
}

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online

#include <stdio.h>

int main(int argc, char *argv[]) {
    extern char **environ;
    int i = 0;
    for (; environ[i]; i++) {
        printf("%s\n", environ[i]);
    }
    return 0;
}

#include <stdlib.h>
char *getenv(const char *name);

#include <stdio.h>
#include <stdlib.h>

int main() {
    const char *path = getenv("PATH");
    if (path != NULL) {
        printf("PATH=%s\n", path);
    } else {
        printf("Environment variable PATH is not set.\n");
    }
    return 0;
}

#include <stdlib.h>
int putenv(char *string); // 注意这里不是 const char *

if (putenv((char *)"MY_VAR=Hello World") == 0) {
    puts("Successfully added environment variable MY_VAR.");
} else {
    perror("Error adding environment variable");
}

#include <stdio.h>
#include <stdlib.h>

int main() {
    char *env = getenv("MYENV");
    if (env) {
        printf("%s\n", env);
    }
    return 0;
}

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>

int g_unval;
int g_val = 100;

int main(int argc, char *argv[], char *env[]) {
    const char *str = "helloworld";
    printf("code addr: %p\n", main);
    printf("init global addr: %p\n", &g_val);
    printf("uninit global addr: %p\n", &g_unval);
    static int test = 10;
    char *heap_mem = (char *)malloc(10);
    char *heap_mem1 = (char *)malloc(10);
    char *heap_mem2 = (char *)malloc(10);
    char *heap_mem3 = (char *)malloc(10);
    printf("heap addr: %p\n", heap_mem);
    printf("heap addr: %p\n", heap_mem1);
    printf("heap addr: %p\n", heap_mem2);
    printf("heap addr: %p\n", heap_mem3);
    printf("test static addr: %p\n", &test);
    printf("stack addr: %p\n", &heap_mem);
    printf("stack addr: %p\n", &heap_mem1);
    printf("stack addr: %p\n", &heap_mem2);
    printf("stack addr: %p\n", &heap_mem3);
    printf("read only string addr: %p\n", str);
    for (int i = 0; i < argc; i++) {
        printf("argv[%d]: %p\n", i, argv[i]);
    }
    for (int i = 0; env[i]; i++) {
        printf("env[%d]: %p\n", i, env[i]);
    }
    return 0;
}

$ ./a.out 
code addr: 0x40055d
init global addr: 0x601034
uninit global addr: 0x601040
heap addr: 0x1791010
heap addr: 0x1791030
heap addr: 0x1791050
heap addr: 0x1791070
test static addr: 0x601038
stack addr: 0x7ffd0f9a4368
stack addr: 0x7ffd0f9a4360
stack addr: 0x7ffd0f9a4358
stack addr: 0x7ffd0f9a4350
read only string addr: 0x400800
argv[0]: 0x7ffd0f9a4811
env[0]: 0x7ffd0f9a4819
...

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>

int g_val = 0;

int main() {
    pid_t id = fork();
    if (id < 0) {
        perror("fork");
        return 0;
    } else if (id == 0) {
        // child
        printf("child[%d]: %d : %p\n", getpid(), g_val, &g_val);
    } else {
        // parent
        printf("parent[%d]: %d : %p\n", getpid(), g_val, &g_val);
    }
    sleep(1);
    return 0;
}

// 与环境相关，观察现象即可
parent[2995]:0:0x80497d8
child[2996]:0:0x80497d8

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>

int g_val = 0;

int main() {
    pid_t id = fork();
    if (id < 0) {
        perror("fork");
        return 0;
    } else if (id == 0) {
        // child, 子进程肯定先跑完，也就是子进程先修改，完成之后，父进程再读取
        g_val = 100;
        printf("child[%d]: %d : %p\n", getpid(), g_val, &g_val);
    } else {
        // parent
        sleep(3);
        printf("parent[%d]: %d : %p\n", getpid(), g_val, &g_val);
    }
    sleep(1);
    return 0;
}

// 与环境相关，观察现象即可
child[3046]:100:0x80497e8
parent[3045]:0:0x80497e8

struct task_struct {
    /*...*/
    struct mm_struct *mm; // 对于普通的用户进程来说该字段指向他的
                          // 虚拟地址空间的用户空间部分，对于内核线程来说这部分为 NULL。
    struct mm_struct *active_mm; // 该字段是内核线程使用的。当该
                                 // 进程是内核线程时，它的 mm 字段为 NULL，表示没有内存地址空间，可也并不是真正的没有，这是因为所有进程关于内核的映射都是一样的，内核线程可以使用任意进程的地址空间。
    /*...*/
}

struct mm_struct {
    /*...*/
    struct vm_area_struct *mmap; /* 指向虚拟区间 (VMA) 链表 */
    struct rb_root mm_rb; /* red_black 树 */
    unsigned long task_size; /* 具有该结构体的进程的虚拟地址空间的大小 */
    /*...*/// 代码段、数据段、堆栈段、参数段及环境段的起始和结束地址。
    unsigned long start_code, end_code, start_data, end_data;
    unsigned long start_brk, brk, start_stack;
    unsigned long arg_start, arg_end, env_start, env_end;
    /*...*/
}

struct vm_area_struct {
    unsigned long vm_start; // 虚存区起始
    unsigned long vm_end; // 虚存区结束
    struct vm_area_struct *vm_next, *vm_prev; // 前后指针
    struct rb_node vm_rb; // 红黑树中的位置
    unsigned long rb_subtree_gap;
    struct mm_struct *vm_mm; // 所属的 mm_struct
    pgprot_t vm_page_prot;
    unsigned long vm_flags; // 标志位
    struct {
        struct rb_node rb;
        unsigned long rb_subtree_last;
    } shared;
    struct list_head anon_vma_chain;
    struct anon_vma *anon_vma;
    const struct vm_operations_struct *vm_ops; // vma 对应的实际操作
    unsigned long vm_pgoff; // 文件映射偏移量
    struct file *vm_file; // 映射的文件
    void *vm_private_data; // 私有数据
    atomic_long_t swap_readahead_info;
#ifndef CONFIG_MMU
    struct vm_region *vm_region; /* NOMMU mapping region */
#endif
#ifdef CONFIG_NUMA
    struct mempolicy *vm_policy; /* NUMA policy for the VMA */
#endif
    struct vm_userfaultfd_ctx vm_userfaultfd_ctx;
} __randomize_layout;

Linux 进程概念：环境变量与进程地址空间

一、环境变量

1、基本概念

2、常见环境变量

3、查看环境变量方法

4、和环境变量相关的命令

5、环境变量的组织方式

6、通过代码如何获取环境变量

更多推荐文章

相关免费在线工具

7、通过系统调用获取或设置环境变量

getenv()

putenv()

8、环境变量通常是具有全局属性的

9、实验

二、程序地址空间

1、研究平台

2、程序地址空间回顾

3、虚拟地址

4、进程地址空间

5、虚拟内存管理 - 第一讲

6、为什么要有虚拟地址空间

更多推荐文章

相关免费在线工具

Linux 进程概念：环境变量与进程地址空间

一、环境变量

1、基本概念

2、常见环境变量

3、查看环境变量方法

4、和环境变量相关的命令

5、环境变量的组织方式

6、通过代码如何获取环境变量

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

7、通过系统调用获取或设置环境变量

getenv()

putenv()

8、环境变量通常是具有全局属性的

9、实验

二、程序地址空间

1、研究平台

2、程序地址空间回顾

3、虚拟地址

4、进程地址空间

5、虚拟内存管理 - 第一讲

6、为什么要有虚拟地址空间

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具