Linux 系统编程：深入理解文件与文件 IO 原理及实战 | 极客日志

Linux 系统编程：深入理解文件与文件 IO 原理及实战

介绍 Linux 系统中的文件概念及文件 IO 操作。涵盖狭义与广义文件定义，C 标准库接口（fopen/fread/fwrite）的使用与注意事项，以及内核系统调用接口（open/read/write/close）的实现原理。重点解析文件描述符（fd）的本质、分配规则及库函数与系统调用的关系，帮助开发者从原理层面掌握 Linux 文件 IO。

监控大屏发布于 2026/3/28更新于 2026/7/1041 浏览

前言

在 Linux 中，'文件'是一个贯穿始终的核心概念，而文件 IO（输入/输出）则是程序员与系统交互的基础手段。无论是日常的文件读写、设备操作，还是复杂的网络通信、进程间通信，背后都离不开文件与文件 IO 的支撑。

很多初学者在接触 Linux 文件 IO 时，往往会被 C 库函数、系统调用、文件描述符、缓冲区这些概念搞得晕头转向，不清楚它们之间的关联与区别。本文将从'文件是什么'出发，逐步深入 C 文件接口、系统文件 IO 的底层实现，带你彻底搞懂 Linux 文件与文件 IO 的核心逻辑，让你从'会用'升级到'懂原理'。

一、重新认识 Linux 中的'文件'：不止是磁盘中的文档

提到'文件'，很多人的第一反应是'存放在磁盘上的文档'——这其实是对文件的狭义理解。在 Linux 系统中，文件的概念被极大地拓展了，理解这一点是掌握 Linux 文件 IO 的关键。

1.1 狭义的文件：磁盘上的永久存储

从狭义上讲，文件是存储在磁盘等永久性存储介质上的数据集合。磁盘作为计算机的外设（兼具输入和输出功能），其上的文件不会因断电而丢失，这也是'永久性存储'的核心特点。

但你可能会有疑问：一个 0KB 的空文件，明明没有任何内容，为什么会占用磁盘空间？答案很简单：文件 = 属性（元数据）+ 内容。空文件虽然没有实际数据内容，但依然需要存储文件名、创建时间、权限、所属用户组等属性信息，这些元数据会占用少量磁盘空间。

比如我们创建一个空文件，通过 ls -l命令可以看到它的属性信息：

touch emptyfile
ls -l emptyfile
# 输出结果：-rw-rw-r-- 1 hyb hyb 0 Aug 26 18:00 emptyfile

其中，**--rw-rw-r--是权限属性，-hyb hyb是所属用户和组，-0是文件大小（内容为空），-Aug 26 18:00**是创建时间，这些都是文件的元数据。

1.2 广义的文件：Linux 的'万物皆文件'哲学

Linux 最核心的设计哲学之一就是'一切皆文件'。在 Linux 系统中，不仅磁盘上的文档是文件，键盘、显示器、网卡、打印机、进程、管道、套接字（socket）等都被抽象成了文件。

这种抽象设计带来了一个巨大的好处：开发者只需掌握一套 IO 接口，就能操作系统中的绝大部分资源。比如：

读取键盘输入，本质是读取'键盘文件'；向显示器输出内容，本质是写入'显示器文件'；网络通信中发送数据，本质是写入'套接字文件'；查看进程状态，本质是读取 /proc目录下的'进程文件'。

举个直观的例子，我们可以通过**cat命令读取/proc/cpuinfo**文件来查看 CPU 信息，这个文件并不是存储在磁盘上的真实文件，而是内核动态生成的'虚拟文件'：

cat /proc/cpuinfo

输出的内容就是 CPU 的型号、核心数等信息，这正是'万物皆文件'哲学的体现——通过文件接口统一访问各类系统资源。

1.3 文件操作的本质：进程与系统的交互

无论是操作磁盘文件，还是操作键盘、网卡等设备文件，本质上都是进程对文件的操作。因为进程是操作系统分配资源的基本单位，所有的文件操作都必须通过进程发起。

但这里有个关键知识点：进程并不会直接操作硬件（比如磁盘、键盘）。磁盘等硬件的管理者是操作系统，进程想要操作文件，必须通过操作系统提供的'系统调用接口'来请求内核完成相应的操作。

比如我们用 C 语言的**fwrite**函数向文件写入数据，其底层流程是：

进程调用 C 库函数****；函数封装内核提供的系统调用接口（如）；内核接收系统调用请求，操作磁盘硬件完成数据写入；内核将操作结果返回给 C 库函数，再由 C 库函数返回给进程。

相关免费在线工具

Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online
JSON 压缩
通过删除不必要的空白来缩小和压缩JSON。在线工具，JSON 压缩在线工具，online
JSON美化和格式化
将JSON字符串修饰为友好的可读格式。在线工具，JSON美化和格式化在线工具，online

fwrite

**fwrite**

write

FILE *fopen(const char *filename, const char *mode);

#include <stdio.h>
int main() {
    // 以只写模式打开当前路径下的 myfile 文件，不存在则创建
    FILE *fp = fopen("myfile", "w");
    if (!fp) {
        // 打开失败的错误处理
        printf("fopen error!\n");
        return 1;
    }
    printf("fopen success!\n");
    fclose(fp); // 关闭文件
    return 0;
}

gcc -o open_file open_file.c
./open_file
# 输出：fopen success!
ls # 会看到当前目录下新增了 myfile 文件

#include <stdio.h>
#include <unistd.h> // 包含 sleep 函数声明
int main() {
    FILE *fp = fopen("myfile", "w");
    if (!fp) {
        printf("fopen error!\n");
        return 1;
    }
    printf("进程运行中，PID：%d\n", getpid()); // 打印进程 ID
    sleep(30); // 暂停 30 秒，方便我们查看进程信息
    fclose(fp);
    return 0;
}

ls -l /proc/[进程 ID]/cwd

lrwxrwxrwx 1 hyb hyb 0 Aug 26 18:10 /proc/12345/cwd -> /home/hyb/io

size_t fwrite(const void *ptr, size_t size, size_t nmemb, FILE *stream);

#include <stdio.h>
#include <string.h>
int main() {
    FILE *fp = fopen("myfile", "w");
    if (!fp) {
        printf("fopen error!\n");
        return 1;
    }
    const char *msg = "hello bit!\n"; // 要写入的内容
    int count = 5; // 写入 5 次
    while (count--) {
        // 每次写入 strlen(msg)个字节，1 个数据单元
        fwrite(msg, strlen(msg), 1, fp);
    }
    fclose(fp); // 关闭文件，刷新缓冲区
    return 0;
}

gcc -o write_file write_file.c
./write_file
cat myfile
# 输出：
# hello bit!
# hello bit!
# hello bit!
# hello bit!
# hello bit!

size_t fread(void *ptr, size_t size, size_t nmemb, FILE *stream);

#include <stdio.h>
#include <string.h>
int main() {
    FILE *fp = fopen("myfile", "r");
    if (!fp) {
        printf("fopen error!\n");
        return 1;
    }
    char buf[1024]; // 缓冲区
    const char *msg = "hello bit!\n";
    size_t msg_len = strlen(msg);
    while (1) {
        // 每次读取 msg_len 个字节（即一行数据）
        size_t s = fread(buf, 1, msg_len, fp);
        if (s > 0) {
            // 成功读取到数据
            buf[s] = '\0'; // 添加字符串结束符
            printf("%s", buf);
        }
        if (feof(fp)) {
            // 判断是否到达文件末尾
            break;
        }
    }
    fclose(fp);
    return 0;
}

gcc -o read_file read_file.c
./read_file
# 输出结果与 myfile 文件内容一致

#include <stdio.h>
#include <string.h>
int main(int argc, char *argv[]) {
    // 检查参数：必须传入一个文件名
    if (argc != 2) {
        printf("用法：%s <文件名>\n", argv[0]);
        return 1;
    }
    FILE *fp = fopen(argv[1], "r");
    if (!fp) {
        printf("fopen error: 无法打开文件 %s\n", argv[1]);
        return 2;
    }
    char buf[1024];
    while (1) {
        // 每次读取 1024 个字节
        size_t s = fread(buf, 1, sizeof(buf), fp);
        if (s > 0) {
            buf[s] = '\0';
            printf("%s", buf);
        }
        if (feof(fp)) {
            break;
        }
    }
    fclose(fp);
    return 0;
}

gcc -o mycat mycat.c
./mycat myfile
# 相当于 cat myfile 命令

#include <stdio.h>
#include <string.h>
int main() {
    const char *msg1 = "hello fwrite\n";
    const char *msg2 = "hello printf\n";
    const char *msg3 = "hello fprintf\n";
    // 方式 1：fwrite 写入 stdout
    fwrite(msg1, strlen(msg1), 1, stdout);
    // 方式 2：printf（默认输出到 stdout）
    printf("%s", msg2);
    // 方式 3：fprintf 指定 stdout
    fprintf(stdout, "%s", msg3);
    return 0;
}

gcc -o output_display output_display.c
./output_display
# 输出：
# hello fwrite
# hello printf
# hello fprintf

#include <stdio.h>
#include <string.h>
int main() {
    char buf[1024];
    printf("请输入内容："); // 从 stdin 读取输入
    size_t s = fread(buf, 1, sizeof(buf), stdin);
    if (s > 0) {
        buf[s] = '\0'; // 向 stdout 输出
        printf("你输入的内容：%s", buf);
        // 向 stderr 输出（也是显示器）
        fprintf(stderr, "错误流输出：%s", buf);
    }
    return 0;
}

模式	含义	注意事项
`r`	只读打开文本文件	文件必须存在，否则打开失败
`r+`	读写打开文本文件	文件必须存在，读写指针位于文件开头
`w`	只写打开文本文件	文件不存在则创建，存在则清空（截断为 0 长度）
`w+`	读写打开文本文件	文件不存在则创建，存在则清空
`a`	追加写打开文本文件	文件不存在则创建，写指针位于文件末尾
`a+`	追加写 + 读取文本文件	文件不存在则创建，写指针位于末尾，读指针可移动到开头

#include <stdio.h>
#include <string.h>
int main() {
    FILE *fp = fopen("myfile", "a"); // 追加模式
    if (!fp) {
        printf("fopen error!\n");
        return 1;
    }
    const char *msg = "append message!\n";
    fwrite(msg, strlen(msg), 1, fp);
    fclose(fp);
    return 0;
}

#include <stdio.h>
// 定义三个标志位，每个对应一个二进制位
#define FLAG_ONE 0x01 // 二进制：0001
#define FLAG_TWO 0x02 // 二进制：0010
#define FLAG_THREE 0x04 // 二进制：0100
// 解析标志位
void parse_flags(int flags) {
    if (flags & FLAG_ONE) {
        printf("标志位包含 FLAG_ONE\n");
    }
    if (flags & FLAG_TWO) {
        printf("标志位包含 FLAG_TWO\n");
    }
    if (flags & FLAG_THREE) {
        printf("标志位包含 FLAG_THREE\n");
    }
    printf("------------------------\n");
}
int main() {
    parse_flags(FLAG_ONE); // 只传 FLAG_ONE
    parse_flags(FLAG_ONE | FLAG_TWO); // 传 FLAG_ONE 和 FLAG_TWO
    parse_flags(FLAG_ONE | FLAG_TWO | FLAG_THREE); // 传所有标志
    parse_flags(0); // 不传任何标志
    return 0;
}

gcc -o flags_demo flags_demo.c
./flags_demo
# 输出：
# 标志位包含 FLAG_ONE
# ------------------------
# 标志位包含 FLAG_ONE
# 标志位包含 FLAG_TWO
# ------------------------
# 标志位包含 FLAG_ONE
# 标志位包含 FLAG_TWO
# 标志位包含 FLAG_THREE
# ------------------------
# ------------------------

#include <stdio.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>
#include <string.h>
int main() {
    // 1. 关闭默认的文件创建掩码（确保文件权限按我们指定的设置）
    umask(0);
    // 2. 调用 open 系统调用打开/创建文件
    // O_WRONLY：只写模式；O_CREAT：文件不存在则创建；0644：文件权限
    int fd = open("myfile_sys", O_WRONLY | O_CREAT, 0644);
    if (fd < 0) {
        // 系统调用失败返回 -1
        perror("open error"); // perror 打印系统调用错误信息
        return 1;
    }
    printf("open success, fd = %d\n", fd);
    // 打印文件描述符
    // 3. 调用 write 系统调用写入数据
    const char *msg = "hello bit (syscall)!\n";
    int len = strlen(msg);
    int count = 5;
    while (count--) {
        // fd：文件描述符；msg：缓冲区；len：要写入的字节数
        ssize_t ret = write(fd, msg, len);
        if (ret < 0) {
            perror("write error");
            break;
        }
        printf("写入 %zd 字节\n", ret);
    }
    // 4. 调用 close 系统调用关闭文件
    close(fd);
    return 0;
}

gcc -o write_sys write_sys.c
./write_sys
# 输出：
# open success, fd = 3
# 写入 18 字节
# 写入 18 字节
# 写入 18 字节
# 写入 18 字节
# 写入 18 字节
cat myfile_sys
# 查看写入的内容

#include <stdio.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>
#include <string.h>
int main() {
    // 1. 以只读模式打开文件
    int fd = open("myfile_sys", O_RDONLY);
    if (fd < 0) {
        perror("open error");
        return 1;
    }
    printf("open success, fd = %d\n", fd);
    // 2. 调用 read 系统调用读取数据
    const char *msg = "hello bit (syscall)!\n";
    int msg_len = strlen(msg);
    char buf[1024];
    while (1) {
        // 每次读取 msg_len 个字节
        ssize_t ret = read(fd, buf, msg_len);
        if (ret > 0) {
            // 成功读取到数据
            buf[ret] = '\0';
            printf("%s", buf);
        } else if (ret == 0) {
            // 到达文件末尾
            printf("文件读取完毕\n");
            break;
        } else {
            // 读取错误
            perror("read error");
            break;
        }
    }
    // 3. 关闭文件
    close(fd);
    return 0;
}

gcc -o read_sys read_sys.c
./read_sys
# 输出结果与 myfile_sys 内容一致

#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
// 方式 1：打开已存在的文件
int open(const char *pathname, int flags);
// 方式 2：创建新文件（或打开已存在文件）
int open(const char *pathname, int flags, mode_t mode);

#include <unistd.h>
ssize_t write(int fd, const void *buf, size_t count);

#include <unistd.h>
ssize_t read(int fd, void *buf, size_t count);

#include <unistd.h>
int close(int fd);

#include <stdio.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>
int main() {
    // 新打开一个文件，查看 fd
    int fd1 = open("test1.txt", O_RDWR | O_CREAT, 0644);
    printf("fd1 = %d\n", fd1); // 输出 3
    // 再打开一个文件
    int fd2 = open("test2.txt", O_RDWR | O_CREAT, 0644);
    printf("fd2 = %d\n", fd2); // 输出 4
    // 关闭 fd1
    close(fd1);
    // 再打开一个文件，会复用 fd1 的下标（3）
    int fd3 = open("test3.txt", O_RDWR | O_CREAT, 0644);
    printf("fd3 = %d\n", fd3); // 输出 3
    close(fd2);
    close(fd3);
    return 0;
}

gcc -o fd_demo fd_demo.c
./fd_demo
# 输出：
# fd1 = 3
# fd2 = 4
# fd3 = 3

struct _IO_FILE {
    int _fileno; // 封装的文件描述符
    char *_IO_buf_base; // 缓冲区起始地址
    char *_IO_buf_end; // 缓冲区结束地址
    // 其他成员...
};

Linux 系统编程：深入理解文件与文件 IO 原理及实战

前言

一、重新认识 Linux 中的'文件'：不止是磁盘中的文档

1.1 狭义的文件：磁盘上的永久存储

1.2 广义的文件：Linux 的'万物皆文件'哲学

1.3 文件操作的本质：进程与系统的交互

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

二、回顾 C 文件接口：我们最常用的文件操作方式

2.1 打开文件：fopen 函数的使用与路径问题

实战代码：打开文件并处理错误

关键问题：系统如何确定文件的路径？

2.2 写入文件：fwrite 函数的使用

实战代码：向文件写入数据

2.3 读取文件：fread 函数与 feof 函数的坑

实战代码：读取文件内容

注意：feof 函数的'坑'

扩展：实现简单的 cat 命令

2.4 输出到显示器：stdout、printf 与 fprintf

三种常用的输出方式

2.5 标准输入、输出、错误流：stdin、stdout、stderr

2.6 fopen 的打开模式详解

示例：追加模式（a）的使用

三、系统文件 IO：深入内核的文件操作接口

3.1 一种传递标志位的方法：位运算的妙用

原理：每个标志位对应一个二进制位

实战代码：位运算传递标志位

3.2 系统调用写文件：open 与 write 的使用

实战代码：系统调用写文件

3.3 系统调用读文件：read 的使用

实战代码：系统调用读文件

3.4 系统文件 IO 接口详解

（1） open 系统调用：打开或创建文件

参数说明：

返回值：

（2） write 系统调用：向文件写入数据

参数说明：

返回值：

（3） read 系统调用：从文件读取数据

参数说明：

返回值：

（4） close 系统调用：关闭文件

参数说明：

返回值：

3.5 open 函数返回值：文件描述符的本质

（1）文件描述符的定义：数组的下标

（2）默认打开的三个文件描述符

实战验证：文件描述符的分配规则

（3）库函数与系统调用的关系

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具