Linux 一切皆文件：深入理解文件与文件 IO | 极客日志

Linux 一切皆文件：深入理解文件与文件 IO

Linux 系统编程中一切资源皆文件。文件概念（内容与属性），对比 C 标准库文件接口与系统调用接口（open/close/read/write）。阐述文件描述符分配规则及标准流（stdin/stdout/stderr）机制，介绍重定向原理及 dup2 函数用法。深入分析缓冲区机制（行缓冲/全缓冲/无缓冲），解释用户态与内核态数据拷贝流程，并通过 fork 示例说明缓冲区刷新时机对程序输出的影响。

kaikai发布于 2026/2/5更新于 2026/7/206.7K 浏览

一、理解文件

1.1、文件的概念

文件存储在磁盘上。（狭义）

Linux 中一切皆文件，即把所有需要交互的资源全部抽象成为文件：普通文件，目录文件，设备文件，管道文件...。（广义）

1.2、文件的认知

文件 = 内容 + 属性。

内容：文件存储的数据，如文本中的文字，程序二进制代码。

属性：文件的信息，包括文件名、大小、创建时间、权限、所有者等。

对于 0KB 的文件，即没有任何内容，但由于属性数据，所以占磁盘空间。

从系统角度看：对文件的操作其实是进程对文件的操作。

二、回顾 C 文件

2.1、C 文件接口

FILE *fopen(const char *path, const char *mode); // 写文件 int fputc(int character,FILE* stream)； int fputs(const char *s, FILE *stream); int fprintf(FILE *stream, const char *format, ...); size_t fwrite(const void *ptr, size_t size, size_t nmemb, FILE *stream); // 读文件 int fgetc(FILE* stream); char *fgets ( char *str, int num, FILE * stream ); int fscanf(FILE* stream, const char* format, ...); size_t fread(void *ptr, size_t size, size_t nmemb, FILE *stream); int fclose(FILE *stream);

2.2、实现 cat 指令

当我们执行 cat log.txt 指令，其实就是读 log.txt 文件。

#include<stdio.h>
#include<string.h>
// argv[0]：./cat
// argv[1]：文件名
int main(int argc, char* argv[]) {
    if(argc != 2) {
        printf("cat error\n");
        return 1;
    }
    FILE* fp = fopen(argv[1], "r"); // 打开文件
    if(fp == ) {
        perror();
         ;
    }
     buff[];
    () {
         ch = fread(buff, , (buff), fp); 
        (ch > ) {
            buff[ch] = ;
            (, buff);
        }
        (feof(fp)) ;
    }
    fclose(fp);
     ;
}

相关免费在线工具

Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online
JSON 压缩
通过删除不必要的空白来缩小和压缩JSON。在线工具，JSON 压缩在线工具，online
JSON美化和格式化
将JSON字符串修饰为友好的可读格式。在线工具，JSON美化和格式化在线工具，online

// 标志位
#define FIRST_FLAGS (1<<0)
#define SECOND_FLAGS (1<<1)
#define THIRD_FLAGS (1<<2)
#define FORTH_FLAGS (1<<3)
void Print(int flags) {
    if(flags & FIRST_FLAGS) printf("FIRST_FLAGS : %d\n", FIRST_FLAGS);
    if(flags & SECOND_FLAGS) printf("SECOND_FLAGS : %d\n", SECOND_FLAGS);
    if(flags & THIRD_FLAGS) printf("THIRD_FLAGS : %d\n", THIRD_FLAGS);
    if(flags & FORTH_FLAGS) printf("FORTH_FLAGS : %d\n", FORTH_FLAGS);
}
int main() {
    Print(FIRST_FLAGS);
    Print(FIRST_FLAGS | SECOND_FLAGS);
    Print(FIRST_FLAGS | SECOND_FLAGS | THIRD_FLAGS);
    Print(FIRST_FLAGS | SECOND_FLAGS | THIRD_FLAGS | FORTH_FLAGS);
    return 0;
}

// 路径：include/linux/fs.h
struct file {
    union {
        struct llist_node fu_llist;
        struct rcu_head fu_rcuhead;
    } f_u;
    struct path f_path; // 文件的路径（包含 dentry 和 vfsmount）
    const struct file_operations *f_op; // 文件操作方法（read/write 等）
    spinlock_t f_lock; // 保护该结构体的自旋锁
    atomic_long_t f_count; // 引用计数（被多少进程打开）
    unsigned int f_flags; // 文件打开时的标志（O_RDONLY/O_WRONLY/O_APPEND 等）
    fmode_t f_mode; // 文件的访问模式（读/写/执行权限）
    loff_t f_pos; // 当前读写位置（文件指针）
    struct fown_struct f_owner; // 信号异步 IO 相关的所有者信息
    const struct cred *f_cred; // 文件的安全凭证
    struct file_ra_state f_ra; // 预读状态
    void *private_data;// 驱动/文件系统的私有数据
};

int main() {
    // 关闭标准输出流
    close(1);
    int fd = open("log.txt", O_CREAT | O_WRONLY | O_TRUNC, 0666);
    printf("xxxxxxxxxx\n");
    fprintf(stdout, "sssssssssss\n");
    // close(fd);
    return 0;
}

int main() {
    printf("wwwwwwww\n");
    fprintf(stdout, "ssssssssss\n");
    const char *s = "hello Linux\n";
    fwrite(s, strlen(s), 1, stdout);
    return 0;
}

struct file { 
    // ...
    const struct file_operations *f_op; // 文件操作方法（read/write 等）
    // ...
};

struct file_operations {
    struct module *owner; //指向拥有该模块的指针；
    loff_t (*llseek) (struct file *, loff_t, int); //llseek 方法用作改变文件中的当前读/写位置，并且新位置作为 (正的) 返回值.
    ssize_t (*read) (struct file *, char __user *, size_t, loff_t *); //用来从设备中获取数据
    ssize_t (*write) (struct file *, const char __user *, size_t, loff_t *); //发送数据给设备。如果 NULL, -EINVAL 返回给调用 write 系统调用的程序。如果非负，返回值代表成功写的字节数.
    ssize_t (*aio_read) (struct kiocb *, const struct iovec *, unsigned long, loff_t); //初始化一个异步读 -- 可能在函数返回前不结束的读操作.
    ssize_t (*aio_write) (struct kiocb *, const struct iovec *, unsigned long, loff_t); //初始化设备上的一个异步写.
    int (*readdir) (struct file *, void *, filldir_t); //对于设备文件这个成员应当为 NULL; 它用来读取目录，并且仅对**文件系统**有用.
    unsigned int (*poll) (struct file *, struct poll_table_struct *);
    int (*ioctl) (struct inode *, struct file *, unsigned int, unsigned long);
    long (*unlocked_ioctl) (struct file *, unsigned int, unsigned long);
    long (*compat_ioctl) (struct file *, unsigned int, unsigned long);
    int (*mmap) (struct file *, struct vm_area_struct *); //mmap 用来请求将设备内存映射到进程的地址空间。如果这个方法是 NULL, mmap 系统调用 返回 -ENODEV.
    int (*open) (struct inode *, struct file *); //打开一个文件
    int (*flush) (struct file *, fl_owner_t id); //flush 操作在进程关闭它的设备文件描述符的拷贝时调用;
    int (*release) (struct inode *, struct file *); //在文件结构被释放时引用这个操作。如同 open, release 可以为 NULL.
    int (*fsync) (struct file *, struct dentry *, int datasync); //用户调用来刷新任何挂着的数据.
    int (*aio_fsync) (struct kiocb *, int datasync);
    int (*fasync) (int, struct file *, int);
    int (*lock) (struct file *, int, struct file_lock *); //lock 方法用来实现文件加锁; 加锁对常规文件是必不可少的特性，但是设备驱动几乎从不实 现它.
    ssize_t (*sendpage) (struct file *, struct page *, int, size_t, loff_t *, int);
    unsigned long (*get_unmapped_area)(struct file *, unsigned long, unsigned long, unsigned long, unsigned long);
    int (*check_flags)(int);
    int (*flock) (struct file *, int, struct file_lock *);
    ssize_t (*splice_write)(struct pipe_inode_info *, struct file *, loff_t *, size_t, unsigned int);
    ssize_t (*splice_read)(struct file *, loff_t *, struct pipe_inode_info *, size_t, unsigned int);
    int (*setlease)(struct file *, long, struct file_lock **);
};

// 在/usr/include/stdio.h
typedef struct _IO_FILE FILE; // 在/usr/include/libio.h
struct _IO_FILE {
    int _flags; /* High-order word is _IO_MAGIC; rest is flags.*/
    #define _IO_file_flags _flags //缓冲区相关
    /* The following pointers correspond to the C++ streambuf protocol. */
    /* Note: Tk uses the _IO_read_ptr and _IO_read_end fields directly. */
    char* _IO_read_ptr; /* Current read pointer */
    char* _IO_read_end; /* End of get area. */
    char* _IO_read_base; /* Start of putback+get area. */
    char* _IO_write_base; /* Start of put area. */
    char* _IO_write_ptr; /* Current put pointer. */
    char* _IO_write_end; /* End of put area. */
    char* _IO_buf_base; /* Start of reserve area. */
    char* _IO_buf_end; /* End of reserve area. */
    /* The following fields are used to support backing up and undo. */
    char *_IO_save_base; /* Pointer to start of non-current get area. */
    char *_IO_backup_base; /* Pointer to first valid character of backup area */
    char *_IO_save_end; /* Pointer to end of non-current get area. */
    struct _IO_marker *_markers;
    struct _IO_FILE *_chain;
    int _fileno; //封装的文件描述符
    #if 0
    int _blksize;
    #else
    int _flags2;
    #endif
    _IO_off_t _old_offset; /* This used to be _offset but it's too small. */
    #define __HAVE_COLUMN /* temporary */
    /* 1+column number of pbase(); 0 is unknown. */
    unsigned short _cur_column;
    signed char _vtable_offset;
    char _shortbuf[1]; /* char* _save_gptr; char* _save_egptr; */
    _IO_lock_t *_lock;
#ifdef _IO_USE_OLD_IO_FILE
};

int main() {
    // 库函数
    printf("hello printf\n");
    fprintf(stdout,"hello fprintf\n");
    const char *s = "hello fwrite\n";
    fwrite(s, strlen(s), 1, stdout);
    //系统调用
    const char* ss = "hello write\n";
    write(1, ss, strlen(ss));
    fork();
    return 0;
}

Linux 一切皆文件：深入理解文件与文件 IO

1.1、文件的概念

1.2、文件的认知

二、回顾 C 文件

2.1、C 文件接口

2.2、实现 cat 指令

更多推荐文章

相关免费在线工具

2.3、stdin & stdout & stderr

三、系统文件 IO

3.1、传递标志位的方法

3.2、系统调用接口

1、open——打开文件

2、close——关闭文件

3、write——写文件

4、read——读文件

3.3、文件描述符

文件描述符分配规则：

3.4、重定向

重定向函数——dup2

补充：标准错误重定向

3.5、理解一切皆文件

四、缓冲区

4.1、什么是缓冲区？

4.2、为什么要有缓冲区？

深入了解缓冲区

更多推荐文章

相关免费在线工具

Linux 一切皆文件：深入理解文件与文件 IO

1.1、文件的概念

1.2、文件的认知

二、回顾 C 文件

2.1、C 文件接口

2.2、实现 cat 指令

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.3、stdin & stdout & stderr

三、系统文件 IO

3.1、传递标志位的方法

3.2、系统调用接口

1、open——打开文件

2、close——关闭文件

3、write——写文件

4、read——读文件

3.3、文件描述符

文件描述符分配规则：

3.4、重定向

重定向函数——dup2

补充：标准错误重定向

3.5、理解一切皆文件

四、缓冲区

4.1、什么是缓冲区？

4.2、为什么要有缓冲区？

深入了解缓冲区

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具