Linux 文件操作核心：缓冲区机制与文件描述符原理 | 极客日志

Linux 文件操作核心：缓冲区机制与文件描述符原理

Linux 文件操作中，C 标准库通过用户级缓冲区减少系统调用次数以提升效率。解析文件描述符与缓冲区的交互机制，对比 printf/fwrite/write 的输出差异及刷新策略（无缓冲、行缓冲、全缓冲）。通过模拟实现简易 C 文件库，展示_fopen、_fwrite、_fclose 等函数如何封装 open/write/close 系统调用，阐明进程退出时缓冲区刷新的关键逻辑。

灭霸发布于 2026/3/15更新于 2026/7/2040 浏览

一、文件描述符

1、重新认识缓冲区

#include <stdio.h>
#include <string.h>
#include <unistd.h>

int main(){
    const char* fstr = "hello fwrite\n";
    const char* str = "hello write\n";
    //Cprintf("hello printf\n");
    //stdout ---> 1
    fprintf(stdout, "hello fprintf\n");
    //stdout ---> 1
    fwrite(fstr, strlen(fstr), 1, stdout);
    //stdout ---> 1
    //close(1);
    //操作系统提供的系统接口
    write(1, str, strlen(str));
    //stdout ---> 1
    fork();
    return 0;
}

代码的结果为直接输出时显示正常输出，输出到文件中时 C 语言的接口输出了 2 次，系统调用的函数输出了 1 次。

原因：向显示器输出为行缓冲方式会依次输出到显示器中。当向文件中输出时，缓冲方式由行缓冲变成了全缓冲。即遇到 \n，不在刷新，而是等缓冲区被写满才刷新。

首先 write 通过缓冲区直接刷新，文件刷新为全缓冲，C 接口的函数的内容被存储在 C 语言提供的用户级缓冲区中，fork 之后创建子进程，父子进程的数据共享，子进程进行写时拷贝，C 语言提供的缓冲区里的数据被拷贝了 2 份，在进程退出时，C 语言的缓冲区被刷新。

#include <stdio.h>
#include <string.h>
# 

 {
     * fstr = ;
     * str = ;
    ();
    
    sleep();
    (, );
    
    sleep();
    fwrite(fstr, (fstr), , );
    
    sleep();
    write(, str, (str));
    
    sleep();
     ;
}

相关免费在线工具

Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online
JSON 压缩
通过删除不必要的空白来缩小和压缩JSON。在线工具，JSON 压缩在线工具，online
JSON美化和格式化
将JSON字符串修饰为友好的可读格式。在线工具，JSON美化和格式化在线工具，online

#include <stdio.h>
#include <string.h>
#include <unistd.h>

int main(){
    const char* fstr = "hello fwrite\n";
    const char* str = "hello write\n";
    //Cprintf("hello printf\n");
    //stdout ---> 1
    fprintf(stdout, "hello fprintf\n");
    //stdout ---> 1
    fwrite(fstr, strlen(fstr), 1, stdout);
    //stdout ---> 1
    close(1);
    //操作系统提供的系统接口
    write(1, str, strlen(str));
    //stdout ---> 1
    fork();
    return 0;
}

#include <stdio.h>
#include <string.h>
#include <unistd.h>

int main(){
    const char* fstr = "hello fwrite";
    printf("hello printf");
    //stdout ---> 1
    fprintf(stdout, "hello fprintf");
    //stdout ---> 1
    fwrite(fstr, strlen(fstr), 1, stdout);
    //stdout ---> 1
    close(1);
    return 0;
}

#include <stdio.h>
#include <string.h>
#include <unistd.h>

int main(){
    const char* str = "hello fwrite";
    write(1, str, strlen(str));
    //stdout ---> 1
    close(1);
    return 0;
}

#include <stdio.h>
#include <string.h>
#include <unistd.h>

int main(){
    printf("hello world");
    return 0;
}

#include <stdio.h>
#include <string.h>
#include <unistd.h>

int main(){
    printf("hello world");
    close(1);
    return 0;
}

#ifndef __MYFILE_H__ // 防止头文件重复包含（比#pragma once 更通用）
#define __MYFILE_H__
// 引入依赖的系统头文件
#include<stdlib.h>// malloc/free
#include<string.h>// memcpy/strcmp
#include<sys/types.h>
#include<sys/stat.h>// 文件状态相关
#include<fcntl.h>// open 系统调用的标志（O_CREAT、O_WRONLY 等）
#include<assert.h>// 断言（调试用）
#include<unistd.h>// close/write/sleep 系统调用

// 1. 宏定义：缓冲区大小 + 刷新策略
#define SIZE 1024 // 输出缓冲区大小：1024 字节
#define FLUSH_NOW 1 // 立即刷新（无缓冲）
#define FLUSH_LINE 2 // 行刷新（遇\n 刷）
#define FLUSH_ALL 4 // 全缓冲（满了刷）

// 2. 自定义文件结构体：替代标准库的 FILE
typedef struct IO_FILE{
    int fileno; // 文件描述符（操作系统给文件的唯一标识）
    int flag; // 缓冲刷新策略（FLUSH_NOW/FLUSH_LINE/FLUSH_ALL）
    // int in_pos; // （未实现）输入缓冲区当前位置
    // char inbuffer[SIZE]; // （未实现）输入缓冲区
    char outbuffer[SIZE]; // 输出缓冲区：存待写入文件的数据
    int out_pos; // 输出缓冲区当前已用长度（从 0 开始）
}_FILE;

// 重命名为_FILE，简化使用

// 3. 函数声明：对外提供的文件操作接口
_FILE*_fopen(const char* filename, const char* flag); // 打开文件
int _fwrite(_FILE* fp, const char* msg, int len); // 写入数据
void_fclose(_FILE* fp); // 关闭文件
void_fflush(_FILE* fp); // 强制刷新缓冲区
#endif

#include"myfile.h"
#define FILE_MODE 0666 // 文件创建时的权限（可读可写，所有者/组/其他用户）

_FILE*_fopen(const char* filename, const char* flag){
    assert(filename); // 调试断言：如果 filename 为 NULL，直接崩溃（避免非法访问）
    int open_flags = 0; // 传给 open 系统调用的标志
    int fd = -1; // 文件描述符（初始化为 -1，代表无效）

    // 1. 根据打开模式（flag）设置 open 的标志
    if(strcmp(flag,"w")==0) // 写模式：创建文件（不存在则建）、只写、覆盖原有内容
    {
        open_flags = O_CREAT|O_WRONLY|O_TRUNC; // O_CREAT：文件不存在则创建；O_WRONLY：只写；O_TRUNC：清空原有内容
        fd = open(filename, open_flags, FILE_MODE); // 创建文件时需指定权限
    }
    else if(strcmp(flag,"a")==0) // 追加模式：创建文件、只写、在文件末尾追加
    {
        open_flags = O_CREAT|O_WRONLY|O_APPEND; // O_APPEND：每次写都追加到文件末尾
        fd = open(filename, open_flags, FILE_MODE);
    }
    else if(strcmp(flag,"r")==0) // 读模式：只读（文件必须存在）
    {
        open_flags = O_RDONLY;
        fd = open(filename, open_flags); // 读模式不需要权限参数
    }
    else{return NULL; // 不支持的模式，返回 NULL
    }

    // 2. 检查 open 是否成功（fd == -1 代表失败，比如文件不存在、权限不够）
    if(fd == -1){return NULL;}

    // 3. 分配_FILE 结构体内存（用户层的文件对象）
    _FILE* fp = (_FILE*)malloc(sizeof(_FILE));
    if(fp == NULL) // 检查内存是否分配成功（避免内存不足导致崩溃）
    {
        return NULL;
    }

    // 4. 初始化_FILE 结构体
    fp->fileno = fd; // 绑定文件描述符
    fp->flag = FLUSH_ALL; // 默认使用'全缓冲'策略
    fp->out_pos = 0; // 输出缓冲区初始为空（已用长度为 0）
    return fp; // 返回用户层的文件指针
}

int _fwrite(_FILE* fp, const char* s, int len){
    // 1. 把数据拷贝到输出缓冲区（当前代码未处理缓冲区溢出！）
    memcpy(&fp->outbuffer[fp->out_pos], s, len);
    fp->out_pos += len; // 更新缓冲区已用长度

    // 2. 根据刷新策略，判断是否需要调用 write 刷新到文件
    if(fp->flag & FLUSH_NOW) // 立即刷新：不管缓冲区是否满，直接写
    {
        write(fp->fileno, fp->outbuffer, fp->out_pos);
        fp->out_pos = 0; // 刷新后，缓冲区重置为空
    }
    else if(fp->flag & FLUSH_LINE) // 行刷新：遇到\n 才刷新
    {
        if(fp->outbuffer[fp->out_pos -1]=='\n') // 检查最后一个字符是否是\n
        {
            write(fp->fileno, fp->outbuffer, fp->out_pos);
            fp->out_pos = 0;
        }
    }
    else if(fp->flag & FLUSH_ALL) // 全缓冲：缓冲区满了才刷新
    {
        if(fp->out_pos == SIZE) // 已用长度等于缓冲区大小，满了
        {
            write(fp->fileno, fp->outbuffer, fp->out_pos);
            fp->out_pos = 0;
        }
    }
    return len; // 返回写入的字节数（简化处理，未检查实际写入量）
}

void_fflush(_FILE* fp){
    if(fp->out_pos > 0) // 只有缓冲区有数据时才刷新
    {
        write(fp->fileno, fp->outbuffer, fp->out_pos);
        fp->out_pos = 0; // 重置缓冲区
    }
}

void_fclose(_FILE* fp){
    assert(fp); // 断言：fp 不能为 NULL（避免非法访问）
    _fflush(fp); // 1. 先强制刷新缓冲区（关键！否则缓冲区数据会丢失）
    close(fp->fileno); // 2. 关闭文件描述符（归还操作系统资源）
    free(fp); // 3. 释放_FILE 结构体内存（避免内存泄漏）
}

#include"myfile.h"
#define FILE_MODE 0666 //"w" "a" "r"

_FILE*_fopen(const char* filename, const char* flag){
    assert(filename);
    int f = 0;
    int fd = -1;
    if(strcmp(flag,"w")==0){
        f =(O_CREAT|O_WRONLY|O_TRUNC);
        fd = open(filename,f,FILE_MODE);
    }
    else if(strcmp(flag,"a")==0){
        f =(O_CREAT|O_WRONLY|O_APPEND);
        fd = open(filename,f,FILE_MODE);
    }
    else if(strcmp(flag,"r")==0){
        f = O_RDONLY;
        fd = open(filename,f);
    }
    else{return NULL;}
    if(fd == -1){return NULL;}
    _FILE* fp = (_FILE*)malloc(sizeof(_FILE));
    if(fp == NULL){return NULL;}
    fp->fileno = fd;
    fp->flag = FLUSH_ALL;
    fp->out_pos = 0;
    return fp;
}

int _fwrite(_FILE* fp, const char* s, int len){
    //"abcd\n"
    memcpy(&fp->outbuffer[fp->out_pos],s,len); // 没有做异常处理，也不考虑局部问题
    fp->out_pos += len;
    if(fp->flag & FLUSH_NOW){
        write(fp->fileno,fp->outbuffer,fp->out_pos);
        fp->out_pos = 0;
    }
    else if(fp->flag & FLUSH_LINE){
        if(fp->outbuffer[fp->out_pos-1]=='\n'){
            write(fp->fileno,fp->outbuffer,fp->out_pos);
            fp->out_pos = 0;
        }
    }
    else if(fp->flag & FLUSH_ALL){
        if(fp->out_pos == SIZE){
            write(fp->fileno,fp->outbuffer,fp->out_pos);
            fp->out_pos = 0;
        }
    }
    return len;
}

void_fflush(_FILE* fp){
    if(fp->out_pos > 0){
        write(fp->fileno,fp->outbuffer,fp->out_pos);
        fp->out_pos = 0;
    }
}

void_fclose(_FILE* fp){
    assert(fp); // 进程结束时，缓冲区有内容直接刷新
    _fflush(fp);
    close(fp->fileno);
    free(fp);
}

// 防止文件被重复包含
//#pragma once

#ifndef __MYFILE_H__
#define __MYFILE_H__
#include<stdlib.h>
#include<string.h>
#include<sys/types.h>
#include<sys/stat.h>
#include<fcntl.h>
#include<assert.h>
#include<unistd.h>

#define SIZE 1024
#define FLUSH_NOW 1
#define FLUSH_LINE 2
#define FLUSH_ALL 4

typedef struct IO_FILE{
    int fileno;
    int flag;
    //int in_pos;
    //char inbuffer[SIZE];
    char outbuffer[SIZE];
    int out_pos;
}_FILE;

_FILE*_fopen(const char* filename, const char* flag);
int _fwrite(_FILE* fp, const char* msg, int len);
void_fclose(_FILE* fp);
void_fflush(_FILE* fp);

#endif

#include "myfile.h"
#define filename "test.txt"

int main(){
    _FILE* fp = _fopen(filename,"a");
    if(fp == NULL){return 1;}
    const char* msg = "hello world\n";
    int cnt = 10;
    while(cnt){
        _fwrite(fp,msg,strlen(msg));
        sleep(1);
        cnt--;
    }
    _fclose(fp);
    return 0;
}

main:main.c myfile.c
gcc -o $@ $^-std=c99
.PHONY:clean
rm -f main

Linux 文件操作核心：缓冲区机制与文件描述符原理

一、文件描述符

1、重新认识缓冲区

更多推荐文章

相关免费在线工具

总结

2、exit 和 _exit

3、缓冲区的刷新问题

（1）无缓冲

（2）行缓冲

（3）全缓冲

4、进程退出

5、C 语言提供缓冲区的原因

二、模拟实现 C 文件标准库

1、为什么要'造轮子'？

2、核心原理

（1）系统调用与用户层封装

（2）缓冲区

（3）缓冲刷新的 3 种策略

3、代码拆解

（1）头文件 myfile.h

（2）文件 myfile.c

1. _fopen

2. _fwrite

3. _fflush

4. _fclose

4、运行与验证

5、完整代码展示

三、总结

更多推荐文章

相关免费在线工具

Linux 文件操作核心：缓冲区机制与文件描述符原理

一、文件描述符

1、重新认识缓冲区

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

总结

2、exit 和 _exit

3、缓冲区的刷新问题

（1）无缓冲

（2）行缓冲

（3）全缓冲

4、进程退出

5、C 语言提供缓冲区的原因

二、模拟实现 C 文件标准库

1、为什么要'造轮子'？

2、核心原理

（1）系统调用与用户层封装

（2）缓冲区

（3）缓冲刷新的 3 种策略

3、代码拆解

（1）头文件 myfile.h

（2）文件 myfile.c

1. _fopen

2. _fwrite

3. _fflush

4. _fclose

4、运行与验证

5、完整代码展示

三、总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具