Linux匿名管道通信:原理深挖+代码实现,一篇吃透进程间数据流转

Linux匿名管道通信:原理深挖+代码实现,一篇吃透进程间数据流转

🔥个人主页:Cx330🌸

❄️个人专栏:《C语言》《LeetCode刷题集》《数据结构-初阶》《C++知识分享》

《优选算法指南-必刷经典100题》《Linux操作系统》:从入门到入魔

《Git深度解析》:版本管理实战全解

🌟心向往之行必能至


🎥Cx330🌸的简介:


目录

前言:

一. 进程间通信介绍

1.1 进程间通信目的

1.2 进程间通信的发展与分类

二、先搞懂:什么是管道?匿名管道有何特殊性?

2.1 管道的本质

2.2 管道的核心特性

三、匿名管道的创建

3.1 匿名管道的创建流程

3.2 匿名管道的使用示例

四. 核心深挖:匿名管道的底层原理

4.1 fork 共享管道的核心原理

4.2 从文件描述符视角理解管道通信

4.3 实战示例分析四个场景案例

五. 站在内核较低——管道的本质

5.1 管道的内核数据结构 

5.2 管道的内核实现逻辑

5.3 管道特点总结

六、总结:匿名管道的适用场景


前言:

在Linux系统中,进程之间的资源相互独立、地址空间隔离,想要实现数据交互就必须依靠进程间通信(IPC)机制。而匿名管道作为最基础、最经典的IPC方式,不仅是shell命令中“|”管道符的底层实现,更是理解Linux进程协作、内核缓存机制的入门钥匙。

这篇博客将从底层原理、核心特性、代码实现、常见坑点四个维度,彻底拆解匿名管道,带你从原理到实战掌握匿名管道通信的全流程。

声明:往后的学习中,博主就要更换配置了,语言更换为C++,云服务器从Centos更改为Ubuntu,文本编辑器改为VsCode与Xshell远程链接使用


一. 进程间通信介绍

在学习管道之前,我们需要先明确进程间通信的核心目的和分类,建立对 IPC 技术的整体认知,这能帮助我们更好地理解管道的设计初衷和应用场景。

1.1 进程间通信目的

进程间通信的本质是实现进程间的数据交互、资源共享和事件协同,具体可分为四个方面:

  • 数据传输:一个进程将自身数据发送给另一个进程,是最基础的 IPC 需求;
  • 资源共享:多个进程共享同一份系统资源(如文件、内存),提高资源利用率;
  • 通知事件:进程向其他进程发送事件通知,如子进程退出时通知父进程、进程完成任务后通知调度进程;
  • 进程控制:一个进程对另一个进程进行执行控制,如调试进程拦截目标进程的异常和陷入,实时获取其状态。

1.2 进程间通信的发展与分类

Linux 的 IPC 技术从 Unix 继承并不断发展,整体可分为三大类,管道是其中最基础的一类:

  • 管道:包括 匿名管道(pipe) 和 命名管道(FIFO),是最基础的 IPC 方式,基于文件系统实现;
  • System V IPC:包括共享内存消息队列信号量,由 System V 系统引入,基于内核的 IPC 资源管理实现(后续会讲共享内存的相关知识)
  • POSIX IPC:遵循 POSIX 标准的 IPC 方式,是对 System V IPC 的改进,包括 POSIX 共享内存、消息队列、信号量等。

管道作为最原始的 IPC 方式,虽然功能简单,但却是理解 Linux 进程间通信和文件系统的关键,也是实现其他复杂 IPC 的基础。

二、先搞懂:什么是管道?匿名管道有何特殊性?

2.1 管道的本质

管道本质上是内核开辟的一块环形缓冲区,不属于某个进程的地址空间,而是由内核管理的共享内存区域。进程通过文件描述符访问这块缓冲区,实现数据的“写入-读取”流转,就像一根连接两个进程的“数据管道”。

在 Linux 命令行中,我们经常使用的管道符|就是管道的典型应用,例如who | wc -l

  • who进程的标准输出被重定向到管道的写端;
  • wc -l进程的标准输入被重定向到管道的读端;内核中的管道缓冲区作为中间介质,完成两个进程间的数据传递。

我们还可以使用下图中这样的实验来看一下管道

  • 从图中我们可以看出最后他们三个指令的父进程都是bash的,他们之间是具有血缘关系的进程

2.2 管道的核心特性

管道的设计贴合 Linux一切皆文件的思想,其核心特性可总结为:

  • 半双工通信:数据只能沿一个方向流动,若需双向通信,需创建两个管道;
  • 基于缓冲区:管道的实质是内核缓冲区,数据写入后暂存于内核,直到被另一个进程读取;
  • 文件式操作:管道通过文件描述符操作,读写接口与文件一致(read/write),符合 Linux 文件操作规范;
  • 亲缘进程专属:匿名管道仅支持具有共同祖先的亲缘进程(父进程与子进程、兄弟进程)间通信。

三、匿名管道的创建

3.1 匿名管道的创建流程

匿名管道依靠 pipe() 系统调用创建,内核会完成三件事:

  1. 开辟一段环形缓冲区(默认大小一般为4096字节/页,可通过proc文件系统调整),作为数据中转站;
  2. 分配两个文件描述符:fd[0] 读端fd[1] 写端,严格单向通信;
  3. 返回文件描述符,由调用进程持有,fork()子进程会完整继承这两个文件描述符。
关键特性:匿名管道是半双工通信,数据只能从写端流入、读端流出,不支持双向传输;且数据遵循先进先出(FIFO)原则,无消息边界,是字节流通信。

匿名管道的创建函数:

#include <unistd.h> int pipe(int pipefd[2]); 

函数参数

  • pipefd:整型数组,是输出型参数,用于保存管道的读、写文件描述符:
    • pipefd[0]:管道的读端,仅用于读取管道中的数据;
    • pipefd[1]:管道的写端,仅用于向管道中写入数据。

返回值

  • 成功:返回 0;
  • 失败:返回 - 1,并设置errno表示错误原因。

注意:调用pipe函数的进程会同时持有管道的读端和写端,若要实现两个进程间的单向通信,需要在进程创建后关闭各自无用的文件描述符,避免数据读写异常

3.2 匿名管道的使用示例

下面的示例实现了一个基础的匿名管道通信:从键盘读取数据写入管道,再从管道读取数据输出到屏幕,直观展示管道的读写操作。

#include <cstdio> #include <cstdlib> #include <cstring> #include <unistd.h> int main() { int fds[2]; char buf[100]; int len; if (pipe(fds) == -1) { std::perror("make pipe"); std::exit(1); } while (std::fgets(buf, 100, stdin)) { len = std::strlen(buf); if (write(fds[1], buf, len) != len) { std::perror("write to pipe"); break; } std::memset(buf, 0x00, sizeof(buf)); if ((len = read(fds[0], buf, 100)) == -1) { std::perror("read from pipe"); break; } if (write(1, buf, len) != len) { std::perror("write to stdout"); break; } } return 0; } 

该示例中,进程自身同时完成管道的写和读操作,虽然未实现跨进程通信,但清晰展示了管道的基本读写流程:通过fd[1]写通过fd[0]读,操作接口与普通文件完全一致。


四. 核心深挖:匿名管道的底层原理

匿名管道本身由单个进程创建,要实现跨进程通信,需要借助fork函数创建子进程 —— 子进程会继承父进程的文件描述符表,从而与父进程共享同一个管道的读、写端,这是匿名管道实现亲缘进程通信的核心原理。

4.1 fork 共享管道的核心原理

fork函数创建的子进程会复制父进程的文件描述符表,包括父进程创建的管道读、写端文件描述符,因此父子进程会共享同一个内核管道缓冲区,实现数据互通。其核心步骤分为三步:

  • 父进程创建管道:父进程调用pipe创建管道,持有fd[0](读)和fd[1](写)两个文件描述符;
  • 父进程 fork 创建子进程:子进程继承父进程的文件描述符表,同样持有管道的fd[0]和fd[1];
  • 关闭无用的文件描述符:根据通信方向,父、子进程分别关闭无用的读 / 写端,实现单向通信。

例如要实现父进程写、子进程读,则:

  • 父进程关闭读端fd[0],仅保留写端fd[1]
  • 子进程关闭写端fd[1],仅保留读端fd[0]

4.2 从文件描述符视角理解管道通信

从文件描述符的角度,我们可以更清晰地看到父子进程共享管道的过程,以父读子写为例:

🔔 步骤 1:父进程创建管道
父进程的文件描述符表中,0、1、2 分别为标准输入、标准输出、标准错误,pipe创建的管道分配到 3(读端fd[0])和 4(写端fd[1])。

父进程:0(tty) 1(tty) 2(tty) 3(pipe读) 4(pipe写) 

🔔步骤 2:父进程 fork 创建子进程
子进程复制父进程的文件描述符表,此时父子进程的文件描述符 3、4 均指向同一个内核管道缓冲区。

父进程:0(tty) 1(tty) 2(tty) 3(pipe读) 4(pipe写) 子进程:0(tty) 1(tty) 2(tty) 3(pipe读) 4(pipe写) 
核心关键点:父子进程的文件描述符指向同一个内核管道缓冲区,这是进程间能通过管道通信的根本原因;关闭无用描述符则是为了保证通信的单向性,避免出现数据读写的混乱。

🔔步骤 3:关闭无用文件描述符
父进程关闭写端 4,子进程关闭读端 3,此时管道形成单向的 “子写父读” 通道,数据只能从子进程写入,父进程读出。

父进程:0(tty) 1(tty) 2(tty) 3(pipe读) - 子进程:0(tty) 1(tty) 2(tty) - 4(pipe写) 
核心关键点:父子进程的文件描述符指向同一个内核管道缓冲区,这是进程间能通过管道通信的根本原因;关闭无用描述符则是为了保证通信的单向性,避免出现数据读写的混乱。

4.3 实战示例分析四个场景案例

下面的示例实现了子进程向管道写入字符串,父进程从管道读取并打印的功能,是 “子写父读” 的标准实现:

#include <iostream> #include <string> #include <unistd.h> // 子进程:w void WriteData(int wfd) { int cnt=1; pid_t id=getpid(); while(true) { std::string message="hello father process, "; message+="cnt:" + std::to_string(cnt++) + ", my pid is: " + std::to_string(id); write(wfd,message.c_str(),message.size()); sleep(1); } } // 父进程:r void ReadData(int rfd) { char inbuffer[1024]; while(true) { ssize_t n=read(rfd,inbuffer,sizeof(inbuffer)-1); if(n>0) { inbuffer[n]='\0'; std::cout<<getpid()<<"# "<<inbuffer<<std::endl; } } } int main() { // 1.创建管道成功 int pipefd[2]={0}; int n=pipe(pipefd);//系统调用 (void)n; // 2.创建子进程 pid_t id=fork(); if(id==0) { // 3.形成单向通信的信道 // 子进程:w close(pipefd[0]); WriteData(pipefd[1]); close(pipefd[1]); exit(0); } else { // 3.形成单向通信的信道 // 父进程:r close(pipefd[1]); ReadData(pipefd[0]); close(pipefd[0]); } // 0->read fd, 1->write fd // 0->嘴巴->读, 1->笔->写 // std::cout<<"pipefd[0]:"<<pipefd[0]<<std::endl; // std::cout<<"pipefd[1]:"<<pipefd[1]<<std::endl; return 0; }
  • 通过对上述案例进行一定程度上的修改,有一想4种情况,大家注意看一下。

五. 站在内核较低——管道的本质

从文件描述符视角,我们理解了管道的使用流程,而从内核视角,我们能看透管道的底层实现 —— 管道的本质是内核中的一块缓冲区,由两个file结构体指向同一个inode,贴合 Linux “一切皆文件” 的设计思想。

5.1 管道的内核数据结构 

在 Linux 内核中,管道的底层实现涉及三个核心数据结构:

  • file结构体:进程的文件描述符表中的每个项都指向一个file结构体,记录文件的操作方式、当前偏移量等信息;
  • inode结构体:用于描述文件的物理属性,管道的inode中保存了管道缓冲区的地址、大小、读写位置等核心信息;
  • 管道缓冲区:内核中的一块连续内存,是管道实际存储数据的地方。

对于匿名管道,父子进程的fd[0]fd[1]会分别指向不同的file结构体,但这两个file结构体最终会指向同一个inode结构体,而该inode指向内核中的管道缓冲区

5.2 管道的内核实现逻辑

当进程对管道执行read/write操作时,内核的处理逻辑如下:

  • 写操作write(fd[1], data, len):内核将数据从进程地址空间复制到管道缓冲区,并更新inode中的写位置;
  • 读操作read(fd[0], buf, len):内核将管道缓冲区中的数据复制到进程地址空间,并更新inode中的读位置;
  • 缓冲区同步:内核会保证管道缓冲区的读写同步,若缓冲区为空,读操作会阻塞;若缓冲区满,写操作会阻塞。这个上面也有分析到一点。

简单来说,管道的读写操作本质是进程地址空间与内核缓冲区之间的数据拷贝,而两个进程共享同一个内核缓冲区,就实现了数据的跨进程传递。

5.3 管道特点总结


六、总结:匿名管道的适用场景

匿名管道的优势在于实现简单、效率高、内核原生支持,适合以下场景:

  • shell命令行的管道符实现;
  • 父子/兄弟进程间的简单数据流转;
  • 小批量、单向的字节流传输。

如果需要双向通信、无亲缘进程通信、大数据持久化传输,就需要进阶学习命名管道、共享内存、消息队列等更强大的IPC机制。

Read more

程序员的自我修养:用 AR 眼镜管理健康

程序员的自我修养:用 AR 眼镜管理健康

欢迎文末添加好友交流,共同进步! “ 俺はモンキー・D・ルフィ。海贼王になる男だ!” * 一、从一次体检说起 * 二、为什么是 AR 眼镜? * 三、技术选型:CXR-M SDK vs 灵珠平台 * 四、项目架构设计 * 五、从配置开始:Gradle 和权限 * 5.1 添加 SDK 依赖 * 5.2 权限配置 * 六、数据层实现 * 6.1 数据模型 * 6.2 数据仓库 * 七、SDK 封装层 * 7.1 发送提醒到眼镜 * 7.2 TTS 语音播报

By Ne0inhk
AirSim无人机仿真入门(一):实现无人机的起飞与降落

AirSim无人机仿真入门(一):实现无人机的起飞与降落

概述: 安装好所需要的软件和环境,通过python代码控制无人机进行起飞和降落。 参考资料: 1、知乎宁子安大佬的AirSim教程(文字教程,方便复制) 2、B站瑜瑾玉大佬的30天RL无人机仿真教程(视频教程,方便理解) 3、AirSim官方手册(资料很全,不过是纯英文的) AirSim无人机仿真入门(一):实现无人机的起飞与降落 * 1 安装AirSim * 1.1 参考教程 * 1.2 内容梳理 * 1.3 步骤总结 * 2 开始使用 AirSim * 2.1 参考教程 * 2.2 内容梳理 * 2.3 步骤总结 * 3 撰写python控制程序 * 3.1 参考教程 * 3.2 内容梳理

By Ne0inhk

OpenClaw 安装 + 接入飞书机器人完整教程

OpenClaw 安装 + 接入飞书机器人完整教程 OpenClaw 曾用名:ClawdBot → MoltBot → OpenClaw(同一软件,勿混淆) 适用系统:Windows 10/11 最后更新:2026年3月 一、什么是 OpenClaw? OpenClaw 是一款 2026 年爆火的开源个人 AI 助手,GitHub 星标已超过 10 万颗。 与普通 AI 聊天机器人的核心区别: * 真正的执行能力:不只回答问题,能实际操作你的电脑 * 24/7 全天候待命:睡觉时也能主动完成任务 * 完全开源免费:数据完全掌控在自己手中 * 支持国内平台:飞书、钉钉等均已支持接入 二、安装前准备:安装 Node.js 建议提前手动安装

By Ne0inhk
【机器人】复现 StreamVLN 具身导航 | 流式VLN | 连续导航

【机器人】复现 StreamVLN 具身导航 | 流式VLN | 连续导航

StreamVLN 通过在线、多轮对话的方式,输入连续视频,输出动作序列。 通过结合语言指令、视觉观测和空间位姿信息,驱动模型生成导航动作(前进、左转、右转、停止)。 论文地址:StreamVLN: Streaming Vision-and-Language Navigation via SlowFast Context Modeling 代码地址:https://github.com/OpenRobotLab/StreamVLN 本文分享StreamVLN 复现和模型推理的过程~ 下面是示例效果: 1、创建Conda环境 首先创建一个Conda环境,名字为streamvln,python版本为3.9; 然后进入streamvln环境,执行下面命令: conda create -n streamvln python=3.9 conda activate streamvln 2、 安装habitat仿真环境

By Ne0inhk