Linux Ext 系列文件系统原理：从磁盘结构到文件存储

前言

本文探讨文件打开前的存储机制，围绕以下问题展开：

为什么打开文件要带文件路径？
打开文件时操作系统做了什么？
没被打开的文件在哪里？如何存放的？

目前可以回答第三个问题，没被打开的文件一定在磁盘这样的存储设备上。Ext 系列文件系统是专为磁盘等持久化块存储设备设计的文件系统。

一、理解磁盘

机械磁盘是计算机中唯一的机械设备，属于外设，特点是慢、容量大、价格便宜。大型互联网公司常使用磁盘来存数据。

磁盘的物理结构

在这里插入图片描述

主轴马达会一直高速旋转，磁头会高速左右摆动。

磁盘的存储结构

扇区是磁盘存储数据的基本单位，也是操作系统访问数据的基本单位，通常为 512 字节，它是块设备。

一般认为一个磁盘中各个半径不同的磁道所含的扇区数目是一样的，原因是不同磁道扇区的疏密程度不同，一般需要高频访问的数据在内侧，不太高频访问的数据就在外侧。

在这里插入图片描述

磁盘结构说明：

盘面和磁头是一对一对应的。
并且一个磁盘的所有磁头是共进退的，同一时间六个磁头都是访问的是对应盘面同一半径的磁道，我们把这六个磁头所在的六个相同半径的磁道合为一体称为柱面。

让磁盘动起来：

磁头左右摆动的本质是在定位哪个磁道。
盘面旋转的本质是在确定某个磁道后，定位该磁道（柱面）上的某一个扇区。

如何定位一个扇区呢？

可以先定位磁头（header）。
确定磁头要访问哪一个柱面 (磁道)（cylinder）。
定位一个扇区 (sector)。
这就叫做 CHS 地址定位，但是现代磁盘一般是用 LBA 地址定位。
一般磁头、磁道编号从 0 开始，扇区编号从 1 开始。

总结：

扇区是从磁盘读出和写入信息的最小单位，通常大小为 512 字节。
磁头（head）数：每个盘片一般有上下两面，分别对应 1 个磁头，共 2 个磁头。
磁道（track）数：磁道是从盘片外圈往内圈编号 0 磁道，1 磁道…，靠近主轴的同⼼圆用于停靠磁头，不存储数据。
柱面（cylinder）数：磁道构成柱面，数量上等同于磁道个数。
扇区（sector）数：每个磁道都被切分成很多扇形区域，每道的扇区数量相同。
圆盘（platter）数：就是盘片的数量。
磁盘容量=磁头数 × 磁道 (柱面) 数 × 每道扇区数 × 每扇区字节数。
细节：传动臂上的磁头是共进退的 (这点比较重要，后面会说明)。
柱面（cylinder），磁头（head），扇区（sector），显然可以定位数据了，这就是数据定位 (寻址) 方式之一，CHS 寻址方式。

磁盘的逻辑结构

理解过程

磁盘本质上虽然是硬质的，但是逻辑上我们可以把磁盘想象成为卷在一起的磁带，那么磁盘的逻辑存储结构我们也可以类似于:

在这里插入图片描述

/* * Structure of an inode on the disk */ struct ext2_inode { __le16 i_mode; /* 文件类型 + 权限（如截图中 `-rw-rw-r--`） */ __le16 i_uid; /* 所有者 UID 的低 16 位 */ __le32 i_size; /* 文件大小（字节），截图中 touch 创建的空文件为 0 */ __le32 i_atime; /* 最后访问时间（时间戳） */ __le32 i_ctime; /* inode 元数据最后修改时间（时间戳） */ __le32 i_mtime; /* 文件内容最后修改时间（时间戳，对应截图中 `10:55` 等） */ __le32 i_dtime; /* 文件删除时间（时间戳，未删除时无效） */ __le16 i_gid; /* 所属组 GID 的低 16 位 */ __le16 i_links_count; /* 硬链接数（截图中每个文件为 1） */ __le32 i_blocks; /* 文件占用的磁盘块总数 */ __le32 i_flags; /* 文件标志（如是否为特殊文件、日志标记等） */ union { struct { __le32 l_i_reserved1; } linux1; struct { __le32 h_i_translator; } hurd1; struct { __le32 m_i_reserved1; } masix1; } osd1; /* 操作系统相关字段（兼容 Linux、Hurd、Masix） */ __le32 i_block[EXT2_N_BLOCKS]; /* 数据块指针数组（直接/间接块，EXT2_N_BLOCKS 通常为 15） */ __le32 i_generation; /* 文件版本号（用于 NFS 等网络文件系统） */ __le32 i_file_acl; /* 文件 ACL（访问控制列表）的块指针 */ __le32 i_dir_acl; /* 目录 ACL 的块指针（若为目录时有效） */ __le32 i_faddr; /* 碎片地址（若文件启用碎片存储时使用） */ union { struct { __u8 l_i_frag; /* 碎片编号 */ __u8 l_i_fsize; /* 碎片大小 */ __u16 l_i_pad; /* 填充（字节对齐） */ __le16 l_i_uid_high; /* 所有者 UID 的高 16 位（扩展 UID 范围） */ __le16 l_i_gid_high; /* 所属组 GID 的高 16 位（扩展 UID 范围） */ __le32 l_i_reserved2; /* 保留字段 */ } linux2; struct { __u8 h_i_frag; /* 碎片编号（Hurd 系统用） */ __u8 h_i_fsize; /* 碎片大小（Hurd 系统用） */ __le16 h_i_mode_high; /* 高 16 位模式（Hurd 系统用） */ __le16 h_i_uid_high; /* 高 16 位 UID（Hurd 系统用） */ __le16 h_i_gid_high; /* 高 16 位 GID（Hurd 系统用） */ __le32 h_i_author; /* 作者标识（Hurd 系统用） */ } hurd2; struct { __u8 m_i_frag; /* 碎片编号（Masix 系统用） */ __u8 m_i_fsize; /* 碎片大小（Masix 系统用） */ __u16 m_pad1; /* 填充（字节对齐） */ __le32 m_i_reserved2; /* 保留字段（Masix 系统用） */ } masix2; } osd2; /* 操作系统相关字段（第二部分，兼容多系统） */ };

Linux Ext 系列文件系统原理：从磁盘结构到文件存储

前言

一、理解磁盘

磁盘的物理结构

磁盘的存储结构

磁盘的逻辑结构

理解过程

更多推荐文章

相关免费在线工具

真实过程

CHS/LBA 地址转换

二、引入文件系统

引入"块"概念

补充 OS 访问外设的实现细节

引入"分区"概念

文件内容 Data Blocks

文件属性 inode

inode 和 datablock 映射

GDT（Group Descriptor Table）

超级块（Super Block）

几个子问题（格式化、删除文件、文件名存储）

证明目录内容是文件和 inode 的映射关系

解决文件权限相关困惑

路径解析

路径缓存

总结

挂载分区

三、软硬链接

操作

原理和区别

应用场景

一些问题

更多推荐文章

相关免费在线工具

Linux Ext 系列文件系统原理：从磁盘结构到文件存储

前言

一、理解磁盘

磁盘的物理结构

磁盘的存储结构

磁盘的逻辑结构

理解过程

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

真实过程

CHS/LBA 地址转换

二、引入文件系统

引入"块"概念

补充 OS 访问外设的实现细节

引入"分区"概念

文件内容 Data Blocks

文件属性 inode

inode 和 datablock 映射

GDT（Group Descriptor Table）

超级块（Super Block）

几个子问题（格式化、删除文件、文件名存储）

证明目录内容是文件和 inode 的映射关系

解决文件权限相关困惑

路径解析

路径缓存

总结

挂载分区

三、软硬链接

操作

原理和区别

应用场景

一些问题

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具