Python 遍历目录 | 极客日志

Python

Python 遍历目录

Python 目录遍历常用 os、pathlib 和 glob 模块。os.walk 支持递归遍历，os.listdir 仅列当前层。pathlib 提供面向对象路径处理，适合 Python 3.4+。glob 支持通配符匹配文件名。选择方法需考虑递归需求、路径处理便利性、文件匹配模式及版本兼容性。示例展示了使用 os.walk 统计特定文件总大小的实现。

活在当下发布于 2024/12/25更新于 2026/7/2039 浏览

Python 遍历目录

一、引言

在 Python 编程中，经常需要遍历目录以查找、读取或操作文件。遍历目录可以帮助我们管理文件系统，查找特定文件或执行批量任务。下面将介绍几种在 Python 中遍历目录的方法。

二、遍历目录的方法

1. 使用 os 模块

Python 的 os 模块提供了很多与操作系统交互的函数，其中 os.listdir() 和 os.walk() 是遍历目录的常用函数。

使用 os.listdir()

os.listdir() 函数可以列出指定目录下的所有文件和子目录。但需要注意的是，它只能列出指定目录下的直接内容，而不能递归地列出子目录中的文件。

import os

def list_files_in_dir(directory):
    for filename in os.listdir(directory):
        print(filename)

# 使用方法
list_files_in_dir('/path/to/your/directory')

使用 os.walk()

os.walk() 函数可以递归地遍历目录树，返回目录中的文件名和子目录名。它是一个生成器，每次调用会返回一个三元组，包含当前目录名、当前目录下的子目录名列表和当前目录下的非目录文件名列表。

import os

def traverse_directory(directory):
    for root, dirs, files in os.walk(directory):
        for name in files:
            print(os.path.join(root, name))
        for name in dirs:
            print(os.path.join(root, name))

# 使用方法
traverse_directory('/path/to/your/directory')

2. 使用 pathlib 模块（Python 3.4+）

Python 3.4 引入了 pathlib 模块，它提供了一种面向对象的方式来处理文件系统路径。pathlib 模块中的 Path 类提供了很多实用的方法，包括遍历目录。

from pathlib import Path

def traverse_directory_with_pathlib(directory):
    p = Path(directory)
    for subpath  p.iterdir():
         subpath.is_file():
            (subpath)
         subpath.is_dir():
            (subpath)



traverse_directory_with_pathlib(Path())

相关免费在线工具

curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online
JSON 压缩
通过删除不必要的空白来缩小和压缩JSON。在线工具，JSON 压缩在线工具，online

import glob

def list_files_with_glob(directory, pattern='*'):
    for filepath in glob.glob(os.path.join(directory, pattern)):
        print(filepath)

# 使用方法，搜索指定目录下的所有.txt 文件
list_files_with_glob('/path/to/your/directory', '*.txt')

import os

def find_and_process_txt_files(directory):
    total_size = 0
    for root, dirs, files in os.walk(directory):
        for name in files:
            if name.endswith('.txt'):
                filepath = os.path.join(root, name)
                total_size += os.path.getsize(filepath)
    return total_size

# 使用方法
total_size = find_and_process_txt_files('/path/to/your/directory')
print(f'Total size of .txt files: {total_size} bytes')

Python 遍历目录

Python 遍历目录

一、引言

二、遍历目录的方法

1. 使用 os 模块

使用 os.listdir()

使用 os.walk()

2. 使用 pathlib 模块（Python 3.4+）

更多推荐文章

相关免费在线工具

3. 使用 glob 模块

三、选择遍历方法的考虑因素

1. 递归性

2. 路径处理

3. 文件名匹配

4. 兼容性

5. 性能

四、示例：查找并处理特定文件

总结

更多推荐文章

相关免费在线工具

Python 遍历目录

Python 遍历目录

一、引言

二、遍历目录的方法

1. 使用 os 模块

使用 os.listdir()

使用 os.walk()

2. 使用 pathlib 模块（Python 3.4+）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3. 使用 glob 模块

三、选择遍历方法的考虑因素

1. 递归性

2. 路径处理

3. 文件名匹配

4. 兼容性

5. 性能

四、示例：查找并处理特定文件

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具