场景与目标
假设你在一家二手车公司工作,团队每天会收到大量客户反馈,这些反馈以 .txt 文件的形式保存在服务器上。现在经理要求你把它们展示在公司网站上。这听起来简单,但手动复制粘贴效率太低。我们需要写个脚本,自动把 .txt 文件里的内容读出来,整理成 Python 字典,然后推送到现有的 Django 网站后端。
准备工作
在开始之前,确保你的环境里装好了必要的库。除了 Python 标准库,我们还需要 requests 来发送网络请求。
pip install requests
第一步:遍历并读取文本文件
我们要处理的不是单个文件,而是一个目录下的所有 .txt 文件。这时候 os 模块就派上用场了。与其一个个去打开,不如直接列出目录下的文件名,循环处理。
这里有个小技巧,用 glob 或者 os.listdir 配合路径拼接都很方便。为了代码清晰,我推荐用 pathlib,它比传统的 os.path 更现代,也更不容易出错。
from pathlib import Path
import os
review_dir = Path("./reviews")
files = review_dir.glob("*.txt")
for file_path in files:
# 读取文件内容
with open(file_path, 'r', encoding='utf-8') as f:
content = f.read()
print(f"已读取:{file_path.name}")
注意编码问题,中文环境下一定要指定 utf-8,不然遇到生僻字容易报错。
第二步:将数据转为字典结构
文件读进来是纯文本字符串,Web 接口通常期望的是 JSON 格式的数据。我们需要把文本解析成字典。假设每行代表一条记录,或者整个文件是一个评论块。
这里我们可以根据业务需求灵活定义。比如,第一行是标题,后面是正文。
def parse_review(text):
lines = text.split('\n')
if len(lines) < 2:
return None
return {
"title": lines[0],
"content": .join(lines[:]),
:
}

