Python 自动化脚本实战：文件、办公与系统任务 | 极客日志

Python算法

Python 自动化脚本实战：文件、办公与系统任务

综述由AI生成详细讲解了如何使用 Python 进行各类自动化任务，涵盖文件管理、Excel 数据处理、图片编辑、系统进程控制、PDF 操作、邮件发送及网络爬虫等核心领域。提供了基于 os、shutil、pandas、PIL、psutil、PyPDF2 等主流库的完整代码示例，包含文件分类、空目录清理、表格合并、图片裁剪加水印、进程终止、PDF 加密等功能。文章还补充了环境搭建、错误处理机制、安全配置及定时调度等最佳实践，帮助开发者快速构建稳定高效的自动化脚本体系，提升工作效率。

星河入梦发布于 2025/2/7更新于 2026/6/119 浏览

在当今的快节奏工作环境中，自动化不再是一种奢侈，而是提高效率和精确性的必需手段。Python 以其易于学习和强大的功能而闻名，成为实现各种自动化任务的理想选择。无论是数据处理、报告生成，还是日常的文件管理，一个简单但有效的 Python 脚本就能大幅减轻您的工作负担。本文旨在提供一套完整的 Python 自动化脚本方案，涵盖文件管理、Excel 处理、图片操作、系统任务及 PDF 编辑等核心场景，帮助您构建高效的自动化工作流。

环境准备

在开始之前，请确保您的开发环境已安装 Python 3.6+ 版本。以下脚本依赖第三方库，建议通过 pip 安装所需模块：

pip install pandas pillow psutil PyPDF2 requests

一、自动化文件管理

1. 整理目录中的文件

此脚本用于自动将指定目录下的文件按扩展名分类移动，保持目录整洁。

import os
from shutil import move

def sort_files(directory_path):
    """
    遍历目录并按文件扩展名移动文件
    :param directory_path: 目标目录路径
    """
    if not os.path.exists(directory_path):
        raise FileNotFoundError(f"目录不存在：{directory_path}")
        
    for filename in os.listdir(directory_path):
        file_path = os.path.join(directory_path, filename)
        # 仅处理常规文件，跳过目录
        if os.path.isfile(file_path):  
            # 获取文件扩展名
            if '.' in filename:
                file_extension = filename.split('.')[-1]
                # 创建目标目录
                destination_directory = os.path.join(directory_path, file_extension)
                if not os.path.exists(destination_directory):
                    os.makedirs(destination_directory)
                # 移动文件
                try:
                    move(file_path, os.path.join(destination_directory, filename))
                    print(f"已移动：{filename} -> /")
                 Exception  e:
                    ()
            :
                ()


 __name__ == :
    sort_files()

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online

import os

def remove_empty_folders(directory_path):
    """
    递归删除目录树中所有空文件夹
    :param directory_path: 根目录路径
    """
    # 遍历目录树，topdown=False 确保从底层向上处理
    for root, dirs, files in os.walk(directory_path, topdown=False):
        for folder in dirs:
            folder_path = os.path.join(root, folder)
            # 如果目录为空，则删除
            if not os.listdir(folder_path):
                try:
                    os.rmdir(folder_path)
                    print(f"已删除空目录：{folder_path}")
                except OSError as e:
                    print(f"无法删除目录 {folder_path}: {e}")

# 替换下面的路径为自己想清理的目录的路径
remove_empty_folders('your_directory_path')

import os
import re

def rename_files(directory_path, pattern, replacement):
    """
    批量重命名文件
    :param directory_path: 目录路径
    :param pattern: 正则表达式匹配模式
    :param replacement: 替换字符串
    """
    count = 0
    for filename in os.listdir(directory_path):
        file_path = os.path.join(directory_path, filename)
        if os.path.isfile(file_path):
            new_filename = re.sub(pattern, replacement, filename)
            if new_filename != filename:
                try:
                    os.rename(file_path, os.path.join(directory_path, new_filename))
                    count += 1
                except FileExistsError:
                    print(f"目标文件已存在：{new_filename}")
    print(f"共重命名 {count} 个文件")

# 示例：将文件名中的 'old' 替换为 'new'
rename_files('your_directory_path', r'old', 'new')

import pandas as pd

def read_excel(file_path):
    """读取 Excel 文件返回 DataFrame"""
    return pd.read_excel(file_path)

def write_to_excel(data, file_path):
    """将 DataFrame 数据写入 Excel 文件"""
    df = pd.DataFrame(data) if not isinstance(data, pd.DataFrame) else data
    df.to_excel(file_path, index=False, engine='openpyxl')

# 示例流程
dataframe = read_excel('path_to_input_file.xlsx')
# 在此处对 dataframe 进行数据处理...
write_to_excel(dataframe, 'path_to_output_file.xlsx')

import pandas as pd

def merge_sheets(file_path, output_file_path):
    """
    合并 Excel 文件中的所有工作表
    :param file_path: 输入文件路径
    :param output_file_path: 输出文件路径
    """
    xls = pd.ExcelFile(file_path)
    all_dataframes = []
    
    for sheet_name in xls.sheet_names:
        sheet_df = pd.read_excel(xls, sheet_name)
        all_dataframes.append(sheet_df)
    
    # 使用 concat 替代 deprecated 的 append
    merged_df = pd.concat(all_dataframes, ignore_index=True)
    merged_df.to_excel(output_file_path, index=False)
    print(f"合并完成，保存至：{output_file_path}")

merge_sheets('path_to_your_excel_file.xlsx', 'merged_output.xlsx')

from PIL import Image

def resize_image(input_path, output_path, width, height):
    with Image.open(input_path) as image:
        # LANCZOS 是高质量降采样过滤器
        resized_image = image.resize((width, height), Image.Resampling.LANCZOS)
        resized_image.save(output_path)

def crop_image(input_path, output_path, box):
    """
    box: (left, upper, right, lower)
    """
    with Image.open(input_path) as image:
        cropped_image = image.crop(box)
        cropped_image.save(output_path)

# 示例
resize_image('input.jpg', 'resized.jpg', 800, 600)
crop_image('input.jpg', 'cropped.jpg', (100, 100, 400, 400))

from PIL import Image, ImageDraw, ImageFont

def add_watermark(input_path, output_path, watermark_text, font_size=36):
    image = Image.open(input_path).convert("RGBA")
    draw = ImageDraw.Draw(image)
    
    # 尝试加载字体，若失败则使用默认字体
    try:
        font = ImageFont.truetype("arial.ttf", font_size)
    except IOError:
        font = ImageFont.load_default()
        
    # 计算文本位置（居中）
    bbox = draw.textbbox((0, 0), watermark_text, font=font)
    text_width = bbox[2] - bbox[0]
    text_height = bbox[3] - bbox[1]
    x = (image.width - text_width) // 2
    y = (image.height - text_height) // 2
    
    # 绘制白色半透明文字
    draw.text((x, y), watermark_text, fill=(255, 255, 255, 128), font=font)
    image.save(output_path)

add_watermark('input.jpg', 'watermarked.jpg', 'Copyright 2024')

from PIL import Image

def create_thumbnail(input_path, output_path, size=(128, 128)):
    with Image.open(input_path) as image:
        # thumbnail 方法会保持宽高比
        image.thumbnail(size)
        image.save(output_path)

create_thumbnail('input.jpg', 'thumbnail.jpg')

import psutil

def get_running_processes():
    processes = []
    for p in psutil.process_iter(['pid', 'name', 'username']):
        try:
            processes.append(p.info)
        except (psutil.NoSuchProcess, psutil.AccessDenied):
            pass
    return processes

def kill_process_by_name(process_name):
    for p in psutil.process_iter(['pid', 'name']):
        try:
            if process_name.lower() in p.info['name'].lower():
                p.kill()
                print(f"已终止进程：{p.info['name']} (PID: {p.info['pid']})")
        except (psutil.NoSuchProcess, psutil.AccessDenied):
            continue

# 谨慎使用
# kill_process_by_name('notepad.exe')

import PyPDF2

def merge_pdfs(input_paths, output_path):
    pdf_merger = PyPDF2.PdfMerger()
    for path in input_paths:
        try:
            with open(path, 'rb') as f:
                pdf_merger.append(f)
            print(f"已添加：{path}")
        except Exception as e:
            print(f"添加失败 {path}: {e}")
    
    with open(output_path, 'wb') as f:
        pdf_merger.write(f)
    print(f"合并完成：{output_path}")

merge_pdfs(['pdf1.pdf', 'pdf2.pdf'], 'merged.pdf')

import PyPDF2

def add_password_protection(input_path, output_path, password):
    with open(input_path, 'rb') as f:
        reader = PyPDF2.PdfReader(f)
        writer = PyPDF2.PdfWriter()
        
        for page in reader.pages:
            writer.add_page(page)
        
        writer.encrypt(password)
        
        with open(output_path, 'wb') as out_f:
            writer.write(out_f)
        print("加密完成")

add_password_protection('input.pdf', 'protected.pdf', 'secure_password')

import smtplib
from email.mime.text import MIMEText
from email.header import Header

def send_email(subject, content, to_addr, smtp_server, port, user, password):
    msg = MIMEText(content, 'plain', 'utf-8')
    msg['From'] = Header(user, 'utf-8')
    msg['To'] = Header(to_addr, 'utf-8')
    msg['Subject'] = Header(subject, 'utf-8')
    
    try:
        server = smtplib.SMTP_SSL(smtp_server, port)
        server.login(user, password)
        server.sendmail(user, [to_addr], msg.as_string())
        server.quit()
        print("邮件发送成功")
    except Exception as e:
        print(f"发送失败：{e}")

# 配置示例
send_email(
    subject="日报通知",
    content="今日任务已完成。",
    to_addr="[email protected]",
    smtp_server="smtp.example.com",
    port=465,
    user="[email protected]",
    password="your_password"
)

import requests

def fetch_webpage(url):
    headers = {'User-Agent': 'Mozilla/5.0'}
    try:
        response = requests.get(url, headers=headers, timeout=10)
        response.raise_for_status()
        return response.text
    except requests.exceptions.RequestException as e:
        print(f"请求失败：{e}")
        return None

# 示例
html = fetch_webpage('https://www.python.org')
if html:
    print(f"获取到 {len(html)} 字节数据")

Python 自动化脚本实战：文件、办公与系统任务

环境准备

一、自动化文件管理

1. 整理目录中的文件

更多推荐文章

相关免费在线工具

2. 移除空白的文档

3. 批量重命名文件

二、Excel 办公自动化

1. 读取和写入数据

2. 合并多个工作表

三、图片处理

1. 图片调整大小与裁剪

2. 添加水印

3. 创建缩略图

四、系统任务自动化

1. 进程管理与监控

五、PDF 文件操作

1. 合并多个 PDF 文件

2. PDF 密码保护

六、邮件通知自动化

七、网络数据抓取

八、最佳实践与维护

结语

更多推荐文章

相关免费在线工具

Python 自动化脚本实战：文件、办公与系统任务

环境准备

一、自动化文件管理

1. 整理目录中的文件

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2. 移除空白的文档

3. 批量重命名文件

二、Excel 办公自动化

1. 读取和写入数据

2. 合并多个工作表

三、图片处理

1. 图片调整大小与裁剪

2. 添加水印

3. 创建缩略图

四、系统任务自动化

1. 进程管理与监控

五、PDF 文件操作

1. 合并多个 PDF 文件

2. PDF 密码保护

六、邮件通知自动化

七、网络数据抓取

八、最佳实践与维护

结语

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具