Python 自动备份脚本：智能增量、多线程加速与压缩优化 | 极客日志

Python算法

Python 自动备份脚本：智能增量、多线程加速与压缩优化

一个基于 Python 的文件自动备份脚本，解决了手动备份易出错、效率低的问题。脚本支持智能增量检测，仅同步更新文件；采用多线程并发传输提升速度；对大文件自动进行 gzip 压缩以节省空间。通过 argparse 实现命令行参数配置，支持多源目录备份及目标路径管理。适用于企业数据归档、自媒体素材管理及各类文件安全存储场景。

Ne0发布于 2026/3/26更新于 2026/7/132 浏览

文件自动备份脚本：智能增量与多线程加速

背景与需求

在企业数据管理中，手动备份常面临文件损坏、版本覆盖或遗漏的风险。为解决这一问题，开发了一个基于 Python 的自动备份脚本，支持定时运行、智能增量检测及大文件压缩。

核心代码功能展示

该备份脚本核心逻辑在 sync_root 和 transfer_file 函数中。以下是关键部分的解析：

# 1. 智能判断：源文件是否更新过？
def size_if_newer(source, target):
    src_stat = os.stat(source)  # 获取源文件元数据（大小、修改时间）
    try:
        target_ts = os.stat(target).st_mtime
    except FileNotFoundError:
        target_ts = 0  # 若目标不存在返回 0
    # 时间差>1 秒才认为有更新（避免亚秒级误差）
    return src_stat.st_size if (src_stat.st_mtime - target_ts > 1) else False

# 2. 文件传输：自动判断压缩或直接复制
def transfer_file(source, target, compress):
    try:
        if compress:
            # 文件大于阈值，先 gzip 压缩再存
            with gzip.open(target + '.gz', 'wb') as target_fid:
                with open(source, 'rb') as source_fid:
                    target_fid.writelines(source_fid)
            print('Compress {}'.format(source))
        else:
            # 小文件直接复制，保留元数据
            shutil.copy2(source, target)
            print(.(source))
     FileNotFoundError:
        
        os.makedirs(os.path.dirname(target))
        transfer_file(source, target, compress)


 ():
    size = size_if_newer(source, target)
     size:
        thread = threading.Thread(
            target=transfer_file,
            args=(source, target, size > compress)
        )
        thread.start()
         thread

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online

def parse_input():
    parser = argparse.ArgumentParser()
    parser.add_argument('-t', '--target', required=True, help='备份目标文件夹路径')
    parser.add_argument('-s', '--source', nargs='+', required=True, help='源文件夹（支持多个）')
    parser.add_argument('-c', '--compress', type=int, default=[1024000], help='压缩阈值（字节），默认 1MB')
    
    if len(sys.argv) == 1:
        parser.print_help()
        sys.exit()
    return parser.parse_args()

# 使用示例：
# python Auto_Backup.py -t ./Backup -s ./HR_Data ./Payroll -c 2048000

parser = argparse.ArgumentParser(description='数据自动备份系统 v1.0')
parser.add_argument('target', help='目标路径（必填，位置参数）')
parser.add_argument('-s', '--source', nargs='+', required=True, help='源路径（支持多个）')
group = parser.add_mutually_exclusive_group()
group.add_argument('--backup', action='store_true', help='执行备份')
group.add_argument('--restore', action='store_true', help='执行恢复')

threads = []
for file in file_list:
    thread = threading.Thread(target=transfer_file, args=(file,))
    thread.start()
    threads.append(thread)

for thread in threads:
    thread.join()

import os
def calculate_threshold(disk_free_space):
    if disk_free_space > 100 * 1024 ** 3:
        return 5 * 1024 ** 3  # 空间充足，5MB 以上才压缩
    elif disk_free_space < 10 * 1024 ** 3:
        return 100 * 1024 ** 3  # 空间紧张，100KB 就压缩
    else:
        return 1024 ** 3  # 默认 1MB

# 修改默认参数为 10MB
parser.add_argument('-c', '--compress', default=[10*1024*1024])

def sync_root(root, arg):
    for path, _, files in os.walk(root):
        for source in files:
            if not source.endswith('.pdf'): continue
            # ... 后续逻辑不变

def sync_root_with_metadata(root, arg):
    platform = os.path.basename(root)
    dated_target = arg.target[0] + f"_{platform}_{datetime.datetime.now().strftime('%Y%m%d')}"
    metadata = {}
    for path, _, files in os.walk(root):
        for source in files:
            source_path = path + '/' + source
            file_hash = hashlib.md5(open(source_path, 'rb').read()).hexdigest()
            metadata[source_path] = file_hash
    with open(dated_target + '/metadata.json', 'w') as f:
        json.dump(metadata, f)

Python 自动备份脚本：智能增量、多线程加速与压缩优化

文件自动备份脚本：智能增量与多线程加速

背景与需求

核心代码功能展示

更多推荐文章

相关免费在线工具

命令行参数解析

执行流程

关键技术点

命令行参数设计

多线程同步

压缩阈值策略

扩展应用场景

财务数据备份

自媒体素材归档

总结

更多推荐文章

相关免费在线工具

Python 自动备份脚本：智能增量、多线程加速与压缩优化

文件自动备份脚本：智能增量与多线程加速

背景与需求

核心代码功能展示

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

命令行参数解析

执行流程

关键技术点

命令行参数设计

多线程同步

压缩阈值策略

扩展应用场景

财务数据备份

自媒体素材归档

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具