Python 并发编程实战：多线程、多进程与线程池 | 极客日志

PythonAI算法

Python 并发编程实战：多线程、多进程与线程池

Python 并发编程涵盖多线程与多进程，适用于不同任务类型。I/O 密集型适合线程，CPU 密集型适合进程。通过 threading 和 multiprocessing 模块可创建线程或进程，利用锁机制处理共享资源竞争。线程池与进程池（concurrent.futures）能简化资源管理。实战案例展示了如何使用线程池高效下载文件，以及使用进程池批量处理数据并统计信息。掌握同步互斥原理是避免死锁的关键。

asphyx_a发布于 2026/3/21更新于 2026/7/2132 浏览

Python 并发编程实战：多线程、多进程与线程池

并发编程示意图

在开发高性能应用时，如何充分利用系统资源是关键。Python 的并发编程主要涉及多线程和多进程两种模式，它们分别适用于不同的任务场景。本文将深入探讨这两种机制的核心用法，并通过实际案例展示如何高效构建并发程序。

并发编程概述

并发编程允许程序同时执行多个任务，从而提升整体效率。理解 CPU 密集型与 I/O 密集型任务是选择并发策略的基础。

CPU 密集型：如数学计算、数据处理。这类任务受限于 CPU 核心数，通常更适合多进程。
I/O 密集型：如文件读写、网络请求。这类任务大部分时间在等待，多线程能显著减少等待时间。

多线程编程

Python 的 threading 模块提供了创建和管理线程的能力。不过要注意，由于 GIL（全局解释器锁）的存在，多线程并不能真正并行执行 CPU 密集型任务，但在 I/O 操作上非常有效。

线程的创建与管理

创建一个线程很简单，只需继承 Thread 类或传入目标函数。下面是一个基础示例：

import threading
import time

def thread_function(name):
    print(f'线程 {name} 开始')
    time.sleep(2)
    print(f'线程 {name} 结束')

# 创建线程
thread1 = threading.Thread(target=thread_function, args=('Thread 1',))
thread2 = threading.Thread(target=thread_function, args=('Thread 2',))

# 启动线程
thread1.start()
thread2.start()

# 等待线程结束
thread1.join()
thread2.join()
print('所有线程结束')

线程同步与互斥

当多个线程访问共享资源时，必须使用锁来防止数据竞争。Lock 是最常用的同步原语。

import threading
import time

counter = 0
lock = threading.Lock()

def ():
     counter
    ()
    lock.acquire()
    :
        counter += 
        ()
    :
        lock.release()
    time.sleep()
    ()

threads = []
 i  ():
    thread = threading.Thread(target=thread_function, args=(,))
    threads.append(thread)
    thread.start()

 thread  threads:
    thread.join()
()

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

import concurrent.futures
import time

def thread_function(name):
    print(f'线程 {name} 开始')
    time.sleep(2)
    print(f'线程 {name} 结束')
    return name

with concurrent.futures.ThreadPoolExecutor(max_workers=3) as executor:
    future1 = executor.submit(thread_function, 'Thread 1')
    future2 = executor.submit(thread_function, 'Thread 2')
    future3 = executor.submit(thread_function, 'Thread 3')

    print(f'线程 {future1.result()} 完成')
    print(f'线程 {future2.result()} 完成')
    print(f'线程 {future3.result()} 完成')
    print('所有线程结束')

import multiprocessing
import time

def process_function(name):
    print(f'进程 {name} 开始')
    time.sleep(2)
    print(f'进程 {name} 结束')

process1 = multiprocessing.Process(target=process_function, args=('Process 1',))
process2 = multiprocessing.Process(target=process_function, args=('Process 2',))

process1.start()
process2.start()

process1.join()
process2.join()
print('所有进程结束')

import multiprocessing
import time

def process_function(conn):
    print(f'子进程发送数据')
    conn.send('Hello from child process')
    time.sleep(2)
    print(f'子进程结束')
    conn.close()

parent_conn, child_conn = multiprocessing.Pipe()
process = multiprocessing.Process(target=process_function, args=(child_conn,))
process.start()

print(f'父进程接收数据：{parent_conn.recv()}')
process.join()
print('所有进程结束')

import concurrent.futures
import time

def process_function(name):
    print(f'进程 {name} 开始')
    time.sleep(2)
    print(f'进程 {name} 结束')
    return name

with concurrent.futures.ProcessPoolExecutor(max_workers=3) as executor:
    future1 = executor.submit(process_function, 'Process 1')
    future2 = executor.submit(process_function, 'Process 2')
    future3 = executor.submit(process_function, 'Process 3')

    print(f'进程 {future1.result()} 完成')
    print(f'进程 {future2.result()} 完成')
    print(f'进程 {future3.result()} 完成')
    print('所有进程结束')

import threading
import time

items = []
condition = threading.Condition()

def producer():
    for i in range(5):
        with condition:
            items.append(i)
            print(f'生产者生产了 {i}')
            condition.notify()
        time.sleep(1)

def consumer():
    for i in range(5):
        with condition:
            while not items:
                condition.wait()
            item = items.pop(0)
            print(f'消费者消费了 {item}')
        time.sleep(1)

producer_thread = threading.Thread(target=producer)
consumer_thread = threading.Thread(target=consumer)

producer_thread.start()
consumer_thread.start()

producer_thread.join()
consumer_thread.join()
print('所有线程结束')

import requests
import concurrent.futures
import os

def download_file(url, save_path):
    try:
        response = requests.get(url, stream=True)
        response.raise_for_status()
        with open(save_path, 'wb') as file:
            for chunk in response.iter_content(chunk_size=8192):
                if chunk:
                    file.write(chunk)
        print(f'文件 {save_path} 下载成功')
        return save_path
    except Exception as e:
        print(f'文件 {save_path} 下载失败：{e}')
        return None

def download_files(urls, save_dir, max_workers=5):
    if not os.path.exists(save_dir):
        os.makedirs(save_dir)
    
    save_paths = [os.path.join(save_dir, os.path.basename(url)) for url in urls]
    
    with concurrent.futures.ThreadPoolExecutor(max_workers=max_workers) as executor:
        futures = [executor.submit(download_file, url, save_path) for url, save_path in zip(urls, save_paths)]
        
        for future in concurrent.futures.as_completed(futures):
            future.result()

if __name__ == '__main__':
    urls = [
        'https://www.example.com/page1.html',
        'https://www.example.com/page2.html',
        'https://www.example.com/page3.html',
        'https://www.example.com/page4.html',
        'https://www.example.com/page5.html'
    ]
    save_dir = 'downloads'
    download_files(urls, save_dir)

import pandas as pd
import concurrent.futures
import os

def process_file(file_path):
    try:
        df = pd.read_csv(file_path)
        stats = {
            '文件名': os.path.basename(file_path),
            '行数': df.shape[0],
            '列数': df.shape[1],
            '平均值': df.mean().to_dict(),
            '最大值': df.max().to_dict(),
            '最小值': df.min().to_dict()
        }
        print(f'文件 {os.path.basename(file_path)} 处理成功')
        return stats
    except Exception as e:
        print(f'文件 {os.path.basename(file_path)} 处理失败：{e}')
        return None

def process_files(file_paths, max_workers=5):
    results = []
    with concurrent.futures.ProcessPoolExecutor(max_workers=max_workers) as executor:
        futures = [executor.submit(process_file, file_path) for file_path in file_paths]
        for future in concurrent.futures.as_completed(futures):
            result = future.result()
            if result:
                results.append(result)
    return results

def save_results(results, save_path):
    df = pd.DataFrame(results)
    df.to_csv(save_path, index=False)
    print(f'处理结果已保存到 {save_path}')

if __name__ == '__main__':
    file_paths = ['data1.csv', 'data2.csv', 'data3.csv', 'data4.csv', 'data5.csv']
    save_path = 'results.csv'
    results = process_files(file_paths)
    save_results(results, save_path)

Python 并发编程实战：多线程、多进程与线程池

Python 并发编程实战：多线程、多进程与线程池

并发编程概述

多线程编程

线程的创建与管理

线程同步与互斥

更多推荐文章

相关免费在线工具

线程池管理

多进程编程

进程的创建与管理

进程通信

进程池

同步与互斥进阶

实战案例

并发下载文件

并发数据处理

更多推荐文章

相关免费在线工具

Python 并发编程实战：多线程、多进程与线程池

Python 并发编程实战：多线程、多进程与线程池

并发编程概述

多线程编程

线程的创建与管理

线程同步与互斥

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

线程池管理

多进程编程

进程的创建与管理

进程通信

进程池

同步与互斥进阶

实战案例

并发下载文件

并发数据处理

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具