Python 容器性能优化：列表、集合与字典的高效用法 | 极客日志

Python算法

Python 容器性能优化：列表、集合与字典的高效用法

详细分析了 Python 常用容器的性能差异与优化方案。内容涵盖列表插入操作的时间复杂度对比，推荐使用 deque 解决头部插入性能问题；集合查找相比列表遍历的效率优势及哈希原理；字典合并的多种写法及版本兼容性；有序去重的实现方式。此外，补充了 Counter 和 defaultdict 的高级用法，以及元组、生成器等内存优化技巧。通过理论分析与代码实测，帮助开发者建立正确的数据结构选型意识，写出高效简洁的 Python 代码。

佛系玩家发布于 2025/2/6更新于 2026/7/2135 浏览

Python 容器性能优化指南

前言

在 Python 开发中，合理选择数据结构对程序性能至关重要。不同的容器类型（Container）在内存占用、访问速度和操作复杂度上存在显著差异。本文深入探讨列表（List）、集合（Set）、字典（Dict）及 collections 模块中的常用容器，通过实际测试对比不同操作的时间复杂度，帮助开发者编写更简洁高效的代码。

理解底层实现机制是优化的前提。例如，列表基于动态数组，而集合基于哈希表。掌握这些特性，能避免常见的性能陷阱。

列表性能陷阱

插入操作的差异

列表中插入数据通常使用 append() 方法在尾部追加，或使用 insert() 在任意位置插入。当数据量较大时，两者的性能差异显著。

def list_append():
    """不断往尾部追加"""
    l = []
    for i in range(5000):
        l.append(i)

def list_insert():
    """不断往头部插入"""
    l = []
    for i in range(5000):
        l.insert(0, i)

使用 timeit 模块进行测试：

import timeit

append_spent = timeit.timeit(list_append, number=1000)
print("list_append:", append_spent)

insert_spent = timeit.timeit(list_insert, number=1000)
print("list_insert", insert_spent)

测试结果通常显示 list_insert 比 list_append 耗时多出数十倍。这是因为列表底层是动态数组，在中间或头部插入元素时，后续所有元素都需要移动位置以腾出空间，平均时间复杂度为 $O(n)$。而在尾部插入，只有在数组扩容时才涉及复制，平均时间复杂度为 $O(1)$。

解决方案：使用 deque

对于需要频繁在两端进行插入或删除操作的场景（如队列、栈），建议使用 collections.deque。它基于双向链表实现，两端操作均为 $O(1)$，且支持线程安全。

from collections import deque

def deque_append():
    l = deque()
    for i  ():
        l.append(i)

 ():
    l = deque()
     i  ():
        l.appendleft(i)  

 timeit
append_spent = timeit.timeit(deque_append, number=)
insert_spent = timeit.timeit(deque_insert, number=)

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online

# 错误示例
for item in my_list:
    if condition(item):
        my_list.remove(item)  # 可能跳过元素

# 正确示例
my_list = [x for x in my_list if not condition(x)]

nums = list(range(1000000))
def is_in_list():
    return 1000000 in nums

nums_set = set(nums)
def is_in_set():
    return 1000000 in nums_set

d1 = {"name": "honey"}
d2 = {"age": 18}
# 浅拷贝合并，不修改 d1
result = {**d1, **d2}

result = d1 | d2

from collections import OrderedDict

nums = [10, 2, 3, 3, 51, 5, 10, 7, 8, 5]
# 利用键的唯一性去重，同时保持顺序
unique_nums = list(OrderedDict.fromkeys(nums).keys())
# 或者直接使用 dict.fromkeys (Python 3.7+)
unique_nums_v2 = list(dict.fromkeys(nums))

from collections import Counter

text = "hello world"
counts = Counter(text)
print(counts.most_common(3))  # 获取出现频率最高的 3 个字符
print(counts['l'])            # 直接访问计数

from collections import defaultdict

dd = defaultdict(int)
dd['a'] += 1  # 自动初始化为 0 再加 1

# 分组示例
data = [('A', 1), ('B', 2), ('A', 3)]
groups = defaultdict(list)
for key, value in data:
    groups[key].append(value)

Python 容器性能优化：列表、集合与字典的高效用法

Python 容器性能优化指南

前言

列表性能陷阱

插入操作的差异

解决方案：使用 deque

更多推荐文章

相关免费在线工具

遍历修改陷阱

成员判断性能优化

字典合并策略

有序去重

进阶：Counter 与 defaultdict

Counter 统计频率

defaultdict 处理缺失键

内存与性能最佳实践

总结

更多推荐文章

相关免费在线工具

Python 容器性能优化：列表、集合与字典的高效用法

Python 容器性能优化指南

前言

列表性能陷阱

插入操作的差异

解决方案：使用 deque

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

遍历修改陷阱

成员判断性能优化

字典合并策略

有序去重

进阶：Counter 与 defaultdict

Counter 统计频率

defaultdict 处理缺失键

内存与性能最佳实践

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具