Python 常用库清单
Python 的生态一直是它最省心的地方。很多场景里,语言本身只是入口,真正决定工作效率的,是你手里有没有合适的库。下面这份清单按常见领域整理了一遍,重点放在'常用'而不是'全'。有些库今天已经不算新,但在具体项目里还是绕不开。
1. 数值计算
数值计算是数据分析、机器学习的底层活儿。先把这块打稳,后面很多东西才好接上。
NumPy
NumPy 负责多维数组和矩阵运算,核心对象是 ndarray。它几乎是 Python 数值计算的默认起点,很多库都建立在它上面。
典型用法:
import numpy as np
arr = np.array([1, 2, 3])
print(arr * 2) # 输出:[2 4 6]
SciPy
SciPy 是在 NumPy 之上再往前走一步,补上了大量科学计算常用能力,比如线性代数、常微分方程数值求解、信号处理、图像处理、稀疏矩阵等。真要做工程计算,很多时候都会碰到它。
Pandas
Pandas 是为数据分析场景准备的工具。它处理表格数据、时间序列很顺手,和 NumPy 配合起来基本覆盖了日常数据清洗和整理的大部分工作。
典型用法:
import pandas as pd
df = pd.DataFrame({'A': [1, 2], 'B': [3, 4]})
print(df.sum())
2. 数据可视化
图表不是装饰,很多时候是排查问题最快的办法。先看一眼分布,通常比盯着原始数据更有效。
Matplotlib
Matplotlib 是 Python 里最基础的绘图库,功能很全,也确实不算轻松上手。很多更高层的可视化库,最后还是会落到它这里。
典型用法:
import matplotlib.pyplot as plt
plt.plot([1, 2, 3], [4, 5, 6])
plt.show()
Seaborn
Seaborn 基于 Matplotlib,重点是默认样式更好看,写法也更短。做探索性分析时,它比直接手搓 Matplotlib 省事不少。
ggplot
ggplot 借用了 R 的 ggplot2 思路,强调图层组合。适合喜欢'先定义语法,再叠加元素'的那类画图方式。


