Python 数据可视化:Seaborn 库使用指南
简介
Seaborn 是基于 Matplotlib 的 Python 数据可视化库。它在 Matplotlib 的基础上进行了更高级的 API 封装,使得用户可以更加简便地创建具有吸引力的统计图表。Seaborn 高度兼容 NumPy 和 Pandas 数据结构,并支持 SciPy 与 Statsmodels 等统计模式,是数据分析中不可或缺的工具。
安装与环境配置
使用 pip 安装 Seaborn:
pip install seaborn
或者使用 conda:
conda install seaborn
在代码中导入必要的库并设置显示环境:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# 设置主题样式
sns.set_theme(style="whitegrid")
# 设置中文字体以防乱码
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
API 基本形式
Seaborn 的绘图函数主要针对 Pandas 的 DataFrame 或 NumPy 数组,常见调用形式如下:
sns.图名 (x='X 轴列名', y='Y 轴列名', data=df)sns.图名 (x='X 轴列名', y='Y 轴列名', hue='分组参数', data=df)sns.图名 (x=np.array, y=np.array)
常用图表绘制详解
1. 散点图 (Scatter Plot)
散点图用于表现两个变量之间的关系。每个点代表数据集中的一个观察值。使用 relplot() 生成。
# 示例:员工人均薪酬 vs 高管平均薪酬
g = sns.relplot(
x='员工人均薪酬',
y='高管平均薪酬',
hue='申万一级行业',
data=df,
kind='scatter'
)
参数说明:
x,y: 坐标轴数据列名。hue: 通过颜色区分不同类别(如行业)。data: 数据源 DataFrame。


