Python 数据分析领域,Pandas 是绕不开的核心工具。掌握其基础操作,能极大提升数据处理效率。本文将结合实际案例,梳理从数据创建、探索到清洗分析的常用技巧。
首先,导入必要的库:
import pandas as pd
import numpy as np
一、创建 DataFrame 数据
1. 通过字典构建
利用 Python 字典可以直接初始化 DataFrame,适合小规模数据测试:
df = pd.DataFrame({
"name": ["小明", "小红", "小孙", "王小", "关宇", "刘蓓", "张菲"],
"age": [20, 18, 27, 20, 28, 18, 25],
"sex": ["男", "女", "男", "男", "男", "女", "女"],
"score": [669, 570, 642, 590, 601, 619, 701],
"address": ["北京", "深圳", "广州", "武汉", "深圳", "广州", "长沙"]
})
print(df)
2. 读取本地文件
处理真实业务时,通常从 Excel 或 CSV 加载数据:
df = pd.read_excel()


