Python 核心语法:Pandas 读写 CSV 与 TSV 文件
一、pandas 文件读取
Pandas 是一个强大的分析结构化数据的工具集,其基础是 Numpy。它广泛用于数据挖掘和数据分析,同时也提供数据清洗功能。
环境准备
安装 Pandas 及相关依赖(如 pymysql, sqlalchemy)可使用 pip 或 conda。
pip install pandas pymysql sqlalchemy
1.1 pandas 操作 CSV
主要方法:read_csv, to_csv。
读取 CSV 文件
import pandas as pd
import os
os.chdir('./data')
data = pd.read_csv("LJhouse.csv", sep=',', usecols=['open', 'high', 'close'])
写入 CSV 文件
data[:10].to_csv("my_file1.csv", sep=',', index=False)
print('写入成功!')
读写 TSV 文件
TSV 文件以 Tab 键为分隔符。
# 写入 TSV
data[:5].to_csv("my_file2.tsv", sep='\t', index=True)
# 读取 TSV
df2 = pd.read_csv("my_file2.tsv", sep='\t', index_col=0)
1.2 Pandas 操作 MySQL
主要方法:read_sql, to_sql。
前期准备
需安装 pymysql 和 sqlalchemy。
连接数据库并写入数据
from sqlalchemy import create_engine
pandas pd
engine = create_engine()
data.to_sql(, con=engine, if_exists=, index=)


