pandas 是 Python 中最受欢迎的数据处理和分析库之一,它提供了高效的数据结构(如 Series 和 DataFrame)和数据操作工具。本文将详细介绍 pandas 库的使用方法,包括数据导入与导出、数据查看和筛选、数据处理和分组操作等。通过代码示例和详细解释,帮助你全面了解和应用 pandas 库进行数据处理和分析。
一、安装和导入 pandas 库
在使用 pandas 之前,首先需要安装 pandas 库。可以使用 pip 命令进行安装:
pip install pandas
安装完成后,我们可以使用 import 语句导入 pandas 库,通常约定使用别名 pd:
import pandas as pd
通过导入 pandas 库,并使用约定的别名 pd,我们可以使用 pandas 库提供的丰富功能。
二、数据导入与导出
1. 导入数据
pandas 库提供了多种方法来导入数据,包括从 CSV 文件、Excel 文件、数据库等导入数据。
import pandas as pd
import sqlite3
# 从 CSV 文件导入数据
df_csv = pd.read_csv('data.csv')
# 从 Excel 文件导入数据
df_excel = pd.read_excel('data.xlsx')
# 从数据库导入数据
conn = sqlite3.connect('database.db')
query = 'SELECT * FROM table_name'
df_db = pd.read_sql(query, conn)
在上面的例子中,我们分别从 CSV 文件、Excel 文件和数据库中导入了数据。通过 pandas 提供的相应函数,我们可以方便地从不同数据源导入数据,并将其转换为 pandas 的数据结构。
2. 导出数据
pandas 库同样提供了多种方法来导出数据,将数据保存为 CSV 文件、Excel 文件等格式。
import pandas as pd
import sqlite3
# 将数据保存为 CSV 文件
df.to_csv('data.csv', index=False)
# 将数据保存为 Excel 文件
df.to_excel('data.xlsx', index=False)
# 将数据保存到数据库
conn = sqlite3.connect('database.db')
df.to_sql('table_name', conn, if_exists='replace', index=False)
在上面的例子中,我们分别将数据保存为 CSV 文件、Excel 文件和数据库。通过 pandas 提供的相应函数,我们可以方便地将数据导出到不同的目标。


