基于 Pandas 与 Pyecharts 的全国星巴克门店数据可视化分析
本期利用 Python 对全国星巴克门店数据进行分析,主要关注各省份、各城市的门店数量分布及营业时间情况。
涉及的核心库:
- Pandas:数据处理与分析
- Pyecharts:交互式数据可视化
1. 导入模块
首先引入必要的库并忽略警告信息,保持环境整洁。
import pandas as pd
from pyecharts.charts import Line, Bar, Pie, Map, Geo
from pyecharts import options as opts
import warnings
warnings.filterwarnings('ignore')
2. Pandas 数据处理
2.1 读取数据
使用 read_excel 加载本地 Excel 文件中的门店数据。
df = pd.read_excel("./星巴克门店.xlsx")
查看数据基本信息,确认字段类型及缺失值情况。
df.info()
2.2 计算营业时长
原始数据包含开始和停止营业时间,需转换为时间对象后计算差值。注意处理跨天或负值情况(如凌晨结束的情况)。
df['开始营业时间_1'] = pd.to_datetime(df['开始营业时间'])
df['停止营业时间_1'] = pd.to_datetime(df['停止营业时间'])
df['营业时长'] = df['停止营业时间_1'] - df['开始营业时间_1']
df['营业时长'] = pd.to_timedelta(df['营业时长'])
df['营业时长'] = df['营业时长'].dt.total_seconds() / 3600
# 处理可能出现的负数时长(跨天情况)
df['营业时长'] = df['营业时长'].apply(lambda x: x if x > 0 else x + 24)


