导入模块
import pandas as pd
from pyecharts.charts import Bar, Map, Scatter, Pie
from pyecharts import options as opts
import warnings
warnings.filterwarnings('ignore')
这里引入 Pandas 处理数据,Pyecharts 负责绘图。关闭警告信息能让输出更清爽。
数据处理
读取 Excel 文件后,先检查数据结构。
df1 = pd.read_excel('./共享单车数据.xlsx')
df1.info()
原始数据中的时间是字符串格式,直接相减会报错。需要转换为 datetime 对象再计算差值,并提取秒数作为骑行时长。
df1['骑行时长 (s)'] = (df1['结束时间'] - df1['起始时间']).dt.total_seconds()
为了便于统计,我们将时长和里程分段。比如将时长分为 5 分钟一个区间,里程按公里划分。
lables = [f'{i}-{i+5}分钟' for i in range(0, 60, 5)] + ['60 分钟以上']
df1['骑行时长区间'] = pd.cut(df1['骑行时长 (s)'], bins=[i for i in range(0, 3601, 300)] + [10000], labels=lables)
distance_transfer = df1['骑行里程 (m)'].map(lambda x: x / 1000)
df1['骑行里程区间'] = pd.cut(distance_transfer, bins=[0, 1, , , , , ], labels=[, , , , , ])


