基于 Python 的商品销售数据分析与可视化实战 | 极客日志

Python算法

基于 Python 的商品销售数据分析与可视化实战

利用 Python pandas 库处理商品销售明细表，完成数据清洗、异常值检测及毛利额计算。通过 value_counts 统计热销商品类别及细分单品，结合 matplotlib 绘制柱状图可视化销售分布。进一步分析特定商品的销售地区差异，识别东西部市场特征。最后按月份聚合毛利额并计算环比增长率，定位利润下滑时段及品类，为业务决策提供数据支撑。

禅心发布于 2026/3/16更新于 2026/6/1316 浏览

一、引言

利用 Python 及 pandas 库对商品销售明细表进行分析，并实现从表格到图表的可视化，展示工具在商业分析中的便捷性与灵活性。

二、数据预处理

拿到数据后先进行基础清理。虽然 Excel 能直接打开 xlsx 文件，但为了后续自动化处理，我们直接在 Python 中加载数据集。

这是一个包含 40514 行、12 列的数据集。我们先查看基本信息，包括行列数、数据类型及空值情况：

import pandas as pd

df = pd.read_excel('销售明细表.xlsx')
print(df.info())

由于数据集中涉及成本、销售额和数量等数值字段，我们需要检查是否存在异常值（如小于 0 的情况）：

errorcb = df[df.loc[:, '成本额'] < 0]
errorsl = df[df.loc[:, '销售额'] < 0]
errorxse = df[df.loc[:, '销售成本'] < 0]

print(f'成本额异常值有{errorcb.shape[0]}条，分别在第{errorcb.index.tolist()}行')
print(f'销售额异常值有{errorsl.shape[0]}条，分别在第{errorsl.index.tolist()}行')
print(f'销售成本异常值有{errorxse.shape[0]}条，分别在第{errorxse.index.tolist()}行')

检查结果显示一切正常，可以进行下一步。注意到数据集中只有销售额和成本额，缺少毛利额，我们可以直接增加这一列：

df.loc[:, '毛利额'] = df.loc[:, '销售额'] - df.loc[:, '成本额']
df.to_excel('销售明细表_清洗后.xlsx', index=False)

添加完成后，即可正式开始分析。

三、数据分析

3.1 热销商品分析

首先对商品的销售情况进行宏观分析。利用 value_counts 函数可以快速统计各类商品的销量分布：

print(f'各类商品销售情况如下:\n{df.loc[:, "商品类别"].value_counts()}')

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online

print(f'日用品里不同商品的销售情况如下:\n{df[df.loc[:, "商品类别"] == "日用品"].loc[:, "商品名称"].value_counts()}')

import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif'] = ['SimHei']  # 指定默认字体为黑体
plt.rcParams['axes.unicode_minus'] = False    # 解决负号显示问题

df = pd.read_excel('销售明细表_清洗后.xlsx')
plt.figure(figsize=(10, 6))
plt.subplot(1, 2, 1)
df.loc[:, '商品类别'].value_counts().plot(kind='bar', title='商品类别销售情况')
plt.subplot(1, 2, 2)
df[df.loc[:, '商品类别'] == '日用品'].loc[:, '商品名称'].value_counts().plot(kind='bar', title='日用品商品名称销售情况')
plt.tight_layout()
plt.show()

print(f'微爽日用 245mm 的销售地区情况如下:\n{df[df.loc[:, "商品名称"] == "微爽日用 245mm"].loc[:, "省份"].value_counts()}')

df['日期 (年月日)'] = pd.to_datetime(df['日期 (年月日)'])
df.loc[:, '月份'] = df.loc[:, '日期 (年月日)'].dt.month
monthly_profit = df.groupby('月份')['毛利额'].sum().sort_index()

print(f'各月毛利额如下:\n{monthly_profit}')

# 计算环比增长率
monthly_growth = (monthly_profit - monthly_profit.shift(1)) / monthly_profit.shift(1) * 100
print(f'\n各月环比增长率如下:\n{monthly_growth}')

result = df.groupby(['月份', '商品类别'])['毛利额'].sum().unstack()
print(f'各月各类商品毛利额如下:\n{result}')

基于 Python 的商品销售数据分析与可视化实战

一、引言

二、数据预处理

三、数据分析

3.1 热销商品分析

更多推荐文章

相关免费在线工具

3.2 热门商品热销地区

3.3 各月毛利额分析

更多推荐文章

相关免费在线工具

基于 Python 的商品销售数据分析与可视化实战

一、引言

二、数据预处理

三、数据分析

3.1 热销商品分析

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3.2 热门商品热销地区

3.3 各月毛利额分析

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具