商品销售数据分析(python)

商品销售数据分析(python)

一.引言

本文通过利用Python(主要利用pandas库)对商品销售明细表进行数据分析,并进行数据从表格到图表的可视化操作,意在展现python工具在商业领域进行数据分析的便捷性与灵活性。

二.正文

1.数据来源

本文数据源自FineBi官方网站提供的销售明细表压缩包,解压后导入工作文件夹

2.1.数据预处理

拿到数据后先进行数据清理,由于IDE里无法打开格式为xlsx的文件,我们可以先在excel里面打开,观察后续数据清理是否能对的上。

在这里插入图片描述


经过查看,这是一个(40514,12)的数据集,即40514行,12列
接下来我们写一个简单的python脚本进行数据清理:
read.py

import pandas as pd

df=pd.read_excel(‘销售明细表.xlsx’)

print(df.info())
print(‘\n’)
errorcb=df[df.loc[:,‘成本额’]<0]
errorsl=df[df.loc[:,‘销售额’]<0]
errorxse=df[df.loc[:,‘销售额’]<0]
print(f’成本额异常值有{errorcb.shape[0]}条,分别在第{errorcb.index.tolist()}行’)
print(f’销售额异常值有{errorsl.shape[0]}条,分别在第{errorsl.index.tolist()}行’)
print(f’销售成本异常值有{errorxse.shape[0]}条,分别在第{errorxse.index.tolist()}行’)

打印info函数会展现出数据集的行列数,列名,数据类型以及空值情况等基本信息,另外由于数据集里有成本,销售额和数量这些数据,我们查看一下是否有异常值,即小于0的数。

在这里插入图片描述


一切正常,可以进行下一步操作了。我们发现在数据集中只有销售额和成本额,但没有毛利额,可以进行增加毛利额列。
这个数据集只有四万多行,正常情况直接用excel进行公式计算就可以了,但是在这里我们选择用python实现。

毛利额计算.py

import pandas as pd
df=pd.read_excel(‘销售明细表.xlsx’)
df.loc[:,‘毛利额’]=0
df.loc[:,‘毛利额’]=df.loc[:,‘销售额’]-df.loc[:,‘成本额’]
df.to_excel(‘销售明细表2.xlsx’, index=False)

在这里插入图片描述


可以看到已经添加了毛利额这个字段,接下来正式开始分析。

2.2.数据分析

2.2.1.热销商品分析

由于这是一个商品销售明细表,我们先对商品的销售情况进行分析。
商品销售情况.py

import pandas as pd
df=pd.read_excel(‘销售明细表2.xlsx’)
print(f’各类商品销售情况如下:\n{df.loc[:,‘商品类别’].value_counts()}')

这里的value_counts函数会自动对选中列进行分组并查询数量

在这里插入图片描述


可以看到日用品远高于其他种类的商品,但日用品里又分为多种细分种类,我们继续查询。

print(f’日用品里不同商品的销售情况如下:\n{df[df.loc[:,‘商品类别’]==‘日用品’].loc[:,‘商品名称’].value_counts()}')

在这里插入图片描述


可以看到微爽日用占了一半以上的订单量,因此可以将资源倾斜于此产品或同种产品。

我们也可以导入matplotlib库生成图表

商品销售情况可视化.py
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

plt.rcParams[‘font.sans-serif’] = [‘SimHei’] # 指定默认字体为黑体
plt.rcParams[‘axes.unicode_minus’] = False # 解决负号显示问题
df=pd.read_excel(‘销售明细表2.xlsx’)
#商品类别和日用品中商品名称的销售情况可视化
plt.figure(figsize=(10,6))
plt.subplot(1,2,1)
df.loc[:,‘商品类别’].value_counts().plot(kind=‘bar’,title=‘商品类别销售情况’)
plt.subplot(1,2,2)
df[df.loc[:,‘商品类别’]==‘日用品’].loc[:,‘商品名称’].value_counts().plot(kind=‘bar’,title=‘日用品商品名称销售情况’)
plt.tight_layout()
plt.show()

在这里插入图片描述


用图表的形式就可以直观感受出差距。

2.2.2.热门商品热销地区

了解了热门商品之后,我们还可以对其进行销售地区的分析,以便进行进货发货的规划。

print(f’微爽日用245mm的销售地区情况如下:\n{df[df.loc[:,‘商品名称’]==‘微爽日用245mm’].loc[:,‘省份’].value_counts()}')

在这里插入图片描述


可以看到不同省份差异极大,而且主要与经度有关,东部地区明显销售量大于西部,初步考虑是经济和气候因素影响,若需要进行深度研究需要借助更多工具以及更多数据支撑,这里暂时不进行深究。

2.2.3.各月毛利额分析

接下来对毛利额进行分析。
import pandas as pd
df=pd.read_excel(‘销售明细表2.xlsx’)
df[‘日期(年月日)’] = pd.to_datetime(df[‘日期(年月日)’])
df.loc[:,‘月份’]=df.loc[:,‘日期(年月日)’].dt.month
monthly_profit = df.groupby(‘月份’)[“毛利额”].sum().sort_index()
print(f’各月毛利额如下:\n{monthly_profit}‘)
monthly_growth = (monthly_profit - monthly_profit.shift(1)) / monthly_profit.shift(1) * 100
print(f’\n各月环比增长率如下:\n{monthly_growth}')

在这里插入图片描述


结果发现从七月份开始下滑,八月份对比七月份严重下滑。

写一个脚本查看每个月不同商品的毛利额:
import pandas as pd
df=pd.read_excel(‘销售明细表2.xlsx’)
df[‘日期(年月日)’] = pd.to_datetime(df[‘日期(年月日)’])
df.loc[:,‘月份’]=df.loc[:,‘日期(年月日)’].dt.month
result=df.groupby([‘月份’,‘商品类别’])[‘毛利额’].sum().unstack()
print(f’各月各类商品毛利额如下:\n{result}')

在这里插入图片描述


可以发现7到8月份下跌严重主要是因为零食这一类造成的,可以深入调查一下零食的售卖情况。

Read more

【AI大模型】DeepSeek + 通义万相高效制作AI视频实战详解

【AI大模型】DeepSeek + 通义万相高效制作AI视频实战详解

目录 一、前言 二、AI视频概述 2.1 什么是AI视频 2.2 AI视频核心特点 2.3 AI视频应用场景 三、通义万相介绍 3.1 通义万相概述 3.1.1 什么是通义万相 3.2 通义万相核心特点 3.3 通义万相技术特点 3.4 通义万相应用场景 四、DeepSeek + 通义万相制作AI视频流程 4.1 DeepSeek + 通义万相制作视频优势 4.1.1 DeepSeek 优势 4.1.2 通义万相视频生成优势 4.2

By Ne0inhk
【DeepSeek微调实践】DeepSeek-R1大模型基于MS-Swift框架部署/推理/微调实践大全

【DeepSeek微调实践】DeepSeek-R1大模型基于MS-Swift框架部署/推理/微调实践大全

系列篇章💥 No.文章01【DeepSeek应用实践】DeepSeek接入Word、WPS方法详解:无需代码,轻松实现智能办公助手功能02【DeepSeek应用实践】通义灵码 + DeepSeek:AI 编程助手的实战指南03【DeepSeek应用实践】Cline集成DeepSeek:开源AI编程助手,终端与Web开发的超强助力04【DeepSeek开发入门】DeepSeek API 开发初体验05【DeepSeek开发入门】DeepSeek API高级开发指南(推理与多轮对话机器人实践)06【DeepSeek开发入门】Function Calling 函数功能应用实战指南07【DeepSeek部署实战】DeepSeek-R1-Distill-Qwen-7B:本地部署与API服务快速上手08【DeepSeek部署实战】DeepSeek-R1-Distill-Qwen-7B:Web聊天机器人部署指南09【DeepSeek部署实战】DeepSeek-R1-Distill-Qwen-7B:基于vLLM 搭建高性能推理服务器10【DeepSeek部署实战】基于Ollama快速部署Dee

By Ne0inhk

DeepSeek各版本说明与优缺点分析_deepseek各版本区别

DeepSeek各版本说明与优缺点分析 DeepSeek是最近人工智能领域备受瞩目的一个语言模型系列,其在不同版本的发布过程中,逐步加强了对多种任务的处理能力。本文将详细介绍DeepSeek的各版本,从版本的发布时间、特点、优势以及不足之处,为广大AI技术爱好者和开发者提供一份参考指南。 1. DeepSeek-V1:起步与编码强劲 DeepSeek-V1是DeepSeek的起步版本,这里不过多赘述,主要分析它的优缺点。 发布时间: 2024年1月 特点: DeepSeek-V1是DeepSeek系列的首个版本,预训练于2TB的标记数据,主打自然语言处理和编码任务。它支持多种编程语言,具有强大的编码能力,适合程序开发人员和技术研究人员使用。 优势: * 强大编码能力:支持多种编程语言,能够理解和生成代码,适合开发者进行自动化代码生成与调试。 * 高上下文窗口:支持高达128K标记的上下文窗口,能够处理较为复杂的文本理解和生成任务。 缺点: * 多模态能力有限:该版本主要集中在文本处理上,缺少对图像、语音等多模态任务的支持。 * 推理能力较弱:尽管在自然语言

By Ne0inhk

用DeepSeek和Cursor从零打造智能代码审查工具:我的AI编程实践

💂 个人网站:【 摸鱼游戏】【神级代码资源网站】【星海网址导航】摸鱼、技术交流群👉 点此查看详情 引言:AI编程革命下的机遇与挑战 GitHub统计显示,使用AI编程工具的开发者平均效率提升55%,但仅有23%的开发者能充分发挥这些工具的潜力。作为一名全栈工程师,我曾对AI编程持怀疑态度,直到一次紧急项目让我彻底改变了看法。客户要求在72小时内交付一个能自动检测代码漏洞、优化性能的智能审查系统,传统开发方式根本不可能完成。正是这次挑战,让我探索出DeepSeek和Cursor这对"黄金组合"的惊人潜力。 一、工具选型:深入比较主流AI编程工具 1.1 为什么最终选择DeepSeek+Cursor? 经过两周的对比测试,我们发现不同工具在代码审查场景的表现差异显著: 工具代码理解深度响应速度定制灵活性多语言支持GitHub Copilot★★★☆★★★★★★☆★★★★Amazon CodeWhisperer★★☆★★★☆★★★★★★☆DeepSeek★★★★☆★★★★★★★☆★★★★☆Cursor★★★☆★★★★☆★★★★★★★★ 关键发现: * Dee

By Ne0inhk