一、餐饮企业分析需求
(一)餐饮企业现状与需求
餐饮行业作为我国第三产业中的一个传统服务性行业,始终保持着旺盛的增长势头。与此同时,我国餐饮业发展的质量和内涵也发生了重大变化。根据国家统计局数据显示,餐饮行业餐费收入从 2006 到 2015 年都处于增长的趋势,但是同比增长率却有很大的波动。
某餐饮企业正面临着房租价格高、人工费用高、服务工作效率低等问题。企业经营最大的目的就是盈利,而餐饮企业盈利的核心是其菜品和客户,也就是其提供的产品和服务对象。如何在保证产品质量的同时提高企业利润,成为某餐饮企业急需解决的问题。
import pandas as pd
import matplotlib.pyplot as plt
# 读取餐饮企业销售数据
Meals_income = pd.read_csv('data/meals_income.csv')
二、数据准备与预处理
(一)统计每日用餐人数与销售额
首先需要对原始数据进行清洗,确保数据的准确性和完整性。统计每日用餐人数与销售额是基础工作。
# 查看数据基本信息
print(Meals_income.info())
print(Meals_income.describe())
# 处理缺失值
Meals_income.fillna(0, inplace=True)
(二)数据预处理
对数据进行标准化处理,去除异常值,为后续建模做准备。
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
data_scaled = scaler.fit_transform(Meals_income)
三、使用 K-means 算法进行客户价值分析
(一)构建 RFM 特征
RFM 模型是衡量客户价值和客户创利能力的重要工具和手段。R 代表 Recency(最近一次消费时间),F 代表 Frequency(消费频率),M 代表 Monetary(消费金额)。
# 假设 df_customer 为客户交易表
# 计算 R, F, M 指标
rfm_data = df_customer.groupby('customer_id').agg({
'date': 'max',
'order_id': 'count',
'amount': 'sum'
}).reset_index()
(二)构建 K-Means 模型
使用 K-means 算法对客户进行聚类,将客户分为不同价值的群体。
from sklearn.cluster KMeans
kmeans = KMeans(n_clusters=, random_state=)
clusters = kmeans.fit_predict(rfm_data[[, , ]])
rfm_data[] = clusters


