Python 家庭用电数据分析与 Prophet 时间序列预测

家庭用电数据包含全球有功功率、电压等多维度指标。通过数据清洗与特征分析，构建 Prophet 时间序列模型，实现对未来半年用电趋势的精准预测。该方法具备处理缺失值与季节性强效的优势，适用于能源消耗场景。

www发布于 2026/3/24更新于 2026/7/1936 浏览

数据集概览

我们使用的数据来自 Kaggle 上的 Household Electricity Consumption 数据集，包含一个家庭在 2007 年 1 月至 6 月间的详细用电记录。数据量约为 24 万条，涵盖了全球有功功率、无功功率、电压、电流强度以及分项计量（厨房、洗衣房、热水器/空调）等信息。

列名	说明
Date	日期
Time	时间
Global_active_power	总有功功率（千瓦）
Global_reactive_power	总无功功率（千瓦）
Voltage	电压（伏特）
Global_intensity	平均电流强度（安培）
Submetering1	厨房有功功率
Submetering2	洗衣房有功功率
Submetering3	热水器和空调有功功率

数据清洗与探索性分析

拿到数据后，第一步是加载并检查基本结构。这里直接读取 CSV 文件，注意处理缺失值和格式转换。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

data_path = "./household_power_consumption.csv"
df = pd.read_csv(data_path, index_col=0)
df.head()

![数据头部预览]

为了后续分析方便，我们可以将数值列统一转换为浮点数。原始数据中部分字段可能包含 ? 或其他非数字字符，需要预处理。

from tqdm.auto import tqdm

# 将 'Date' 列转换为日期时间格式
df['Date'] = pd.to_datetime(df['Date'])

# 定义需要转换为数字的列
num_cols = ['Global_active_power', 'Global_reactive_power', 'Voltage', 
            'Global_intensity', 'Submetering1', 'Submetering2', 'Submetering3']

# 定义转换函数，遇到无法转换的值返回 0
def safe_float():
    :
         (s)
    :
         


 col  num_cols:
    df[col] = df[col].apply(safe_float)

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

df.dtypes

import seaborn as sns
sns.heatmap(df.drop(['Date', 'Time'], axis=1).corr(), annot=True)

from prophet import Prophet

def prophet_forecaster(data, x, y, period=180):
    # 准备数据框，Prophet 要求列名为 'ds' 和 'y'
    new_df = pd.DataFrame(columns=['ds', 'y'])
    new_df['ds'] = data[x]
    new_df['y'] = data[y]
    
    # 初始化并训练模型
    model = Prophet()
    model.fit(new_df)
    
    # 生成未来日期
    future_dates = model.make_future_dataframe(periods=period)
    forecast = model.predict(future_dates)
    
    # 绘图
    fig = model.plot(forecast)
    plt.title(f"Forecasting on the next {period} days for {y}")
    plt.show()
    return forecast

# 示例：对有功功率进行预测
prophet_forecaster(df, x='Date', y='Global_active_power', period=180)

Python 家庭用电数据分析与 Prophet 时间序列预测

数据集概览

数据清洗与探索性分析

更多推荐文章

相关免费在线工具

Prophet 模型预测

为什么选择 Prophet？

更多推荐文章

相关免费在线工具

Python 家庭用电数据分析与 Prophet 时间序列预测

数据集概览

数据清洗与探索性分析

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

Prophet 模型预测

为什么选择 Prophet？

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具