跳到主要内容
极客日志极客日志
首页博客AI提示词GitHub精选代理工具
搜索
|注册
博客列表
PythonAI算法

家庭用电数据分析与 Prophet 预测

家庭用电数据分析基于 240000-household-electricity-consumption-records 数据集,涵盖 2007 年 1 月至 6 月的有功功率、无功功率、电压及分项计量数据。通过 Pandas 进行数据清洗与探索性分析,包括缺失值处理、类型转换及相关性热力图绘制。利用 Facebook Prophet 库构建时间序列预测模型,针对有功功率、无功功率、电压和电流强度进行未来 180 天预测。Prophet 模型具备自动趋势探测、季节性拟合及节假日效应处理能力,对缺失值和异常值具有鲁棒性,适合强季节效应的时间序列场景。

王初壹发布于 2026/3/15更新于 2026/4/252 浏览
家庭用电数据分析与 Prophet 预测

数据集来源:Household Electricity Consumption | Kaggle

数据集简介

240000-household-electricity-consumption-records 数据集包含了一个家庭 6 个月的用电数据,收集于 2007 年 1 月至 2007 年 6 月。这些数据包括全球有功功率、全球无功功率、电压、全球强度、分项计量 1(厨房)、分项计量 2(洗衣房)和分项计量 3(电热水器和空调)等信息。该数据集共有 260,640 个测量值。

列名说明
Date日期
Time时间
Globalactivepower该家庭所消耗的总有功功率(千瓦)
Globalreactivepower该家庭消耗的总无功功率(千瓦)
Voltage向家庭输送电力的电压(伏特)
Global_intensity输送到家庭的平均电流强度(安培)
Submetering1厨房消耗的有功功率(千瓦)
Submetering2洗衣房所消耗的有功功率(千瓦)
Submetering3电热水器和空调所消耗的有功功率(千瓦)

探索性分析

导入数据集并读取头部

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

data_path = "./household_power_consumption.csv"
df = pd.read_csv(data_path, index_col='index')
df.head()

文章配图

面向特定客户时可将列名替换为中文

# 将列名替换为中文
# df.rename(columns={
#     'Date': '日期',
#     'Time': '时间',
#     'Global_active_power': '有功功率',
#     'Global_reactive_power': '无功功率',
#     'Voltage': '电压',
#     'Global_intensity': '电流',
#     'Sub_metering_1': '厨房的有功功率',
#     'Sub_metering_2': '洗衣房的有功功率',
#     'Sub_metering_3': '电热水器和空调的有功功率',
# }, inplace=True)
# # 再次预览前 5 行数据
# df.head()

对 DataFrame 中的数值列进行统计

df.describe()

文章配图

查看 DataFrame 中各列的数据类型

df.dtypes

文章配图

转换数据格式

from tqdm.auto import tqdm
from ipywidgets import HBox, FloatProgress, HTML

# 将'Date'列转换为日期时间格式
df['Date'] = pd.DatetimeIndex(df['Date'])

# 定义需要转换为数字的列
make_em_num = ['Global_active_power', 'Global_reactive_power', 'Voltage', 'Global_intensity', 'Sub_metering_1', 'Sub_metering_2', 'Sub_metering_3']

# 定义一个函数,将字符串转换为浮点数,如果转换失败则返回 0
def floating(string):
    try:
        return float(string)
    except:
        return float(0)

# 遍历需要转换为数字的列
for column in tqdm(make_em_num):
    # 将列中的每个元素应用 floating 函数,转换为浮点数
    df[column] = df[column].apply(lambda item: floating(item))

# 创建一个水平布局,包含一个浮点进度条和一个 HTML 元素
HBox(children=(FloatProgress(value=0.0, max=7.0), HTML(value='')))

查看转换效果,转换后的数据类型

df.dtypes

文章配图

查看转换效果,转换后的数据头部

df.head()

文章配图

绘制相关系数热力图。使用 Seaborn 库中的 heatmap 函数来绘制一个热力图,展示数据框 df 中各列之间的相关性

  • df.drop 表示删除名为 index、Date 和 Time 的列。axis=1 表示按列删除。
  • annot=True,使得热力图上显示相关系数的具体数值。
import seaborn as sns
sns.heatmap(df.drop(['Date','Time'], axis=1).corr(), annot=True)

文章配图

Prophet 预测

https://github.com/facebook/prophet

Prophet 是一种基于可加性模型预测时间序列数据的程序,其中非线性趋势可以按年度、每周和每日的季节性,以及假日效应进行拟合。它最适合于具有强烈季节效应的时间序列和有几个季节的历史数据。Prophet 对于缺失的数据和趋势的变化是稳健的,并且通常能够很好地处理异常值。

获取 DataFrame 的形状

from prophet import Prophet
df.shape

文章配图

通过 Prophet 对有功功率和电压进行预测

# 从数据框中随机抽取 10000 行
df = df.sample(n=10000)

# 定义一个函数,用于使用 Prophet 模型进行预测
def prophet_forecaster(data, x, y, period=100):
    # 创建一个新的数据框,包含日期和目标变量
    new_df = pd.DataFrame(columns=['ds', 'y'])
    new_df['ds'] = data[x]
    new_df['y'] = data[y]
    
    # 创建一个 Prophet 模型
    model = Prophet()
    
    # 使用新的数据框进行模型训练
    model.fit(new_df)
    
    # 创建未来日期的数据框
    future_dates = model.make_future_dataframe(periods=period)
    
    # 使用模型进行预测
    forecast = model.predict(future_dates)
    
    # 绘制预测结果
    model.plot(forecast)
    
    # 设置图表标题
    plt.title(f"Forecasting on the next {period} days for {y}")

# 使用 Prophet 模型对 Global_active_power 进行预测
prophet_forecaster(df, x='Date', y='Global_active_power', period=180)

# 使用 Prophet 模型对 Global_reactive_power 进行预测
prophet_forecaster(df, x='Date', y='Global_reactive_power', period=180)

# 使用 Prophet 模型对 Voltage 进行预测
prophet_forecaster(df, x='Date', y='Voltage', period=180)

# 使用 Prophet 模型对 Global_intensity 进行预测
prophet_forecaster(df, x='Date', y='Global_intensity', period=180)

未来半年有功功率预测结果:

文章配图

未来半年无功功率预测结果

文章配图

未来半年电压预测结果:

文章配图

未来半年电流预测结果

文章配图

Prophet 模型

  • g(t) 表示趋势函数,能够拟合非周期性变化;
  • s(s) 表示周期性变化,例如每周,每年,每季节等;
  • h(t) 表示假期变化,节假日通常为一天或多天;
  • ϵt 为噪声项,表示随机无法预测的波动,通常假设ϵt 是高斯的。

Prophet 理念

  • 趋势中有两个增长函数,分别是分段线性函数(linear)和非线性逻辑回归函数(logistic)。通过从数据中选择变化点,Prophet 自动探测趋势变化;
  • 使用傅里叶级数建模每年的季节分量;
  • 使用虚变量代表过去,将来的相同节假日,属于节假日就为 1,不属于就是 0;
  • 用户提供的重要节假日列表
  • Modeling:建立时间序列模型。分析师根据预测问题的背景选择一个合适的模型。
  • Forecast Evaluation:模型评估。根据模型对历史数据进行仿真,在模型的参数不确定的情况下,我们可以进行多种尝试,并根据对应的仿真效果评估哪种模型更适合。
  • Surface Problems:呈现问题。如果尝试了多种参数后,模型的整体表现依然不理想,这个时候可以将误差较大的潜在原因呈现给分析师。
  • Visually Inspect Forecasts:以可视化的方式反馈整个预测结果。当问题反馈给分析师后,分析师考虑是否进一步调整和构建模型。

Prophet 优点

  • 准确,快速,高效率地拟合,可以针对所需关键数据进行交互式探索
  • 集成全自动流程,无需人工操作就能对混乱的数据做出合理的预测
  • 可调整的预测,预测模型的参数非常容易解释,可用业务知识改进或调整预测
  • 对缺失值和变化剧烈的时间序列和离散值有很好的鲁棒性,不需要填补缺失值;

目录

  1. 数据集简介
  2. 探索性分析
  3. 将列名替换为中文
  4. df.rename(columns={
  5. 'Date': '日期',
  6. 'Time': '时间',
  7. 'Globalactivepower': '有功功率',
  8. 'Globalreactivepower': '无功功率',
  9. 'Voltage': '电压',
  10. 'Global_intensity': '电流',
  11. 'Submetering1': '厨房的有功功率',
  12. 'Submetering2': '洗衣房的有功功率',
  13. 'Submetering3': '电热水器和空调的有功功率',
  14. }, inplace=True)
  15. # 再次预览前 5 行数据
  16. df.head()
  17. 将'Date'列转换为日期时间格式
  18. 定义需要转换为数字的列
  19. 定义一个函数,将字符串转换为浮点数,如果转换失败则返回 0
  20. 遍历需要转换为数字的列
  21. 创建一个水平布局,包含一个浮点进度条和一个 HTML 元素
  22. Prophet 预测
  23. 从数据框中随机抽取 10000 行
  24. 定义一个函数,用于使用 Prophet 模型进行预测
  25. 使用 Prophet 模型对 Globalactivepower 进行预测
  26. 使用 Prophet 模型对 Globalreactivepower 进行预测
  27. 使用 Prophet 模型对 Voltage 进行预测
  28. 使用 Prophet 模型对 Global_intensity 进行预测
  29. Prophet 模型
  30. Prophet 理念
  31. Prophet 优点
  • 💰 8折买阿里云服务器限时8折了解详情
  • 💰 8折买阿里云服务器限时8折购买
  • 🦞 5分钟部署阿里云小龙虾了解详情
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog

更多推荐文章

查看全部
  • Java 集成高德开放平台 POI 搜索 API 实战
  • Python 数据分析实战:从数据生成到统计输出详解
  • 大模型训练原理深度解析:以 GPT-1 为例
  • C++ 实现 Wishart 分布样本矩阵生成
  • AIGC 实战测评:通义万相 2.1 图生视频部署指南
  • Robot Lab 基于 Isaac Lab 的机器人强化学习实战指南
  • 毕业论文智能写作工具功能与使用流程解析
  • C++ 一级 GESP 知识点详细指南
  • 金仓 SQL 防火墙:构建数据库主动防御体系的实践
  • 双向最大匹配算法在古诗词与现代文分词中的应用效果
  • LeetCode 顺序表练习:移除元素、删除重复项与合并有序数组
  • 基于 CanMV-K230 的激光追踪机器人开发实战
  • 高斯过程(GP)算法原理与实战应用详解
  • 基于 KerasCV 的 Stable Diffusion 高性能文生图实现
  • 论文精读:利用人类反馈强化学习对齐语言模型
  • Windows 下手动安装 JDK 21 并配置环境变量
  • FPGA Vivado 下载及烧录流程详解
  • OpenClaw 开源个人 AI 智能助理部署教程
  • 大模型分布式训练与高效调参技术实战
  • Llama-Factory 微调 Qwen2.5-VL:数据集制作与部署流程

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online