【Python】家庭用电数据分析Prophet预测

【Python】家庭用电数据分析Prophet预测
数据集:Household Electricity Consumption | Kaggle

目录

数据集简介

探索性分析

Prophet预测

Prophet模型

Prophet理念

Prophet优点


数据集简介

240000-household-electricity-consumption-records数据集包含了一个家庭6个月的用电数据,收集于2007年1月至2007年6月。这些数据包括全球有功功率、全球无功功率、电压、全球强度、分项计量1(厨房)、分项计量2(洗衣房)和分项计量3(电热水器和空调)等信息。该数据集共有260,640个测量值。

列名说明
Date日期
Time时间
Globalactivepower该家庭所消耗的总有功功率(千瓦)
Globalreactivepower该家庭消耗的总无功功率(千瓦)
Voltage向家庭输送电力的电压(伏特)
Global_intensity输送到家庭的平均电流强度(安培)
Submetering1厨房消耗的有功功率(千瓦)
Submetering2洗衣房所消耗的有功功率(千瓦)
Submetering3电热水器和空调所消耗的有功功率(千瓦)

探索性分析

导入数据集并读取头部 

import numpy as np import pandas as pd import matplotlib.pyplot as plt data_path = "./household_power_consumption.csv" df = pd.read_csv(data_path,index_col='index') df.head()

面向特定客户时可将列名替换为中文

# # 将列名替换为中文 # df.rename(columns={ # 'Date': '日期', # 'Time': '时间', # 'Global_active_power': '有功功率', # 'Global_reactive_power': '无功功率', # 'Voltage': '电压', # 'Global_intensity': '电流', # 'Sub_metering_1': '厨房的有功功率', # 'Sub_metering_2': '洗衣房的有功功率', # 'Sub_metering_3': '电热水器和空调的有功功率', # },inplace=1) # # 再次预览前5行数据 # df.head() 

对DataFrame 中的数值列进行统计

df.describe()

 查看DataFrame中各列的数据类型

df.dtypes

转换数据格式

from tqdm.auto import tqdm from ipywidgets import HBox, FloatProgress, HTML # 将'Date'列转换为日期时间格式 df['Date']=pd.DatetimeIndex(df['Date']) # 定义需要转换为数字的列 make_em_num = ['Global_active_power', 'Global_reactive_power', 'Voltage', 'Global_intensity', 'Sub_metering_1', 'Sub_metering_2', 'Sub_metering_3'] # 定义一个函数,将字符串转换为浮点数,如果转换失败则返回0 def floating(string): try: return float(string) except: return float(0) # 遍历需要转换为数字的列 for column in tqdm(make_em_num): # 将列中的每个元素应用floating函数,转换为浮点数 df[column] = df[column].apply(lambda item: floating(item)) # 创建一个水平布局,包含一个浮点进度条和一个HTML元素 HBox(children=(FloatProgress(value=0.0, max=7.0), HTML(value='')))

 查看转换效果,转换后的数据类型

df.dtypes

 查看转换效果,转换后的数据头部

df.head()

绘制相关系数热力图。使用Seaborn库中的heatmap函数来绘制一个热力图,展示数据框df中各列之间的相关性

  • df.drop表示删除名为index、Date和Time的列。axis=1表示按列删除。
  • annot=True,使得热力图上显示相关系数的具体数值。
import seaborn as sns sns.heatmap(df.drop(['Date','Time'], axis=1).corr(), annot=True)

 

Prophet预测

https://github.com/facebook/prophet

Prophet是一种基于可加性模型预测时间序列数据的程序,其中非线性趋势可以按年度、每周和每日的季节性,以及假日效应进行拟合。它最适合于具有强烈季节效应的时间序列和有几个季节的历史数据。Prophet对于缺失的数据和趋势的变化是稳健的,并且通常能够很好地处理异常值。

获取DataFrame的形状 

from prophet import Prophet df.shape

通过 Prophet 对有功功率和电压进行预测

# 从数据框中随机抽取10000行 df=df.sample(n=10000) # 定义一个函数,用于使用Prophet模型进行预测 def prophet_forecaster(data, x, y, period=100): # 创建一个新的数据框,包含日期和目标变量 new_df = pd.DataFrame(columns=['ds', 'y']) new_df['ds']= data[x] new_df['y'] = data[y] # 创建一个Prophet模型 model = Prophet() # 使用新的数据框进行模型训练 model.fit(new_df) # 创建未来日期的数据框 future_dates = model.make_future_dataframe(periods=period) # 使用模型进行预测 forecast = model.predict(future_dates) # 绘制预测结果 model.plot(forecast) # 设置图表标题 plt.title(f"Forecasting on the next {period} days for {y}") # 使用Prophet模型对Global_active_power进行预测 prophet_forecaster(df, x='Date', y='Global_active_power', period=180) # 使用Prophet模型对Global_reactive_power进行预测 prophet_forecaster(df, x='Date', y='Global_reactive_power', period=180) # 使用Prophet模型对Voltage进行预测 prophet_forecaster(df, x='Date', y='Voltage', period=180) # 使用Prophet模型对Global_intensity进行预测 prophet_forecaster(df, x='Date', y='Global_intensity', period=180) 

未来半年有功功率预测结果:

未来半年无功功率预测结果 

未来半年电压预测结果:

未来半年电流预测结果

Prophet模型

  • g(t) 表示趋势函数,能够拟合非周期性变化;
  • s(s)表示周期性变化,例如每周,每年,每季节等;
  • h(t)表示假期变化,节假日通常为一天或多天;
  • ϵt为噪声项,表示随机无法预测的波动,通常假设ϵt是高斯的。

Prophet理念

  • 趋势中有两个增长函数,分别是分段线性函数(linear)和非线性逻辑回归函数(logistic)。通过从数据中选择变化点,Prophet自动探测趋势变化;
  • 使用傅里叶级数建模每年的季节分量;
  • 使用虚变量代表过去,将来的相同节假日,属于节假日就为1,不属于就是0;
  • 用户提供的重要节假日列表
  • Modeling:建立时间序列模型。分析师根据预测问题的背景选择一个合适的模型。
  • Forecast Evaluation:模型评估。根据模型对历史数据进行仿真,在模型的参数不确定的情况下,我们可以进行多种尝试,并根 据对应的仿真效果评估哪种模型更适合。
  • Surface Problems:呈现问题。如果尝试了多种参数后,模型的整体表现依然不理想,这个时候可以将误差较大的潜在原因呈现给分析师。
  • Visually Inspect Forecasts:以可视化的方式反馈整个预测结果。当问题反馈给分析师后,分析师考虑是否进一步调整和构建模型。

Prophet优点

  • 准确,快速,高效率地拟合,可以针对所需关键数据进行交互式探索
  • 集成全自动流程,无需人工操作就能对混乱的数据做出合理的预测
  • 可调整的预测,预测模型的参数非常容易解释,可用业务知识改进或调整预测
  • 对缺失值和变化剧烈的时间序列和离散值有很好的鲁棒性,不需要填补缺失值;

Read more

【算法】【优选算法】BFS 解决拓扑排序

【算法】【优选算法】BFS 解决拓扑排序

目录 * 一、拓扑排序 * 1.1 有向无环图(DAG图) * 1.2 AOV 网:顶点活动图 * 1.3 拓扑排序 * 1.4 实现拓扑排序 * 二、207. 课程表 * 三、210. 课程表 II * 四、LCR 114. ⽕星词典 一、拓扑排序 1.1 有向无环图(DAG图) 有向无环图:有向无环图:一个无回路的有向图,如果一个有向图无法从某个顶点出发经过若干条边回到该点,则这个图是一个有向无环图(DAG图)。 1.2 AOV 网:顶点活动图 在有向无环图的基础上,用顶点来表示一个活动,用边来表示活动执行的先后顺序。 1.

By Ne0inhk
【LeetCode经典题解】:二叉树转字符串递归解法的核心逻辑与代码解剖

【LeetCode经典题解】:二叉树转字符串递归解法的核心逻辑与代码解剖

🎁个人主页:User_芊芊君子 🎉欢迎大家点赞👍评论📝收藏⭐文章 🔍系列专栏:Java.数据结构 【前言】 在二叉树的算法问题中,将二叉树结构转化为特定格式的字符串是经典的基础题型,这一问题不仅考察对二叉树遍历的理解,更考验对递归逻辑和边界条件的处理能力。本文将围绕 tree2str 问题展开,通过逐行拆解代码的方式,分析如何利用递归实现二叉树到字符串的转换,并解读其中关键的边界处理技巧,帮助读者深入理解递归在树形结构问题中的应用思路。 文章目录: * 一、根据二叉树创建字符串 * 二、思路分析 * 三、代码 * 1.代码分析 * 1.1 主方法`tree2str`: * 1.2 递归辅助方法`tree2strChild` * 2.代码展示 一、根据二叉树创建字符串 链接直达:根据二叉树创建字符串 二、思路分析 要求将二叉树按照“根节点(左子树)

By Ne0inhk
排序算法指南:归并排序(非递归)

排序算法指南:归并排序(非递归)

前言:              非递归实现归并排序,通常被称为 “自底向上”(Bottom-Up) 的归并排序,与递归版本(先将数组对半拆分直到只剩一个元素,再通过递归栈回溯合并)不同,非递归版本直接从最小的子数组(长度为1)开始,两两合并,然后长度翻倍(2, 4, 8 ...),直到合并完整个数组。                                                                 一、归并排序非递归的核心思路          递归算法转换为非递归实现主要有两种常见方法:          1.使用栈结构模拟递归过程          2.将递归逻辑改写为循环结构          1.1 栈模拟失效          如果仅通过栈结构模拟递归过程,我们只能够做到拆分数组,而不能做到合并数组。          假设我们要排序数组 arr = [8, 4, 5, 7],下标是 0 到 3。          初始状态:栈中有任务 [0, 3]。                   第一步:弹

By Ne0inhk

MediaPipe姿态估计算法详解:2D/3D关键点转换机制揭秘

MediaPipe姿态估计算法详解:2D/3D关键点转换机制揭秘 1. 技术背景与问题提出 随着计算机视觉技术的快速发展,人体姿态估计(Human Pose Estimation)已成为智能健身、动作捕捉、虚拟现实和人机交互等领域的核心技术之一。其核心目标是从单张RGB图像中定位人体关键关节的位置,并构建出可解析的骨架结构。 传统方法依赖于复杂的深度学习模型(如OpenPose、HRNet),往往需要GPU支持且推理延迟较高。而Google推出的 MediaPipe Pose 模型则另辟蹊径,采用轻量级架构设计,在保证高精度的同时实现了毫秒级CPU推理性能,极大降低了部署门槛。 然而,一个常被忽视但至关重要的问题是:MediaPipe是如何从2D图像中输出33个3D关键点的?这些“3D”点是否真正具备空间深度信息?它们又是如何反向投影回2D进行可视化的? 本文将深入剖析MediaPipe姿态估计算法的核心机制,重点揭秘其2D/3D关键点转换逻辑,帮助开发者理解其工作原理并合理应用于实际项目中。 2. MediaPipe Pose核心架构解析 2.1 整体流程概览 M

By Ne0inhk