1 概述

随着风力发电的大规模并网,风能的间歇性和波动性带来的问题凸显,对风电场发电功率进行准确预测,将不确定的风电转变为可调度的友好型电源,是提高风力发电市场竞争力的有效方式[1-2]。面向日前电力平衡的风电场短期功率预测方法主要有基于学习算法的统计方法[3-4]和基于求解大气运动方程的物理方法[5-7]两大类。神经网络法、时间序列法、卡尔曼滤波法等统计方法能够自发地适应不同的风电场特征,具有计算速度快、预测精度高的特点,在风电功率预测领域得到了广泛应用[8]。但由于统计方法具有黑箱性,预测功率的准确性提升仍是困扰研究及工程人员的重要难题,尤其对于复杂地形及大型风电场。因气候、地形及风电机组排布等的综合作用,风电场内不同机组表现出相异的出力特征,利用单一点位的风速外推预测整场发电功率,将难以保证预测精度;若针对单台机组分别建模,将极大地影响功率预测的时效性和经济性[9],且会增加整场预测的不确定性。因此,将整场的风电机组划分为若干机组群,建立考虑风电场内机组分群的功率预测模型,对于提高风电场短期功率预测的准确性和经济性具有重要意义。在风电功率预测及分析领域,分组聚类方法已得到广泛应用。文献[10]提出在神经网络预测方法中引入基于划分的 k-means 聚类算法,对包含气象和历史功率信息的样本进行分类,克服了神经网络的不稳定性和过拟合风险;文献[11]基于模型的自组织特征映射(SOM)聚类算法与 K 折验证相结合,将训练样本按照数据分布特征分类,提高了功率预测模型中不同基学习器的预测能力;文献[6,12]基于多种常用聚类方法建立风电机组分组模型,研究了不同分组方法在风电功率预测统计及物理模型中的适应性,显著提高了未分组模型的功率预测准确性。上述方法利用有限参数实现了风电场内机组分组,但仍难以全面反映不同机组的多峰、多模式特征。针对以上局限,结合风电机组运行数据的分布特征,提出了基于非参数化的高斯混合模型(Gaussian mixture model,GMM)聚类的风电场短期功率预测方法。利用贝叶斯信息准则(Bayesian information criterion,BIC)判定最优聚类个数,依托基于径向基函数(radial basis function,RBF)神经网络的功率预测方法,验证所提聚类方法的有效性以及相较于其他聚类方法的优越性,为风电场短期功率预测方法的优化奠定了基础。
基于风电机组分组的功率预测流程图:

基于高斯混合模型聚类的 CNN-BiLSTM-Attention 风电场短期功率预测方法研究
一、方法框架与技术原理
该方法的核心思路是通过高斯混合模型(GMM)对风电场机组进行聚类分组,再结合 CNN-BiLSTM-Attention 深度学习模型进行功率预测,实现多层次数据特征挖掘与时空关联建模。具体技术路径如下:
1. 高斯混合模型聚类(GMM)
- 数据预处理:整合历史功率数据与气象参数(风速、温度、气压等),通过皮尔逊相关系数分析环境因素对功率的影响权重。
- 聚类优化:采用贝叶斯信息准则(BIC)确定最优机组分组数,将风电场划分为多个具有相似出力特性的机组群,解决单点位预测代表性差的问题。
- 适用性分析:GMM 能捕捉复杂数据分布特征,相比 K-means 等传统算法,更适用于风电出力场景划分。研究表明,GMM 聚类后的误差可降低 12%-22%。
2. CNN-BiLSTM-Attention 模型架构
- CNN 特征提取:通过 1D 卷积核(如 3×1、5×1)提取时间序列的局部动态特征(如风速突变、功率波动),卷积层输出经池化压缩后保留关键信息。
- BiLSTM 时序建模:双向 LSTM 同时捕捉前向与后向时间依赖关系,实验显示其 MAE 比单向 LSTM 减少 0.1-0.17 MW,MAPE 降低 3.98%-4.79%。
- 注意力机制优化:自注意力模块动态分配权重,突出关键时间步的特征贡献。例如,在风电预测中,对风速骤变时刻的注意力权重可提升至常规值的 2-3 倍。
二、关键技术协同作用分析











