一种基于数据增强与CNN-LSTM的风电功率概率预测方法技术

技术编号:38839554 阅读:15 留言:0更新日期:2023-09-17 09:54
本发明专利技术公开一种基于数据增强与CNN

【技术实现步骤摘要】
一种基于数据增强与CNN

LSTM的风电功率概率预测方法


[0001]本专利技术涉及一种基于数据增强与CNN

LSTM的风电功率概率预测方法,属于新能源功率预测领域。

技术介绍

[0002]构建以新能源为主体的新型电力系统,风力发电作为新能源发电的重要形式之一,发展风力发电对于电力生产有重要意义。但是由于风电具有较大的间歇性和波动性,同时具有随机性,风电大规模并网会对电力系统运行的安全性与稳定性带来一定的问题。所以建立一套完善的风电功率概率预测系统对电力系统调度以及安全运行有着重要的意义,同时还能改善弃风现象,有助于电力系统经济运行。近年来随着大数据人工智能技术以及深度学习算法的发展,为深度学习技术在风电功率概率预测的应用提供了可能。相较于浅层机器学习,深度学习的优势在于:(1)能够通过多网络层经过训练的非线性结构逼近实际需求的复杂非线性函数;(2)采用先对网络进行逐层训练之后进行的微调方式能够有效的提取出问题的抽象概念,有效解决了传统浅层神经出现的局部最优解的问题;(3)网络结构灵活,可以完成不同结构下的监督学习,具有更好的适应性。
[0003]对于风电功率概率预测,目前主要有参数法与非参数法两种预测方法。非参数方法由于无需事先假设风电功率服从某一特定的概率分布,因此能够更好地体现风电功率的概率分布。随着大量新建风电场投入使用,如何在样本不足情况下进行风电功率深度学习建模成为了研究热点。目前对于新建风电场的深度学习建模的方法主要有:(1)利用自编码器、生成对抗网络等生成模型进行样本扩充;(2)利用迁移学习方法将数据完备的风电场数据或其风电功率预测模型迁移至新建风电场。在样本稀缺的情况下,采用生成对抗网络能够有效根据现有样本,实现样本扩充,达成数据增强的效果。然而对于风电功率这样的时间序列数据,生成对抗网络不能很好地学习到数据内部的时间关联,需要对预测方法做进一步改进。

技术实现思路

[0004]本专利技术的目的是提供一种基于数据增强与CNN

LSTM的风电功率概率预测方法,以解决上述
技术介绍
中存在的问题。
[0005]本专利技术的目的由以下技术措施实现:
[0006]一种基于数据增强与CNN

LSTM的风电功率概率预测方法,其特征在于按以下步骤进行:
[0007]S1:采集目标风电场及邻近风电场数据,用于预测模型的训练及测试;
[0008]S2:通过真实数据训练W

GAN(Wasserstein GAN)的判别器,利用生成器生成数据,并通过判别器的结果对生成器反馈训练;通过基于支持向量回归(SVR)的邻近风电场及目标风电场预测模型训练,分析自身及邻近风电场的误差分布;再基于最大互信息系数分析方法分析邻近风电场的相关性,并根据相关性强弱将邻近风电场数据进行分类,形成待迁
移数据集,并与W

GAN生成数据集共同构成目标风电场训练数据集;
[0009]S3:将经过训练的W

GAN产生的大量数据结合自身及误差分布相似的邻近风电场待迁移数据通过CNN

LSTM组合模型进行预测,得到结合生成数据中的大量信息与实际训练数据中的时序信息的预测结果;进而通过分位数回归层得到相应时刻的离散化的风电概率预测结果,再通过核密度估计方法,得到相应的连续化的概率密度表达,通过点预测误差分布统计得到概率预测结果;
[0010]S4:以ACE(Average Coverage Error)、AW(Average Width)与WINKLER指标作为风电概率预测模型性能评判标准,选取最合适的CNN

LSTM组合概率预测模型,将S1的测试数据输入选取的CNN

LSTM组合概率预测模型后进入预测,输出结果。
[0011]进一步地,所述S1步骤中,具体步骤包括:
[0012]S1.1:采集目标风电场时间分辨率15min,连续40天的数据,邻近风电场连续1年的数据,包括数值天气预报(NWP)数据及其对应的功率数据,将采集的目标风电场75%数据划分为训练数据集,采集的目标风电场25%数据划分为测试数据集,分别用于预测模型的训练及测试;将采集邻近风电场的75%数据用于模型的训练。
[0013]进一步地,所述S2步骤中,具体步骤包括:采用训练数据集对W

GAN的判别器进行训练,利用判别器结果训练生成器并生成新生成数据,再利用生成器通过随机噪声生成数据;通过真实训练数据集与生成数据对判别器进行测试,测试结果反馈训练生成器与判别器;重复以上训练过程,直到达到纳什均衡也就是基于主成分分析的生成数据有效性检验,并将生成数据构成W

GAN生成数据集;
[0014]S2.2:首先将训练数据集用于基于SVR的目标风电场预测模型训练和将邻近风电场的75%数据用于基于SVR的邻近风电场预测模型训练,统计分析目标风电场预测模型和邻近风电场预测模型误差分布,再通过最大互信息系数(MIC)分析的误差分布相关性分析方法,分析各风电场的误差分布相关性,并依据相关性强弱将邻近风电场数据进行分类,选取误差分布相似目标风电场相关数据构建待迁移数据集,待迁移数据集与W

GAN生成数据集共同构成目标风电场训练数据集。
[0015]进一步地,所述S3步骤中,具体步骤包括:
[0016]S3.1:将S2.1步骤中训练好的W

GAN生成数据集输入CNN模型中,CNN模型提取生成数据集中大量图谱特征;将训练数据集输入LSTM模型中,LSTM模型提取实际训练数据集中的自身时间序列特征,将S2.2步骤中训练好的待迁移数据集输入LSTM模型中,LSTM模型提取邻近风电场中待迁移数据集的时间序列特征,采用待迁移数据集对迁移学习模型进行微调;再通过CNN

LSTM组合概率预测模型的全连接层将上述三个模型中所得特征进行融合,得到融合特征。
[0017]S3.2:将S3.1步骤中得到的融合特征输入CNN

LSTM组合概率预测模型,采用Pinball损失函数的分位数回归层进行预测,并得到相对应的不同置信区间下离散化的风电概率预测结果;
[0018]S3.3:再将S3.2步骤中所得离散化的概率预测结果输入核密度估计模型中,并选择均匀核函数、三角核函数和高斯核函数得到相应连续化的概率密度表达;
[0019]S3.4:通过将S3.1步骤中得到的融合特征输入CNN

LSTM组合概率预测模型,采用均方误差函数的回归层获得点预测结果并统计误差分布得到概率预测结果,离散化的风电
概率预测结果、连续化的概率密度表达和概率预测结果共同构成概率预测表达。
[0020]进一步地,所述S4步骤中,具体步骤包括:以ACE、AW与WINKLER指标作为风电概率预测模型性能评判标准,选取参数最优的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于数据增强与CNN

LSTM的风电功率概率预测方法,其特征在于按以下步骤进行:S1:采集目标风电场及邻近风电场数据,用于预测模型的训练及测试;S2:通过真实数据训练W

GAN(Wasserstein GAN)的判别器,利用生成器生成数据,并通过判别器的结果对生成器反馈训练;通过基于支持向量回归(SVR)的邻近风电场及目标风电场预测模型训练,分析自身及邻近风电场的误差分布;再基于最大互信息系数分析方法分析邻近风电场的相关性,并根据相关性强弱将邻近风电场数据进行分类,形成待迁移数据集,并与W

GAN生成数据集共同构成目标风电场训练数据集;S3:将经过训练的W

GAN产生的大量数据结合自身及误差分布相似的邻近风电场待迁移数据通过CNN

LSTM组合模型进行预测,得到结合生成数据中的大量信息与实际训练数据中的时序信息的预测结果;进而通过分位数回归层得到相应时刻的离散化的风电概率预测结果,再通过核密度估计方法,得到相应的连续化的概率密度表达,通过点预测误差分布统计得到概率预测结果;S4:以ACE(Average Coverage Error)、AW(Average Width)与WINKLER指标作为风电概率预测模型性能评判标准,选取最合适的CNN

LSTM组合概率预测模型,将S1的测试数据输入选取的CNN

LSTM组合概率预测模型后进入预测,输出结果。2.根据权利要求1所述一种基于数据增强与CNN

LSTM的风电功率概率预测方法,其特征在于,所述S1步骤中,具体步骤为:采集目标风电场时间分辨率15min,连续40天的数据,邻近风电场连续1年的数据,包括NWP数据及其对应的功率数据,将采集的目标风电场75%数据划分为训练数据集,采集的目标风电场25%数据划分为测试数据集,分别用于预测模型的训练及测试;将采集邻近风电场的75%数据用于模型的训练。3.根据权利要求2所述一种基于数据增强与CNN

LSTM的风电功率概率预测方法,其特征在于,所述S2步骤中,具体步骤包括:S2.1:采用训练数据集对W

GAN的判别器进行训练,利用判别器结果训练生成器并生成新生成数据,再利用生成器通过随机噪声生成数据;通过真实训练数据集与生成数据对判别器进行测试,测试结果反馈训练生成器与判别器;重复以上训练过程,直到达到纳什均衡也就是基于主成分...

【专利技术属性】
技术研发人员:刘双全彭小圣段睿钦魏沛杰朱欣春赵珍玉张杰张聪通赵栩杨韵琛李相勇符凯祥杨泽泰
申请(专利权)人:云南电网有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1