【技术实现步骤摘要】
本申请属于电数字数据处理,应用于新能源发电领域,尤其涉及一种风电场的风速功率数据的数据处理方法和装置。
技术介绍
1、随着风力发电的不断发展,越来越多的风电场被投运并网。在运营过程中,越来越多的风电场通过预测风电功率和发电量的方式来优化风电场的运行调度和发电收益。机器学习是目前进行风电功率预测和发电量预测的主要方式,但是机器学习需要依赖于训练数据,即,在训练过程中需要大量的风速-功率基础数据。然而,新建风电场的投运时间较短,所产生的风速-功率数据相对较少,这样势必会导致预测模型在小样本训练数据集上容易产生过拟合的问题。
2、针对如何扩充用于训练的风速功率数据,以提升风电功率和发电量模型的预测准确率,目前尚未提出有效的解决方案。
技术实现思路
1、本申请目的在于提供一种风电场的风速功率数据的数据处理方法和装置,可以高效扩充用于训练的风速功率数据,从而提升目标风电场的风电功率和发电量模型的预测准确率。
2、本申请提供一种风电场的风速功率数据的数据处理方法和装置是这样实现的:
3、一种风电场的风速功率数据的数据处理方法,所述方法包括:
4、获取目标风电场的风速功率的历史真实样本数据;
5、对所述风速功率的历史真实样本数据进行预处理,得到预处理后的风速功率真实样本数据,并随机生成噪声数据;
6、构建用于捕捉风速功率真实样本数据的分布的生成对抗网络模型;
7、利用预处理后的风速功率真实样本数据构建真实样本训练
8、将所述真实样本训练数据集和所述噪声样本训练数据集,离线输入至生成对抗网络模型中进行预训练直到生成对抗网络模型收敛,得到生成对抗网络的预训练模型;
9、将所述目标风电场的实时运行产生的风速功率数据实时输入至所述生成对抗网络的预训练模型中,以对所述生成对抗网络的预训练模型进行调节,得到生成对抗网络的目标模型;
10、生成与所述噪声样本训练数据集满足相同分布的随机噪声数据;
11、将所述随机噪声数据输入至所述对抗网络的目标模型中,得到符合所述目标风电场的真实数据分布的风速功率数据样本。
12、在一个实施方式中,所述历史真实样本数据包括:时间戳字段、风速字段和功率字段;
13、相应的,对所述风速功率的历史真实样本数据进行预处理包括:
14、对风速字段和功率字段进行缺省值处理、异常值处理和归一化处理;
15、将所述时间戳字段、处理后的风速字段和功率字段组成预处理后的风速功率真实样本数据。
16、在一个实施方式中,构建用于捕捉风速功率真实样本数据的分布的生成对抗网络模型,包括:
17、构建含有生成器和判别器的生成对抗网络模型,其中,生成器用于学习风速功率历史真实样本数据分布以生成接近真实数据分布的合成数据,判别器用于学习风速功率历史真实样本数据与合成数据分布的差异以识别出合成数据。
18、生成器接收满足多峰分布的随机噪声数据,并根据随机噪声数据输出合成数据;
19、通过判别器接收历史真实样本数据和合成数据,并输出第一数据组和第二数据组,其中,第一数据组包括:用于表征数据是历史真实样本数据的概率和判别器的参数值,第二数据组包括:用于表征数据是合成数据的概率和判别器的参数值。
20、在一个实施方式中,所述生成器包括:序列输入模块、序列解析模块和序列生成模块,其中,所述序列输入模块用于输入带时间戳的一维噪声向量形式的历史真实样本数据,并对序列中各字段的位置顺序信息进行编码标记并对输入的数据中各字段的位置顺序信息进行编码标记,所述序列解析模块用于对编码标记后的数据顺序进行序列归一化、序列子空间信息提取、序列归一化、全连接线性变换以提取时序特征,所述序列生成模块,用于将提取的时序特征输入至序列生成模块中的二维卷积层中并输出得到合成数据,其中,所述序列解析模块中的全连接线性变换为两层神经网络,所述两层神经网络用于先进行线性变换,再采用relu函数进行非线性变换,再进行线性变换;
21、所述判别器包括:混合序列输入模块、混合序列解析模块和二分类识别模块,其中,混合序列输入模块用于接收带时间戳的一维噪声向量形式的历史真实样本数据或生成器输出的合成数据,并对序列中各字段的位置顺序信息进行编码标记并对输入的数据中各字段的位置顺序信息进行编码标记,所述混合序列解析模块,用于对编码标记后的数据顺序进行混合序列归一化、混合序列子空间信息提取、混合序列归一化、全连接线性变换以提取时序特征,所述二分类识别模块用于对时序特征进行二分类识别,其中,所述二分类识别模块采用sigmoid函数将序列值映射到[0,1]区间,并将输出的概率值划分为真实数据和合成数据两个类别。
22、在一个实施方式中,将所述真实样本训练数据集和所述噪声样本训练数据集,离线输入至生成对抗网络模型中进行预训练直到生成对抗网络模型收敛,得到生成对抗网络的预训练模型,包括:
23、控制生成器和判别器相互对抗并交替式更新深度神经网络的权重参数;
24、按照如下目标函数对生成对抗网络模型进行预训练:
25、
26、其中,d表示判别器,g表示生成器,z表示噪声数据,x表示真实样本训练数据,d(x,γ)表示判别器判别真实样本训练数据集中的数据为真实数据的概率,d(g(z,θ),γ)表示判别器判别合成数据为真实数据的概率,θ表示生成器的参数,γ表示判别器的参数;在输入数据为真实样本训练数据集时,判别器最大化log(d(x,γ))与 log(1-d(g(z,θ),γ)),控制判别器的输出d(g(z,θ),γ)接近1;在输入数据为合成数据时,生成器最小化log(1-d(g(z,θ),γ)),控制判别器的输出d(g(z,θ),γ)接近0。
27、在一个实施方式中,将所述真实样本训练数据集和所述噪声样本训练数据集,离线输入至生成对抗网络模型中进行预训练直到生成对抗网络模型收敛,得到生成对抗网络的预训练模型,包括:
28、从所述真实样本训练数据集中采集预定数量个真实样本数据;
29、从所述噪声样本训练数据集中采集预定数量个噪声样本数据;
30、采用随机梯度算法,基于预定数量个真实样本数据和预定数量个噪声样本数据通过增大梯度或减小梯度的方式对判别器的权重参数进行更新:
31、
32、其中,m表示预定数量,d表示判别器,g表示生成器,z表示噪声数据,x表示真实样本训练数据,d(x,γ)表示判别器判别真实样本训练数据集中的数据为真实数据的概率,d(g(z,θ),γ)表示判别器判别合成数据为真实数据的概率,θ表示生成器的参数,γ表示判别器的参数。
33、一种风电场的风速功率数据的数据处理装置,包括:
34、获取模块,用于获取目标风电场的风速功率的历史真实样本数据;本文档来自技高网...
【技术保护点】
1.一种风电场的风速功率数据的数据处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述历史真实样本数据包括:时间戳字段、风速字段和功率字段;
3.根据权利要求1所述的方法,其特征在于,构建用于捕捉风速功率真实样本数据的分布的生成对抗网络模型,包括:
4.根据权利要求3所述的方法,其特征在于,
5.根据权利要求3所述的方法,其特征在于,将所述真实样本训练数据集和所述噪声样本训练数据集,离线输入至生成对抗网络模型中进行预训练直到生成对抗网络模型收敛,得到生成对抗网络的预训练模型,包括:
6.根据权利要求1所述的方法,其特征在于,将所述真实样本训练数据集和所述噪声样本训练数据集,离线输入至生成对抗网络模型中进行预训练直到生成对抗网络模型收敛,得到生成对抗网络的预训练模型,包括:
7.一种风电场的风速功率数据的数据处理装置,其特征在于,包括:
8.根据权利要求7所述的装置,其特征在于,所述第一构建模块包括:
9.一种电子设备,包括处理器以及用于存储处理器可执行指
10.一种计算机可读存储介质,其上存储有计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1至6中任一项所述方法的步骤。
...【技术特征摘要】
1.一种风电场的风速功率数据的数据处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述历史真实样本数据包括:时间戳字段、风速字段和功率字段;
3.根据权利要求1所述的方法,其特征在于,构建用于捕捉风速功率真实样本数据的分布的生成对抗网络模型,包括:
4.根据权利要求3所述的方法,其特征在于,
5.根据权利要求3所述的方法,其特征在于,将所述真实样本训练数据集和所述噪声样本训练数据集,离线输入至生成对抗网络模型中进行预训练直到生成对抗网络模型收敛,得到生成对抗网络的预训练模型,包括:
6.根据权利要求1所述的方法,其特征在于,...
【专利技术属性】
技术研发人员:商海,刘峻,任晓朦,胡坤,梁中兴,雷镇源,武雪洁,
申请(专利权)人:中电建新能源集团股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。