【技术实现步骤摘要】
一种基于Bi
‑
GAN的电力系统缺失值填补方法
[0001]本专利技术涉及智能化电力系统
,具体为一种基于Bi
‑
GAN的电力系统缺失值填补方法。
技术介绍
[0002]随着智能化电力系统的建设,爆炸式的海量数据带来了新的挑战,测量采样、信息传输和数据存储处理不当会导致数据丢失,从而破坏数据完整性,使得数据质量下降,影响电力消耗预测精度。
[0003]目前国内外电力系统缺失值填补方法主要分为直接删除法、基于统计分析的数据填补法、基于机器学习的数据填补方法。直接删除法主要以删除缺失的数据来使得数据完整,当样本缺失数量比较大时,不利于挖掘电力消耗预测的隐含发展规律。基于统计分析的数据填补法根据原始数据的统计信息来填充缺失值,主要包括平均值填补、热卡填补、冷卡填补、特殊值填补、回归等方法,这类填补方法缺乏对每个样本的独立特性的考虑。基于机器学习的数据填补方法利用机器学习算法包括K最邻近法(K
‑
Nearest Neighbor,KNN)、自编码器(Autoenco ...
【技术保护点】
【技术特征摘要】
1.一种基于Bi
‑
GAN的电力系统缺失值填补方法,其特征在于:包括以下步骤:步骤1:收集来自于包含有缺失值的电力数据,首先对数据进行归一化预处理和特殊值处理,并构建缺失位置编码向量;步骤2:双向对抗生成对抗网络Bi
‑
GAN是一种生成式模型,能够生成服从原始数据集分布的新样本,主要由生成器G、判别器D、编码器E组成,当将预处理后的数据传入Bi
‑
GAN网络的中,通过生成器G与判别器D之间的博弈,最终生成一份与原始数据集有着同样分布的完整数据集;步骤3:使用损失函数来降低新生成样本G(E(x))与原始数据x之间的差异;步骤4:使用填充损失函数来对电力系统中的缺失数据进行填充。2.根据权利要求1所述的一种基于Bi
‑
GAN的电力系统缺失值填补方法,其特征在于:所述步骤1中,从电力系统中获取包含缺失值的电力数据,经过归一化处理使数据介于0~1之间,将数据中的空值替为特殊符号NULL,离散数值变量采用one hot编码,构建缺失值位置编码向量。3.根据权利要求1所述的一种基于Bi
‑
GAN的电力系统缺失值填补方法,其特征在于:所述步骤2中,通过生成器与判别器之间的博弈其中V(D,E,G)由下式计算:其中,G是生成器、D为判别器,E为编码器,x代表包含缺失值的电力系统中的真实样本,z是先验分布的随机抽样,G(z)表示z生成的样本,y为数据源,若待判别数据来自真实样本x,则y=1;如果他来自生产的样本G(z),则y=0,Bi
‑
GAN将原始数据x与其他提取的特征E(X)绑定,生成的样本G(z)与其先验分布样本z绑定,然后将两对标记为1和0;训练BI
‑
WAN网络中的判别器:将带有缺失值的电力数据X通过编码器映射到E(x),同时将任意分布采样的任意噪声z通过生成器映射G(z),然后分别将把合成后的数据(G(z),z)和(x,E(x))送入判别器中学习,通过更反向传播不断优化生成器和编码器,同时训练BI
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。