一种能源互联网数据采集样本扩充方法及系统技术方案

技术编号:32163963 阅读:15 留言:0更新日期:2022-02-08 15:17
本发明专利技术提出了一种能源互联网数据采集样本扩充方法及系统,所述方法包括:分别利用多种优化算法对GAN模型的GAN参数进行优化;将多种优化算法对应获得的多种参数优化结果进行加权平均获得最优参数,并根据最优参数更新GAN模型的GAN参数获得优化GAN模型;将获取的能源互联网数据样本输入至所述优化GAN模型中进行训练,生成与能源互联网数据样本数量一致的新的能源互联网数据样本;将所述能源互联网数据样本和新的能源互联网数据样本合并作为扩充后的样本集。本发明专利技术可有效地优化已有的GAN算法,保证算法的安全稳定,通过对已有样本数据的学习,最终能够自主生成全新的样本数据,很好地解决能源互联网数据真实样本不足的和计算资源不足问题。和计算资源不足问题。和计算资源不足问题。

【技术实现步骤摘要】
一种能源互联网数据采集样本扩充方法及系统


[0001]本专利技术提出了一种能源互联网数据采集样本扩充方法及系统,属于互联网


技术介绍

[0002]能源互联网的迅猛发展使得大量新能源监测数据涌现,能源互联网中的大数据虽然体量巨大,但是质量往往不高。风电、光伏等新能源并网监测数据具有间歇性、周期性、随机性和波动性等特点,存在数据缺失、重复、异常以及分布不均匀等数据质量问题。能源大数据通常价值密度较低,即所采集绝大部分数据为正常样本数据,异常数据很少但却是深度学习所需的关键,深度学习等数字驱动的智能化方法采用了多层网络结构,为了确保模型的泛化能力,就必须相应地增大训练数据。基于机器学习或深度学习的人工智能应用对训练样本都有着数量上的要求。而训练模型所必须的海量训练数据样本难以获取已经成为阻碍深度学习技术进一步推广的一个普遍性难题。如果实际系统包含隐患的真实样本较少,有些异物种类甚至没有合适的样本,往往不能满足人工智能学习算法的训练要求。严重影响了数据特征提取及数据挖掘的准确性和高效性,进而影响利用数据进一步对系统进行态势感知与状态预测等高级应用功能的发挥。
[0003]为了有效解决小样本学习问题,一种常见思路是通过改进算法来使其更适应于小样本环境,但该方法无法很好地在能源互联网领域进行应用,另一种常用方法便是样本扩充,如利用支持向量机结合网格搜索法对原始小样本数据进行预测扩充。但是支持向量机这种方法对缺失数据、参数和核函数的选择比较敏感。

技术实现思路

[0004]本专利技术提出一种能源互联网数据采集样本扩充方法,利用生成对抗网络(generative adversarial network,GAN)实现样本扩充,GAN作为一种新的无监督学习算法框架得到越来越多研究者的青睐,已然成为当下的一个研究热点。GAN独特的对抗训练思想能生成高质量的样本,具有比传统机器学习算法更加强大的特征学习和特征表达能力。目前GAN在计算机视觉领域尤其是在样本生成领域取得显著成功。GAN这种竞争的方式不再要求一个假设的数据分布,而是使用一种分布直接进行采样,从而真正达到理论上可以完全逼近真实数据。
[0005]GAN的生成性能对于参数的选择比较敏感,实际应用中基本上都是凭经验确定参数或采用试算法,导致由于参数选择不合适而使最后的生成精度低于目标精度。目前所提出的参数优化方法比较单一,如果算法出现异常,那么参数失常会给样本生成结果带来很大的不稳定性。本专利提出一种集成学习参数优化的GAN算法,对参数的多种优化算法进行加权平均,克服单一算法突然出现异常的情况,充分利用不同算法的优势。通过对已有能源互联网样本数据的学习,最终能够自主生成全新的样本数据。该方法不需要其他信息辅助,模型能够自主学习样本特征,生成的样本更贴近真实数据,很好地解决能源互联网数据真
实样本不足的问题。本专利技术所采取的技术方案如下:
[0006]一种能源互联网数据采集样本扩充方法,所述方法包括:
[0007]步骤1、分别利用多种优化算法对GAN模型的GAN参数进行优化;
[0008]步骤2、将多种优化算法对应获得的多种参数优化结果进行加权平均,获得最优参数,并根据最优参数更新GAN模型的GAN参数,获得优化GAN模型;
[0009]步骤3、将获取的能源互联网数据样本输入至所述优化GAN模型中进行训练,生成与能源互联网数据样本数量一致的新的能源互联网数据样本;
[0010]步骤4、将所述能源互联网数据样本和新的能源互联网数据样本合并作为扩充后的样本集。
[0011]进一步地,所述多种优化算法包括粒子群算法、遗传算法、粒子群结合遗传算法、人工蜂群算法优化、蚁群算法、鸟群算法和模拟退火算法。
[0012]进一步地,利用所述粒子群算法对GAN参数进行优化的过程包括:
[0013]步骤101a、将GAN参数所取范围的值进行编码形成实数向量,并通过所述实数向量表示种群中的个体;
[0014]步骤102a、随机生成所述实数向量对应的群体,接着利用粒子群算法对所述群体进行迭代;
[0015]步骤103a、将迭代中新生成的个体向量还原为GAN参数值,计算所有样本通过GAN产生的平均相对误差,如果误差小于系统指定的误差精度,则训练过程停止,否则迭代继续进行,直到达到最大迭代次数。
[0016]进一步地,利用所述遗传算法对GAN参数进行优化的过程包括:
[0017]步骤101b、根据GAN网络结构确定参数的编码方案,生成与所述编码方案对应的初始群体;
[0018]步骤102b、分别使用不同的初始化参数值训练所述群体中的个体集的结构;
[0019]步骤103b、通过训练结果对每个个体的适应度进行分辨,并筛选出多个个体直接进入下一代;
[0020]步骤104b、对筛选出的群体采取遗传操作,通过交叉和变异的方法生成新的群体;
[0021]步骤105b、循环重复步骤102b

104b,直到满足终止条件,结束整个优化步骤;并且,当遗传进化到某一代出现个体的适应度达到要求或者遗传进化到预定的最大代数后,迭代结束。
[0022]进一步地,利用所述粒子群结合遗传算法对GAN参数进行优化的过程包括:
[0023]步骤101c、对GAN参数进行二进制编码处理以及参数初始化处理。
[0024]步骤102c、对群体中的每个个体进行解码,将解码后的参数代入到训练测试样本中,计算出个体对应的适应度函数值,并分别保留每个个体最新状态的二进制编码;从t=2开始,其中,t表示训练次数,若当前最新个体的适应度函数值小于前一次保留的适应度函数值,那么就用新个体替换上一代个体,否则不替换;这样的更新就保证了每个个体的历史最优解都能保留下来,同时也保留下来了个体每代的最优解,为步骤104c提供条件;
[0025]步骤103c、随机选取粒子种群中一定数目的个体,选取适应度最好的个体做为父体并以此为条件,完成所有个体的选择;
[0026]步骤104c、应用均匀交叉和变异方式前先对个体进行解码,变异完成后再重新对
个体编码;
[0027]步骤105c、判断是否满足终止条件,若达到最大迭代次数或者所得参数停止变化,则终止迭代并获得最优参数与优化的模型,否则得到新的粒子种群后返回到步骤102c。
[0028]进一步地,利用所述人工蜂群算法优化对GAN参数进行优化的过程包括:
[0029]步骤101d、输入需要优化的参数,并对所述需要优化的参数样本数据进行归一化处理和相关参数的初始化处理;
[0030]步骤102d、将所有蜜蜂变为侦察蜂,随机产生xx个初始解;
[0031]步骤103d、计算初始解的适应度函数值,并初始化第i个采蜜蜂在同一蜜源的连续停留次数t
i
=0;
[0032]步骤104d、建立人工蜂群优化GAN参数的模型;
[0033]步骤105d、搜索新蜜源以产生适应度函数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种能源互联网数据采集样本扩充方法,其特征在于,所述方法包括:步骤1、分别利用多种优化算法对GAN模型的GAN参数进行优化;步骤2、将多种优化算法对应获得的多种参数优化结果进行加权平均,获得最优参数,并根据最优参数更新GAN模型的GAN参数,获得优化GAN模型;步骤3、将获取的能源互联网数据样本输入至所述优化GAN模型中进行训练,生成与能源互联网数据样本数量一致的新的能源互联网数据样本;步骤4、将所述能源互联网数据样本和新的能源互联网数据样本合并作为扩充后的样本集。2.根据权利要求1所述能源互联网数据采集样本扩充方法,其特征在于,所述多种优化算法包括如下中的至少两种:粒子群算法、遗传算法、粒子群结合遗传算法和人工蜂群算法优化。3.根据权利要求2所述能源互联网数据采集样本扩充方法,其特征在于,所述多种优化算法还包括蚁群算法、鸟群算法和/或模拟退火算法。4.根据权利要求2所述能源互联网数据采集样本扩充方法,其特征在于,利用所述粒子群算法对GAN参数进行优化的过程包括:步骤101a、将GAN参数所取范围的值进行编码形成实数向量,并通过所述实数向量表示种群中的个体;步骤102a、随机生成所述实数向量对应的群体,接着利用粒子群算法对所述群体进行迭代;步骤103a、将迭代中新生成的个体向量还原为GAN参数值,计算所有样本通过GAN产生的平均相对误差,如果误差小于系统指定的误差精度,则训练过程停止,否则迭代继续进行,直到达到最大迭代次数。5.根据权利要求2所述能源互联网数据采集样本扩充方法,其特征在于,利用所述遗传算法对GAN参数进行优化的过程包括:步骤101b、根据GAN网络结构确定参数的编码方案,生成与所述编码方案对应的初始群体;步骤102b、分别使用不同的初始化参数值训练所述群体中的个体集的结构;步骤103b、通过训练结果对每个个体的适应度进行分辨,并筛选出多个个体直接进入下一代;步骤104b、对筛选出的群体采取遗传操作,通过交叉和变异的方法生成新的群体;步骤105b、循环重复步骤102b

104b,直到满足终止条件,结束整个优化步骤;并且,当遗传进化到某一代出现个体的适应度达到要求或者遗传进化到预定的最大代数后,迭代结束。6.根据权利要求2所述能源互联网数据采集样本扩充方法,其特征在于,利用所述粒子群结合遗传算法对GAN参数进行优化的过程包括:步骤101c、对GAN参数进行二进制编码处理以及参数初始化处理;步骤102c、对群体中的每个个体进行解码,将解码后的参数代入到训练测试样本中,计算出个体对应的适应度函数值,并分别保留每个个体最新状态的二进制编码;从t=2开始,其中,t表示训练次数,若当前最新个体的适应度函数值小于前一次保留的适应度函数值,
那么就用新个体替换上一代个体,否则不替换;步骤1...

【专利技术属性】
技术研发人员:简燕红王倩王宏刚马寒梅孙明月米娜张海峰孙妮张帆尹泽楠
申请(专利权)人:国家电网有限公司大数据中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1