一种能源互联网数据采集样本扩充方法及系统技术方案

技术编号：32163963 阅读：15 留言：0更新日期：2022-02-08 15:17

本发明专利技术提出了一种能源互联网数据采集样本扩充方法及系统，所述方法包括：分别利用多种优化算法对GAN模型的GAN参数进行优化；将多种优化算法对应获得的多种参数优化结果进行加权平均获得最优参数，并根据最优参数更新GAN模型的GAN参数获得优化GAN模型；将获取的能源互联网数据样本输入至所述优化GAN模型中进行训练，生成与能源互联网数据样本数量一致的新的能源互联网数据样本；将所述能源互联网数据样本和新的能源互联网数据样本合并作为扩充后的样本集。本发明专利技术可有效地优化已有的GAN算法，保证算法的安全稳定，通过对已有样本数据的学习，最终能够自主生成全新的样本数据，很好地解决能源互联网数据真实样本不足的和计算资源不足问题。和计算资源不足问题。和计算资源不足问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种能源互联网数据采集样本扩充方法及系统

[0001]本专利技术提出了一种能源互联网数据采集样本扩充方法及系统，属于互联网

技术介绍

[0002]能源互联网的迅猛发展使得大量新能源监测数据涌现，能源互联网中的大数据虽然体量巨大，但是质量往往不高。风电、光伏等新能源并网监测数据具有间歇性、周期性、随机性和波动性等特点，存在数据缺失、重复、异常以及分布不均匀等数据质量问题。能源大数据通常价值密度较低，即所采集绝大部分数据为正常样本数据，异常数据很少但却是深度学习所需的关键，深度学习等数字驱动的智能化方法采用了多层网络结构，为了确保模型的泛化能力，就必须相应地增大训练数据。基于机器学习或深度学习的人工智能应用对训练样本都有着数量上的要求。而训练模型所必须的海量训练数据样本难以获取已经成为阻碍深度学习技术进一步推广的一个普遍性难题。如果实际系统包含隐患的真实样本较少，有些异物种类甚至没有合适的样本，往往不能满足人工智能学习算法的训练要求。严重影响了数据特征提取及数据挖掘的准确性和高效性，进而影响利用数据进一步对系统进行态势感知与状态预测等高级应用功能的发挥。
[0003]为了有效解决小样本学习问题，一种常见思路是通过改进算法来使其更适应于小样本环境，但该方法无法很好地在能源互联网领域进行应用，另一种常用方法便是样本扩充，如利用支持向量机结合网格搜索法对原始小样本数据进行预测扩充。但是支持向量机这种方法对缺失数据、参数和核函数的选择比较敏感。

技术实现思路

[0004]本专利技术提出一种能源互...

【技术保护点】

【技术特征摘要】
1.一种能源互联网数据采集样本扩充方法，其特征在于，所述方法包括：步骤1、分别利用多种优化算法对GAN模型的GAN参数进行优化；步骤2、将多种优化算法对应获得的多种参数优化结果进行加权平均，获得最优参数，并根据最优参数更新GAN模型的GAN参数，获得优化GAN模型；步骤3、将获取的能源互联网数据样本输入至所述优化GAN模型中进行训练，生成与能源互联网数据样本数量一致的新的能源互联网数据样本；步骤4、将所述能源互联网数据样本和新的能源互联网数据样本合并作为扩充后的样本集。2.根据权利要求1所述能源互联网数据采集样本扩充方法，其特征在于，所述多种优化算法包括如下中的至少两种：粒子群算法、遗传算法、粒子群结合遗传算法和人工蜂群算法优化。3.根据权利要求2所述能源互联网数据采集样本扩充方法，其特征在于，所述多种优化算法还包括蚁群算法、鸟群算法和/或模拟退火算法。4.根据权利要求2所述能源互联网数据采集样本扩充方法，其特征在于，利用所述粒子群算法对GAN参数进行优化的过程包括：步骤101a、将GAN参数所取范围的值进行编码形成实数向量，并通过所述实数向量表示种群中的个体；步骤102a、随机生成所述实数向量对应的群体，接着利用粒子群算法对所述群体进行迭代；步骤103a、将迭代中新生成的个体向量还原为GAN参数值，计算所有样本通过GAN产生的平均相对误差，如果误差小于系统指定的误差精度，则训练过程停止，否则迭代继续进行，直到达到最大迭代次数。5.根据权利要求2所述能源互联网数据采集样本扩充方法，其特征在于，利用所述遗传算法对GAN参数进行优化的过程包括：步骤101b、根据GAN网络结构确定参数的编码方案，生成与所述编码方案对应的初始群体；步骤102b、分别使用不同的初始化参数值训练所述群体中的个体集的结构；步骤103b、通过训练结果对每个个体的适应度进行分辨，并筛选出多个个体直接进入下一代；步骤104b、对筛选出的群体采取遗传操作，通过交叉和变异的方法生成新的群体；步骤105b、循环重复步骤102b
‑
104b，直到满足终止条件，结束整个优化步骤；并且，当遗传进化到某一代出现个体的适应度达到要求或者遗传进化到预定的最大代数后，迭代结束。6.根据权利要求2所述能源互联网数据采集样本扩充方法，其特征在于，利用所述粒子群结合遗传算法对GAN参数进行优化的过程包括：步骤101c、对GAN参数进行二进制编码处理以及参数初始化处理；步骤102c、对群体中的每个个体进行解码，将解码后的参数代入到训练测试样本中，计算出个体对应的适应度函数值，并分别保留每个个体最新状态的二进制编码；从t＝2开始，其中，t表示训练次数，若当前最新个体的适应度函数值小于前一次保留的适应度函数值，
那么就用新个体替换上一代个体，否则不替换；步骤1...

【专利技术属性】
技术研发人员：简燕红，王倩，王宏刚，马寒梅，孙明月，米娜，张海峰，孙妮，张帆，尹泽楠，
申请(专利权)人：国家电网有限公司大数据中心，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人