基于GAN处理不平衡数据的线变关系识别方法技术

技术编号:34331811 阅读:94 留言:0更新日期:2022-07-31 02:13
本发明专利技术提出一种基于GAN处理不平衡数据的线变关系识别方法,包括:S1、采集日用电量,建立原始数据集;S2、从配电线路日线损电量、配电线路日输入电量以及各变压器日用电量中提取特征量;S3、利用GAN对线变关系特征集进行数据扩充;S4、利用经样本扩充后的特征集,构建支持向量机分类模型,实现对线变关系的识别。其以配电线路供电量和配电变压器用电量为基础,利用支持向量机分类模型挖掘电量信息与不同线变关系间的潜在关联,实现不同线变关系的分类处理,提出了一种线变关系识别的新方法。以GAN为基础对线变关系特征集中只占极少数的线变关系异常样本进行数据扩充,实现不同线变关系类别间样本数量的分布均衡。类别间样本数量的分布均衡。类别间样本数量的分布均衡。

Recognition method of line variation relationship based on GaN processing unbalanced data

【技术实现步骤摘要】
基于GAN处理不平衡数据的线变关系识别方法


[0001]本专利技术涉及10kV配电网线变关系识别以及不平衡数据处理领域,具体地涉及一种基于GAN处理不平衡数据的线变关系识别方法。

技术介绍

[0002]目前10kV及以下电压等级配电网线变关系错误可以分为两种类型:
[0003](1)配电网络拓扑的不正确连接,最常见的示例是将配电变压器连接到错误的电源线,或者客户连接到错误的配电变压器;
[0004](2)设备参数不正确,最常见的例子是配电变压器的变压比不正确。
[0005]传统的梳理10kV线路线变关系的主要手段是通过基层工作人员进行现场勘查,将实地情况与设备(资产)运维精益管理系统档案信息相比对,若有差异则可申请进行设备变更实现台账维护。但是由于10kV线路及其所挂接的变压器数量众多,传统地毯式的现场搜索需要耗费大量的人力物力,时效性低,这也是目前10kV分线同期线损达标率提升速度缓慢的关键原因,因此,有必要研究一种10kV线路线损治理方法,能够快速有效地梳理10kV线路线变关系,精准定位线变关系错误,提高同期线损治理效率。
[0006]目前的研究工作集中在对低压配电网的变户关系识别,且研究方法主要基于电压分布相关性分析。但该方法是从用户与台区变压器的电气距离角度出发,对于电气距离较长的线路,由于存在线路电压损耗,所以线路负荷大时会导致首末端用户的电压差较大,进而导致电压曲线相似程度降低。
[0007]对于中压配电网线变关系识别方法目前研究较少,一方面是在中压配电网线变关系识别中,如果沿用低压配电网的变户关系识别中的方法,仍有在变户关系识别中利用电压相关性分析方法带来的局限性,甚至这种问题变得更为突出,因为配电网中压部分比低压部分配电范围更大,不同配电变压器节点之间的电压相关性将会降低。另一方面,分布式发电的不确定性导致配电网各节点电压的变化,进而影响电压曲线相似度计算结果,从而造成误判。
[0008]同时,在对线变关系的智能识别中,线变关系异常的配电变压器数量往往只占极少数,如果将原始数据集直接投入到分类器模型中训练会导致分类的结果倾向于多数类,即对于线变关系正常类别的分类准确率很高,对数量占比很小的线变关系异常类却识别率很低。在工程实际中,这种对线变关系异常类的误判将造成严重的后果。因此,在进行线变关系分类时,需要考虑传统分类器算法在不平衡数据集上的局限性,采用更合适的不平衡数据分类方法。

技术实现思路

[0009]针对上述提到的现有技术存在的问题,本专利技术以配电线路供电量和配电变压器用电量为基础,并且添加了基于GAN实现对线变关系异常样本的数据扩充,以解决不平衡数据集下的分类问题,利用支持向量机分类模型挖掘电量信息与不同线变关系间的潜在关联,
从而实现线变关系的精确识别,摆脱了基于电压分布相关性分析方法的局限性,并且保证了识别的准确度,大幅度提高了工作效率,节约了大量的人力和时间成本。
[0010]具体地,本专利技术提供一种基于GAN处理不平衡数据的线变关系识别方法,其包括以下步骤:
[0011]S1,通过用户电量采集系统采集10kV输电线路的日输入电量以及输电线路连接的各配电变压器的日用电量,对采集到的电量数据进行数据预处理,得到日线损电量,并将配电线路线变关系分为三个类别:线路挂错线变关系、电能表倍率计错线变关系和正常线变关系,建立线变关系识别的原始数据集;
[0012]S2,利用皮尔逊系数、相对变化系数、波动系数和斜率比四种参数从配电线路日线损电量、配电线路日输入电量以及各变压器日用电量中提取12个特征量,作为线变关系识别的特征集;
[0013]S3,利用GAN对线变关系特征集中只占极少数的线变关系异常样本进行数据扩充,从而实现不同线变关系类别间样本数量的分布均衡,具体包括如下子步骤:
[0014]S31、搭建基于GAN的线变关系异常样本的数据生成模型,该数据生产模型包括生成器模型和判别器模型,生成器模型中全连接神经网络的输入层、隐含层和输出层均设计为1层,且各层节点数分别设计为10、50和12,判别器模型设计为全连接神经网络的输入层、隐含层和输出层构成的二分类器,网络中输入层、隐含层和输出层节点数分别设计为12、50和1,数据生成模型的学习率设置为0.01,基于GAN处理线变关系数据不平衡的网络模型总的迭代次数设置为5000;
[0015]S32、构建GAN模型的目标函数为:
[0016][0017]其中,V(D,G)表示GAN模型的目标函数,D(
·
)表示判别器模型的输出,E(
·
)表示期望值,D(x)表示判别器认为x是真实样本的概率,G(z)表示随机信号z是经过生成器模型G得出的合成样本,1

D(G(z))为判别器模型认为合成样本为假的概率,x~P
data
(x)指的是从真实样本分布中采样,z~P
z
(z)指的是从噪声分布P
z
(z)中采样;
[0018]S33、生成器模型的损失函数设为g_loss=log(D(G(z))),判别器模型的损失函数设为:d_loss=

log(D(x))+log(1

D(G(z)));
[0019]其中,G(z)表示随机信号z是经过生成器模型G得出的生成样本,x表示真实的线变关系异常样本数据,D(
·
)表示判别器模型的输出;
[0020]S34、利用损失函数训练生成器与判别器模型,其具体包括以下子步骤:
[0021]S341、训练过程采用生成器模型与判别器模型单独交替迭代训练,先固定生成器模型,训练判别器模型,之后固定判别器模型,训练生成器模型;
[0022]S342、当训练判别器模型时,将上一轮生成器模型产生的样本数据和真实样本数据拼接在一起作为判别器模型的输入,其中假样本的标签设定为0,真样本的标签设定为1,之后通过判别器模型,生成一个概率值η,η为0到1之间的数,通过概率值η和目标值组成的损失函数,采用随机梯度下降法对判别器中神经网络的权值进行更新;
[0023]S343、当训练生成器模型时,将生成器模型和判别器模型作为一个整体进行输出,输入一组随机向量,在生成器模型中生成一个样本数据,通过判别器模型对生成的样本数据进行判别得到输出结果概率值η,将概率值η与1之间的差异组成损失函数,之后采用随机
梯度下降法对生成器中神经网络的权值进行更新;
[0024]S344、根据步骤S342和步骤S343完成生成器模型与判别器模型的单独交替迭代训练,当P
g
=P
data
时,即判别器模型对生成样本与真实样本输出的概率值均为0.5时,此时GAN模型的目标函数达到全局最优解,其中,P
g
表示判别器对生成样本的判别结果,P
data
表示判别器对真实的线变关系异常样本数据的判别结果;
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于GAN处理不平衡数据的线变关系识别方法,其特征在于:其包括以下步骤:S1、通过用户电量采集系统采集10kV输电线路的日输入电量以及输电线路连接的各配电变压器的日用电量,对采集到的电量数据进行数据预处理,得到日线损电量,并将配电线路线变关系分为三个类别:线路挂错线变关系、电能表倍率计错线变关系和正常线变关系,建立线变关系识别的原始数据集;S2、利用皮尔逊系数、相对变化系数、波动系数和斜率比四种参数从配电线路日线损电量、配电线路日输入电量以及各变压器日用电量中提取12个特征量,作为线变关系识别的特征集;S3、利用GAN对线变关系特征集中只占极少数的线变关系异常样本进行数据扩充,从而实现不同线变关系类别间样本数量的分布均衡,具体包括如下子步骤:S31、搭建基于GAN的线变关系异常样本的数据生成模型,该数据生产模型包括生成器模型和判别器模型,生成器模型中全连接神经网络的输入层、隐含层和输出层均设计为1层,且各层节点数分别设计为10、50和12,判别器模型设计为全连接神经网络的输入层、隐含层和输出层构成的二分类器,网络中输入层、隐含层和输出层节点数分别设计为12、50和1,数据生成模型的学习率设置为0.01,基于GAN处理线变关系数据不平衡的网络模型总的迭代次数设置为5000;S32、构建GAN模型的目标函数为:其中,V(D,G)表示GAN模型的目标函数,D(
·
)表示判别器模型的输出,E(
·
)表示期望值,D(x)表示判别器认为x是真实样本的概率,G(z)表示随机信号z是经过生成器模型G得出的合成样本,1

D(G(z))为判别器模型认为合成样本为假的概率,x~P
data
(x)指的是从真实样本分布中采样,z~P
z
(z)指的是从噪声分布P
z
(z)中采样;S33、生成器模型的损失函数设为g_loss=log(D(G(z))),判别器模型的损失函数设为:d_loss=

log(D(x))+log(1

D(G(z)));其中,G(z)表示随机信号z是经过生成器模型G得出的生成样本,x表示真实的线变关系异常样本数据,D(
·
)表示判别器模型的输出;S34、利用损失函数训练生成器与判别器模型,其具体包括以下子步骤:S341、训练过程采用生成器模型与判别器模型单独交替迭代训练,先固定生成器模型,训练判别器模型,之后固定判别器模型,训练生成器模型;S342、当训练判别器模型时,将上一轮生成器模型产生的样本数据和真实样本数据拼接在一起作为判别器模型的输入,其中假样本的标签设定为0,真样本的标签设定为1,之后通过判别器模型,生成一个概率值η,η为0到1之间的数,通过概率值η和目标值组成的损失函数,采用随机梯度下降法对判别器中神经网络的权值进行更新;S343、当训练生成器模型时,将生成器模型和判别器模型作为一个整体进行输出,输入一组随机向量,在生成器模型中生成一个样本数据,通过判别器模型对生成的样本数据进行判别得到输出结果概率值η,将概率值η与1之间的差异组成损失函数,之后采用随机梯度下降法对生成器中神经网络的权值进行更新;S344、根据步骤S342和步骤S343完成生成器模型与判别器模型的单独交替迭代训练,
当P
g
=P
data
时,即判别器模型对生成样本与真实样本输出的概率值均为0.5时,此时GAN模型的目标函数达到全局最优解,其中,P
g
表示判别器对生成样本的判别结果,P
data
表示判别器对真实的线变关系异常样本数据的判别结果;S35、使用训练好的生成器模型对线变关系特征集中只占极少数的线变关系异常样本进行数据扩充,得到与真实线变关系样本数据整体分布类似的生成样本,从而实现不同线变关系类别间样本数量的分布均衡;S4、利用经样本扩充后的线变关系特征集,构建支持向量机分类模型,通过支持向量机分类模型的核函数选择、惩罚参数和核函数系数寻优,得到优化后的线变关系分类模型,从而实现线变关系的识别。2.根据权利要求1所述的基于GAN处理不平衡数据的线变关系识别方法,其特征在于:步骤S2具体包括以下步骤:S21、利用皮尔逊系数定义两种类型的电力数据之间的相关程度,其计算公式为:其中,r为皮尔逊相关系数,其值介于

1至1之间,|r|越接近1,则表明线性相关程度越高;y
i
代表10kV线路的第i日输入电量或线损电量,代表10kV线路的输入电量或线损电量的平均值;x
i
代表与线路相连的每个配电变压器的第i日用电量,代表与线路相连的每个配电变压器用电量的平均值;n代表天数,将10kV线路的输入电量与每个配电变压器的用电量之间的皮尔逊系数定义为r
s
;将10kV线路的线损电量与每个变压器的用电量之间的皮尔逊系数定义为r
l
;S22、利用相对离散系数计算两个离散系数的比值,其计算公式为:S22、利用相对离散系数计算两个离散系数的比值,其计算公式为:其中,c
s
代表10kV线路输入电量时间序列的离散系数;c
l
代表10kV线路线损电量时间序列的离散系数;c
c
表示该线路下每个配电变压器的用电量时间序列的离散系数;σ代表标准差;μ代表平均值;C
cs
表示每个配电变压器的用电量与10kV线路的输入电量之间的相对离散系数;C
cl

【专利技术属性】
技术研发人员:郭金智王燕朱正甲皇甫成范荻汪鸿陈建华秦亮刘开培张心语
申请(专利权)人:国网冀北电力有限公司国家电网有限公司武汉大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1