【技术实现步骤摘要】
一种基于堆叠稀疏自编码器和深度森林的窃电检测方法
[0001]本专利技术属于非技术性线损降损领域,特别涉及一种基于堆叠稀疏自编码器和深度森林的窃电检测方法
技术介绍
[0002]电网运行中的实际线损分为两部分,分别是技术线损和非技术线损。技术线损主要由线路和变压器的损耗组成,非技术线损也称管理线损,主要由用户窃电造成。国家电网因用户窃电造成的线损能达到总线损的6%,这严重影响了电网的经济运行。此外,非技术线损还会影响电网运行参数的测算,从而危害电网运行稳定性。为此,有必要采取相关措施对窃电用户进行识别,从而降低非技术性线损。
[0003]关于窃电检测问题的研究主要包括高维数据的处理、类不平衡问题的处理和异常识别模型改进。其中,高维数据容易会导致“维数诅咒”,从而严重影响检测模型的准确率。通常对于高维数据的处理多采用为对数据进行降维,但过度降维会导致用户用电量信息丢失严重,因此如何在降维的同时尽可能多的保留用户用电量信息便是解决问题的关键所在。而传统的处理高维数据的思路,例如机器学习算法、支持向量机、决策树及集成树模型 ...
【技术保护点】
【技术特征摘要】
1.一种基于堆叠稀疏自编码器和深度森林的窃电检测方法,其特征在于,包括以下步骤:S1:从智能配用电数据库中提取用户用电量数据,构建用户用电量特征数据集;S2:根据一定比例将用户用电量特征数据集划分为训练集和测试集;S3:将训练集作为窃电检测模型输入,对窃电检测模型进行训练;S4:利用测试集对步骤S3训练得到的窃电检测模型进行测试,根据测试结果构建混淆矩阵;S5:分别使用准确率、召回率和F1分数对窃电检测模型的测试结果进行评估。2.根据权利要求1所述的基于堆叠稀疏自编码器和深度森林的窃电检测方法,其特征在于,所述S2中,将用户用电量特征数据集根据比例7:3划分为训练集和测试集。3.根据权利要求1所述的基于堆叠稀疏自编码器和深度森林的窃电检测方法,其特征在于,所述S3中的窃电模型包括堆叠稀疏自编码器和深度森林模型,且堆叠稀疏自编码器的输出为深度森林模型的输入,其中,所述堆叠稀疏自编码器由多个稀疏自编码器堆叠而成,且每一层稀疏自编码器的损失函数L如公式(1)所示:其中,x
i
为第i个真实的用户用电特征向量,为第i个用户经过单层稀疏自编码器重建后的特征向量,m为输入的用户个数,β为常数因子,Ω
sparse
为稀疏限制项,如公式(2)所示:式(2)中,KL表示KL散度,ρ为趋近于零的常数,S
m
为各层稀疏自编码器中隐藏层神经元个数,ρ
j
为第j个神经元的激活程度,如公式(3)所示:式(3)中,为第j个神经元对第i个用户用电特征向量进行编码后的向量。4.根据权利要求3所述的基于堆叠稀疏自编码器和深度森林的窃电检测方法,其特征在于,所述堆叠稀疏自编码器通过构建目标函数确定堆叠稀疏自编码器的层数,其中,目标函数如式(4)所示:其中,E
SSAE
为堆叠稀疏自编码器的总体重建误差,L
u
为第u层稀疏自编码器的重建误差,M为堆叠稀疏自编码器的层数。5.根据权利要求3所述的基于堆叠稀疏自编码器和深度森林的窃电检测方法,其特征在于,所述深度森林模型包括多粒度特征扫描模块和级联森林模块,且所述堆叠稀疏自编码器的输出为多粒度特征扫描模块的输入,所述多粒度特征扫描模块的输出为级联森林模块的输入。
6.根据权利要求5所述的基于堆叠稀疏自编码器和深度森林的窃电检测方法,其特征在于,所述S3中窃电检测模型的具体训练步骤如下:S3
‑
1:采用堆叠稀疏自编码器对训练集中的用户用电特征向量进行特征提取,将用户用电特征向量作为堆叠稀疏自编码器中第一层稀疏自编码器的输入,将第一层稀疏自编码器的隐藏层输出特征向量作为第二层稀疏自编码器的输入,依次类推,不断对稀疏自编码器的隐藏层的输出特征向量进行压缩,直至公式(4)所示的目标函数的值小于总体重建误差阈值,从而输出最能代表用户用电模式的特征向量h;S3
‑
2:采用深度森林算法的多颗粒度特征扫描模块对步骤S3
‑
1输出的特征向量h进行扫描,实现用户特征的多精度提取;S3
‑
3:采用深度森林算法的级联森林模块实现用户特征的深度融合与窃电行为的识别。7.根据权利要求6所述的基于堆叠稀疏自编码器和深度森林的窃电检测方法,其特征在于,所述S3
‑
2中多颗粒度特征扫描模块实现用户特征的多精度提取的具体方法如下:所述多粒度特征扫描模块包括两个通道,每个通道均分别由随机森林和完全随机森林进行特征提取,设特征提取所用滑动向量维度为d,滑动步长为s,一个用户的特征向量h,其维度为h
dim
,则经过单粒度特征扫描后得到q个长度为d的向量,q的计算公式如公式(5)所示:将q个向量输入到完全随机森林和随机森林,均可得到q个2维向量,将2q个2维向量进行纵向拼接,即可得到一个长度4q的向量;同理,保持滑动向量维度不变,设置滑动步长矩阵为S=[s1,s2,s3...s
l
],滑动向量以多个步长实现对单个用户用电特征向量的多粒度特征扫描,具体为...
【专利技术属性】
技术研发人员:付慧,史明明,李双伟,费骏韬,喻建瑜,陈静,郑仙,王靓,
申请(专利权)人:国网江苏省电力有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。