System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 窃电用户识别模型的训练方法及相关产品技术_技高网

窃电用户识别模型的训练方法及相关产品技术

技术编号:41288207 阅读:3 留言:0更新日期:2024-05-11 09:37
本公开公开了一种窃电用户识别模型的训练方法及相关产品,训练方法包括获取在第一时序数据周期内对目标用电区域进行数据采集得到的多个用电时序数据集,每个用电时序数据集包括目标用电区域的日线损时序数据及其内一个用户的用户日电量时序数据,与多个用电时序数据集对应的多个用户中包括已标注用户类别的窃电用户和未窃电用户。用自动化特征提取方法对每个用电时序数据集中的上述两个时序数据进行特征提取及相关性分析,得到用户日电量时序特征、日线损时序特征和相关性特征;以每个用电时序数据集中的上述三个特征为一个特征样本,利用多个特征样本进行模型训练,得到窃电用户识别模型。本方案的识别准确度更高。

【技术实现步骤摘要】

本公开一般涉及电力系统。更具体地,本公开涉及一种窃电用户识别模型的训练方法、使用窃电用户识别模型进行窃电用户识别的方法、处理设备及计算机可读存储介质。


技术介绍

1、随着社会的快速发展,用电量需求不断增长,窃电问题层出不穷,窃电方式由传统的私自拉接线向高科技窃电方式转变,手段日益隐蔽。窃电问题的存在给国家带来较严重损失,同时窃电带来的安全隐患也时有发生,因此高效治理窃电问题是国网重点关注的事项。

2、目前较为常用的窃电用户的检查方法为传统的全面拉网式稽查方法,该种检查方法耗费大量人力财力,时效性差,难以解决实际问题。

3、近年来随着大数据的不断发展,电网用电信息采集系统积累了丰富的用户用电数据信息,为窃电问题研究提供了数据基础。利用机器学习方法对电力数据智能分析,可及时精准地识别可疑窃电用户是当前有效支撑反窃稽查工作的重要研究方向。

4、现有的窃电用户识别方法一是通过计算指标并根据阈值筛选的规则方法;二是通过台区下各用户电量和台区总电量建回归,估计表计运行误差的方法。

5、然而,上述规则方法中采用的指标计算较为单一,阈值设定合理性难以保障;另一方面覆盖面窄,规则具有片面性;此外,规则方法的窃电识别准确率较低,实用性不强。基于回归算法的表计运行误差估计方法易受噪声数据影响,此外运行误差的估计精准度难以达到理想水平,从而识别疑似窃电用户的能力较低。

6、有鉴于此,亟需提供一种窃电用户识别模型的训练方法、使用窃电用户识别模型进行窃电用户识别的方法、处理设备及计算机可读存储介质,其识别准确度更高。


技术实现思路

1、为了至少解决如上所提到的一个或多个技术问题,本公开在多个方面中提出了窃电用户识别模型的训练方法、使用窃电用户识别模型进行窃电用户识别的方法、处理设备及计算机可读存储介质。

2、在第一方面中,本公开提供一种窃电用户识别模型的训练方法,包括:获取在第一时序数据周期内对第一目标用电区域进行数据采集得到的多个第一用电时序数据集,其中,每个所述第一用电时序数据集中包括所述第一目标用电区域的日线损时序数据以及所述第一目标用电区域内的一个用户的用户日电量时序数据,与多个所述第一用电时序数据集所对应的多个用户中包括窃电用户和未窃电用户,并且所述用户已标注用于指示其为窃电用户或未窃电用户的用户类别;针对每个第一用电时序数据集中的用户日电量时序数据和日线损时序数据,采用自动化特征提取方法对其进行特征提取,得到对应用户的用户日电量时序特征和日线损时序特征;对每个所述第一用电时序数据集中的用户日电量时序数据和日线损时序数据进行相关性分析,得到对应用户的用户日电量与日线损的相关性特征;以及以每个第一用电时序数据集中提取的用户日电量时序特征、日线损时序特征以及对应的相关性特征作为一个特征样本,利用由多个第一用电时序数据集形成的多个特征样本进行模型训练,得到用于识别窃电用户的窃电用户识别模型。

3、在一个实施例中,采用自动化特征提取方法对其进行特征提取之后,进行模型训练之前,所述方法还包括:对于从每个第一用电时序数据集中提取的用户日电量时序特征和日线损时序特征,分别去除其中的低方差特征,以便利用去除低方差特征后的剩余用户日电量时序特征和剩余日线损时序特征形成的特征样本来进行模型训练。

4、在一个实施例中,对于从每个第一用电时序数据集中提取的用户日电量时序特征和日线损时序特征,分别去除其中的低方差特征包括:对于从每个第一用电时序数据集中提取的用户日电量时序特征和日线损时序特征,分别采用方差选择法去除其中的低方差特征。

5、在一个实施例中,对所述第一用电时序数据集中的用户日电量时序数据和日线损时序数据进行相关性分析包括:基于预设的滑窗窗口的长度对所述第一用电时序数据集中的用户日电量时序数据和日线损时序数据执行多次滑窗操作,以确定每次滑窗所对应的用户日电量数据和日线损数据;根据每次滑窗所对应的用户日电量数据和日线损数据,计算每次滑窗时的用户日电量平均值以及每次滑窗时的日线损平均值;以及根据所述每次滑窗所对应的用户日电量数据、每次滑窗所对应的日线损数据、滑窗的次数、每次滑窗时的用户日电量平均值以及每次滑窗时的日线损平均值,确定对应用户的用户日电量与日线损的相关性特征。

6、在一个实施例中,所述窃电用户识别模型通过初级模型和次级模型训练得到,并且利用由多个第一用电时序数据集形成的多个特征样本进行模型训练包括:将所述多个特征样本进行数据划分,以至少形成训练集和验证集;利用所述训练集对初级模型进行训练,得到所述窃电用户识别模型的初级学习器,其中所述初级学习器为集成树模型;利用所述初级学习器对所述验证集进行预测,得到第一预测结果,其中所述第一预测结果为所述集成树模型中多棵树叶子结点独热编码结果;以及将所述第一预测结果作为训练集对次级模型进行训练,得到所述窃电用户识别模型的次级学习器。

7、在一个实施例中,将所述多个特征样本进行数据划分,以至少形成训练集和验证集包括:将所述多个特征样本进行数据划分,以形成训练集、验证集和测试集;所述训练方法还包括:利用所述初级学习器对所述测试集进行预测,得到第二预测结果,其中所述第二预测结果为所述集成树模型中多棵树叶子结点独热编码结果;利用所述次级学习器对所述第二预测结果进行分类预测,得到第三预测结果;根据所述第三预测结果和所述测试集的各特征样本中用户的用户类别确定马修斯相关系数;以及基于所述马修斯相关系数确定所述窃电用户识别模型的模型评估结果。

8、在一个实施例中,所述初级学习器包括三个子模型,并且利用所述初级学习器对所述验证集进行预测,得到第一预测结果包括:根据所述三个子模型对所述验证集进行预测,得到对应的三个第一预测子结果,以将所述三个第一预测子结果共同作为所述第一预测结果;利用所述初级学习器对所述测试集进行预测,得到第二预测结果包括:根据所述三个子模型对所述测试集进行预测,得到对应的三个第二预测子结果,以将所述三个第二预测子结果共同作为所述第二预测结果。

9、在第二方面中,本公开还提供一种使用窃电用户识别模型进行窃电用户识别的方法,其中所述窃电用户识别模型已按照前述第一方面中任一实施例所述的训练方法进行训练,并且所述方法包括:获取在第二时序数据周期内对第二目标用电区域内进行数据采集得到的第二用电时序数据集,其中所述第二用电时序数据集中包括所述第二目标用电区域的日线损时序数据以及所述第二目标用电区域内的待识别用户的用户日电量时序数据;采用自动化特征提取方法分别对所述用户日电量时序数据和日线损时序数据进行特征提取,以得到与所述待识别用户对应的用户日电量时序特征和日线损时序特征;对所述用户日电量时序数据和日线损时序数据进行相关性分析,得到待识别用户的用户日电量与日线损的相关性特征;以及将与所述待识别用户对应的用户日电量时序特征、日线损时序特征以及待识别用户的用户日电量与日线损的相关性特征输入到所述窃电用户识别模型来进行用户识别,以确定所述待识别用户是否为窃电用户。本文档来自技高网...

【技术保护点】

1.一种窃电用户识别模型的训练方法,包括:

2.根据权利要求1所述的训练方法,其中采用自动化特征提取方法对其进行特征提取之后,进行模型训练之前,所述方法还包括:

3.根据权利要求2所述的训练方法,其中对于从每个第一用电时序数据集中提取的用户日电量时序特征和日线损时序特征,分别去除其中的低方差特征包括:

4.根据权利要求1所述的训练方法,其中对所述第一用电时序数据集中的用户日电量时序数据和日线损时序数据进行相关性分析包括:

5.根据权利要求1所述的训练方法,其中所述窃电用户识别模型通过初级模型和次级模型训练得到,并且利用由多个第一用电时序数据集形成的多个特征样本进行模型训练包括:

6.根据权利要求5所述的训练方法,其中将所述多个特征样本进行数据划分,以至少形成训练集和验证集包括:将所述多个特征样本进行数据划分,以形成训练集、验证集和测试集;所述训练方法还包括:

7.根据权利要求6所述的训练方法,其中所述初级学习器包括三个子模型,并且利用所述初级学习器对所述验证集进行预测,得到第一预测结果包括:

8.一种使用窃电用户识别模型进行窃电用户识别的方法,其中所述窃电用户识别模型已按照权利要求1-7中任一项所述的训练方法进行训练,并且所述方法包括:

9.一种处理设备,包括:

10.一种计算机可读存储介质,其特征在于,其中存储有程序指令,当所述程序指令由处理器加载并执行时,使得所述处理器执行根据权利要求1至7中任一项所述的窃电用户识别模型的训练方法或执行根据权利要求8所述的窃电用户识别的方法。

...

【技术特征摘要】

1.一种窃电用户识别模型的训练方法,包括:

2.根据权利要求1所述的训练方法,其中采用自动化特征提取方法对其进行特征提取之后,进行模型训练之前,所述方法还包括:

3.根据权利要求2所述的训练方法,其中对于从每个第一用电时序数据集中提取的用户日电量时序特征和日线损时序特征,分别去除其中的低方差特征包括:

4.根据权利要求1所述的训练方法,其中对所述第一用电时序数据集中的用户日电量时序数据和日线损时序数据进行相关性分析包括:

5.根据权利要求1所述的训练方法,其中所述窃电用户识别模型通过初级模型和次级模型训练得到,并且利用由多个第一用电时序数据集形成的多个特征样本进行模型训练包括:

6.根据权利要求5所述的训练方法,其中将所述多个特征样本进...

【专利技术属性】
技术研发人员:井友鼎邓攀陈小燕黄加军李娟娟
申请(专利权)人:河南合众伟奇云智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1