System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于多学习器融合的电网窃电检测方法技术_技高网

一种基于多学习器融合的电网窃电检测方法技术

技术编号:40949106 阅读:4 留言:0更新日期:2024-04-18 20:23
本发明专利技术涉及智能电网监测领域,公开了一种基于多学习器融合的电网窃电检测方法,包括:利用数据抓取技术访问营销系统,进入用电信息采集系统,查询异常用户样本与用电量,利用第一模型对异常数据进行预处理;利用预处理后的数据集输入到由categorical boosting算法、随机森林和梯度提升决策树三种机器学习算法组成的第二模型,得到所述第二模型;将第二模型所得数据输入到第三模型;根据多模型集成监测模型开展窃电监测。本发明专利技术基于多学习器融合的电网窃电检测方法提高用户窃电监测精度,缩小供需缺口,减少能源支出与发电成本,有助于控制用户违规行为,助力电力系统稳定高效运行。

【技术实现步骤摘要】

本专利技术涉及智能电网窃电监测流程自动化,尤其涉及一种基于多学习器融合的电网窃电检测方法


技术介绍

1、近几年,窃电打破了正常用电秩序,并严重影响了电网运行安全,威胁人身财产安全,由窃电导致的变压器等电力设备损坏及人身触电事故时有发生,给供电企业和社会带来较大经济损失。传统窃电用户排查主要通过对线损较高的台区进行人工逐户核查,费时费力,工作量巨大,现场核查所需人员较多,人力成本较高。且排查工作缺乏针对性,单户核查时间较长,容易出现漏报,往往需要工作人员多次去现场排查,效率较低。

2、因此,上述技术问题亟待本领域技术人员解决。


技术实现思路

1、有鉴于此,本专利技术的目的是提供一种基于多学习器融合的电网窃电检测方法,通过机器学习和深度学习构建的多模型集成的监测模型提高了窃电行为监测的精度,解决了传统窃电行为监测精度低、效率低的问题。

2、为实现上述目的,专利技术人提供了一种基于多学习器融合的电网窃电检测方法,该方法包括以下步骤:

3、利用数据抓取技术实现营销系统的登陆和访问,进入用电信息采集系统,实现用户数据自动合并、异常用户样本自动查询和标记,获取正常用电量数据和异常用电量数据,利用第一模型对所述的异常用电量数据进行数据预处理,得到预处理后的数据集;

4、利用所述的预处理后的数据集输入到由categorical boosting算法、随机森林算法以及梯度提升决策树算法三种机器学习算法组成的第二模型进行训练,得到训练后的所述第二模型以及数据;

5、将第二模型所得数据输入到基于网格搜索寻优的时间卷积网络深度学习所组成的第三模型进行训练;

6、根据经过大量数据学习训练的多模型集成的监测模型开展智能电网窃电行为监测。

7、进一步的,所述利用数据抓取技术实现营销系统的登陆和访问,进入用电信息采集系统,实现用户数据自动合并、异常用户样本自动查询和标记,获取正常用电量数据和异常用电量数据之后,还包括基于插值的数据准备、处理异常数据、归一化和平衡异常数据。

8、进一步的,第一模型为数据预处理模型,其中采用插值方法来恢复丢失的数据值,对正常用电量数据和所述异常用电量数据进行缺失值补齐处理,得到补齐后的所述正常用电量数据和所述异常用电量数据;通过计算相邻非缺失值的均值或中值来估算缺失值,插值方法检测缺失值公式如下:

9、

10、其中,xi是数据集包含的缺失值(空值)或记录值,空值是一个非数字字符,表示为nan。

11、用电记录包含大量缺失值和不完整信息,问题背后的主要原因可能是数据损坏和硬件故障,在时间序列数据分析中,不能简单地忽略缺失值,因为这些值会显着影响最终预测的性能和质量;本技术方案中是通过计算相邻非缺失值的均值或中值来估算缺失值。

12、进一步的,第一模型为数据预处理模型,包括处理异常数据,使用“three sigmarule of thumb”方法用于减少异常值和恢复数据,表达式如下所示:

13、

14、其中,x表示avg(xi)+2σ(xi),σ表示x的标准差。

15、这是因为异常值的存在会误导训练过程,需要更长的训练时间,导致模型不准确,最终结果有偏差,因此本技术方案中使用“three sigma rule of thumb”方法用于减少异常值和恢复数据。

16、进一步的,第一模型为数据预处理模型,选择max—min缩放方法根据以下等式对用电量数据进行归一化处理:

17、

18、由于对于智能电表和用电量数据集的读数,如果不同维度的特征显示差异很大或分布不太均匀的数据,模型将经过长时间的训练,其检测性能会受到影响,所以在本技术方案中需要对用电量数据进行归一化处理,具体可以选择max—min缩放方法根据以下等式对数据进行归一化。

19、进一步的,第一模型为数据预处理模型,平衡异常数据采用smote+tomek linkundersampling方法,通过在众多位于一起的少数类样本之间进行插值,综合生成少数类中的新实例,合成数据点的创建首先从s个样本中选择一个随机样本;在特征空间中,计算随机样本与其k个最近邻之间的欧氏距离,当其中一个邻居的点k向量乘以随机数a时,将创建新的合成样本,其中a的值介于0和1之间,重复此过程,直到两个类之间的分布达到平衡。

20、进一步的,第二模型machine learning分类器由categorical boosting算法、随机森林算法以及梯度提升决策树算法三种机器学习算法组成。

21、进一步的,第三模型deep learning分类器由基于网格搜索寻优的时间卷积网络所组成。时间卷积网络具有更强的函数拟合和更好的非线性计算能力,可以从大量的数据中学习到数据的关键特征和基本规律;此外,在时间序列数据分析任务中,时间卷积网络tcn在准确性和效率方面优于成熟的循环网络,如循环神经网络rnn和长短期记忆网络lstm。

22、本专利技术提供的一种基于多学习器融合的电网窃电检测方法,包括:利用数据抓取技术访问营销系统,进入用电信息采集系统,自动合并用户数据、查询异常用户样本与用电量,利用第一模型对所述异常数据进行预处理;利用所述预处理后的数据集输入到由categorical boosting算法、随机森林和梯度提升决策树三种机器学习算法组成的第二模型,得到所述第二模型;将第二模型所得数据输入到基于网格搜索寻优的时间卷积网络深度学习所组成的第三模型;根据多模型集成监测模型开展窃电监测。本专利技术基于多学习器融合的电网窃电检测方法提高监测精度,缩小供需缺口,减少能源支出与发电成本,有助于控制违规行为,助力电力系统稳定高效运行。

23、上述
技术实现思路
相关记载仅是本申请技术方案的概述,为了让本领域普通技术人员能够更清楚地了解本申请的技术方案,进而可以依据说明书的文字及附图记载的内容予以实施,并且为了让本申请的上述目的及其它目的、特征和优点能够更易于理解,以下结合本申请的具体实施方式及附图进行说明。

本文档来自技高网...

【技术保护点】

1.一种基于多学习器融合的电网窃电检测方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述的基于多学习器融合的电网窃电检测方法,其特征在于,所述利用数据抓取技术实现营销系统的登陆和访问,进入用电信息采集系统,实现用户数据自动合并、异常用户样本自动查询和标记,获取正常用电量数据和异常用电量数据之后,还包括基于插值的数据准备、处理异常数据、归一化和平衡异常数据。

3.根据权利要求2所述的基于多学习器融合的电网窃电检测方法,其特征在于,第一模型为数据预处理模型,其中采用插值方法来恢复丢失的数据值,对正常用电量数据和所述异常用电量数据进行缺失值补齐处理,得到补齐后的所述正常用电量数据和所述异常用电量数据;通过计算相邻非缺失值的均值或中值来估算缺失值,插值方法检测缺失值公式如下:

4.根据权利要求2所述的基于多学习器融合的电网窃电检测方法,其特征在于,第一模型为数据预处理模型,包括处理异常数据,使用“three sigma rule of thumb”方法用于减少异常值和恢复数据,表达式如下所示:

5.根据权利要求2所述的基于多学习器融合的电网窃电检测方法,其特征在于,第一模型为数据预处理模型,选择Max—Min缩放方法根据以下等式对用电量数据进行归一化处理:

6.根据权利要求2所述的基于多学习器融合的电网窃电检测方法,其特征在于,第一模型为数据预处理模型,平衡异常数据采用SMOTE+Tomek link undersampling方法,通过在众多位于一起的少数类样本之间进行插值,综合生成少数类中的新实例,合成数据点的创建首先从s个样本中选择一个随机样本;在特征空间中,计算随机样本与其k个最近邻之间的欧氏距离,当其中一个邻居的点k向量乘以随机数a时,将创建新的合成样本,其中a的值介于0和1之间,重复此过程,直到两个类之间的分布达到平衡。

7.根据权利要求1所述的基于多学习器融合的电网窃电检测方法,其特征在于,第二模型Machine Learning分类器由categorical boosting算法、随机森林算法以及梯度提升决策树算法三种机器学习算法组成。

8.根据权利要求1所述的基于多学习器融合的电网窃电检测方法,其特征在于,第三模型Deep Learning分类器由基于网格搜索寻优的时间卷积网络所组成。

...

【技术特征摘要】

1.一种基于多学习器融合的电网窃电检测方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述的基于多学习器融合的电网窃电检测方法,其特征在于,所述利用数据抓取技术实现营销系统的登陆和访问,进入用电信息采集系统,实现用户数据自动合并、异常用户样本自动查询和标记,获取正常用电量数据和异常用电量数据之后,还包括基于插值的数据准备、处理异常数据、归一化和平衡异常数据。

3.根据权利要求2所述的基于多学习器融合的电网窃电检测方法,其特征在于,第一模型为数据预处理模型,其中采用插值方法来恢复丢失的数据值,对正常用电量数据和所述异常用电量数据进行缺失值补齐处理,得到补齐后的所述正常用电量数据和所述异常用电量数据;通过计算相邻非缺失值的均值或中值来估算缺失值,插值方法检测缺失值公式如下:

4.根据权利要求2所述的基于多学习器融合的电网窃电检测方法,其特征在于,第一模型为数据预处理模型,包括处理异常数据,使用“three sigma rule of thumb”方法用于减少异常值和恢复数据,表达式如下所示:

5.根据权利要求2所述的基于多学习器融合的电网窃电检...

【专利技术属性】
技术研发人员:翁晓锋汤振立何敏刘芳施博君谢南满翁琴龚明烨金涛陈寅
申请(专利权)人:福建省亿力信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1