System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于大数据分析的窃电用户识别方法、系统及存储介质技术方案_技高网

基于大数据分析的窃电用户识别方法、系统及存储介质技术方案

技术编号:40428221 阅读:6 留言:0更新日期:2024-02-20 22:49
本发明专利技术公开了基于大数据分析的窃电用户识别方法、系统及存储介质,包括步骤:预处理获取的用户历史用电数据,得到分析数据集;根据分析数据集中的数据判断用户是否存在不平衡用电,若存在,则定位存在不平衡用电的日期前后一段时间作为目标空间,获取用户在目标空间内的用电量和线损数据并计算电量差值权重指数;根据电量差值权重指数判断用户是否存在窃电行为。对数据进行预处理,填补数据的缺失部分,得到完整的历史用电数据,并根据能量守恒定律分析用户是否存在不平衡用电,若存在则说明用户很有可能存在窃电行为,再利用电量差值权重的分析方法判断用户是否真的存在窃电行为,数据来源较为简单,能够快速判定用户是否存在异常用电。

【技术实现步骤摘要】

本专利技术涉及电力用户数据分析领域,具体涉及基于大数据分析的窃电用户识别方法、系统及存储介质


技术介绍

1、为了保证电网的安全运行,需要对用户的用电情况进行分析和管控,而电网中的用户数以亿计,每天都会产生海量的用电数据,而基于海量历史用电数据去分析用户是否存在窃电行为,维护电网安全运行至关重要。目前研究针对专变海量电压、电量、功率历史数据的异常检测算法有很多,为了区分用电数据之间不同的特征,可以针对性采用anova、iqr、孤立森林等异常检测算法,对数据完整性、有效性进行检测及准确识别。这些方法都需要依托电力系统采集的历史用电数据,其可靠性直接关系到最终异常检测的准确性。但是历史用电数据由于各种原因通常会出现缺失、异常等问题,可能是采集设备不稳定等非人为原因、系统故障跳台等非人为原因,也可能是现场工作人员在记录时失误等人为原因。因此,有必要对历史用电数据进行预并且还需要及时、准确检测到用户的异常用电行为。


技术实现思路

1、本专利技术的目的在于提供基于大数据分析的窃电用户识别方法、系统及存储介质,对从电力系统获取到的用户历史用电数据进行预处理,填补数据的缺失部分,得到完整的历史用电数据,并根据能量守恒定律分析用户是否存在不平衡用电,若存在则说明用户很有可能存在窃电行为,再利用电量差值权重的分析方法判断用户是否真的存在窃电行为,通过评估用户用电量时序数据和线损差异时序数据的权重差异关系,能够在连续时间序列上实现异常值的不间断识别,且数据来源较为简单,能够快速判定用户是否存在异常用电

2、一方面,本申请提供基于大数据分析的窃电用户识别方法,包括以下步骤:

3、s1、从电力系统获取用户历史用电数据,对用户历史用电数据进行数据预处理,得到分析数据集;

4、s2、根据分析数据集中的数据判断用户是否存在不平衡用电,若存在,则定位存在不平衡用电的日期;

5、s3、将不平衡用电日期前后一段时间作为目标空间,获取用户在目标空间内的用电量和线损数据;

6、s4、根据用户在目标空间内的用电量和线损数据计算电量差值权重指数;根据电量差值权重指数判断用户是否存在窃电行为。

7、进一步地,数据预处理的过程包括:

8、将用户历史用电数据存入分析数据集中;

9、对分析数据集中的数据进行数据清洗,筛选出数据缺失部分;

10、利用数据插值法填补数据缺失部分,并覆盖分析数据集中得数据缺失部分。

11、进一步地,数据插值法包括水平法和垂直法,

12、计算与数据缺失部分对应时刻的前后两个时刻的数据差值是否大于阈值,若否则采用水平法利用前后两个时刻的数据填补数据缺失部分;

13、若是,则根据数据缺失部分对应的时刻和日期,获取前后相邻日期中与数据缺失部分对应相同时刻下的用电数据,并利用垂直法填充数据缺失部分。

14、进一步地,判断用户是否存在不平衡用电的过程包括:

15、所述用户历史用电数据包括采用三相三线制接线的电流和电压;

16、获取两相电压互感器和两相电流互感器对应的电流和电压,根据两相的电流和电压计算实际功率;

17、分别计算三相各相电压和各相电流的有效值和相位;

18、根据三相各相电流的有效值、各相电压有效值和各相位计算基准电流、基准电压和基准相位,并根据基准电流、基准电压和基准相位计算基准功率;

19、比较基准功率和实际功率的偏差度,判断用户是否存在不平衡用电。

20、进一步地,比较基准功率和实际功率的偏差度的过程为:

21、将各相位和基准相位相比较,得到相位偏差;

22、将各相电压的有效值分别和基准电压的幅值相比较,计算各相电压的幅值偏差;

23、将各相电流的有效值和基准电流的幅值相比较,计算各相电流的幅值偏差;

24、综合相位偏差、各相电压的幅值偏差和各相电流的幅值偏差,得到用户不平衡用电程度;

25、将用户不平衡用电程度和预设阈值比较,若超过预设阈值,则用户存在不平衡用电。

26、进一步地,电量差值权重指数的计算过程为:

27、s41、计算在目标空间内当日和相邻的前一日的用电量差值和线损差值;

28、s42、求用电量差值与线损差值的比值,得到电量差值权重指数w,存入第一数据集k中;

29、s43、对目标空间内每日的用电量和线损数据均执行步骤s41-s42。

30、进一步地,判断用户是否存在窃电行为的过程为:

31、遍历第一数据集k中的数据,查找是否存在电量差值权重指数为负值,若存在,则判断该电量差值权重指数对应的当日存在窃电行为。

32、另一方面,本申请提供基于大数据分析的窃电用户识别系统,包括:

33、数据预处理模块,用于从电力系统获取用户历史用电数据,对用户历史用电数据进行数据预处理,得到分析数据集;

34、不平衡用电分析模块,用于根据分析数据集中的数据判断用户是否存在不平衡用电,若存在,则定位存在不平衡用电的日期;

35、目标空间获取模块,用于将不平衡用电日期前后一段时间作为目标空间,获取用户在目标空间内的用电量和线损数据;

36、窃电分析模块,用于根据用户在目标空间内的用电量和线损数据计算电量差值权重指数;根据电量差值权重指数判断用户是否存在窃电行为。

37、第三方面,本申请提供一种计算机可读存储介质,包括:

38、存储单元,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,能使得所述一个或多个处理器实现第一方面的基于大数据分析的窃电用户识别方法。

39、本专利技术具有的有益效果:

40、本申请为了保证对用户的用电数据进行分析时出现数据缺失的情况,对用户进行是否存在窃电行为判定前先利用数据插值的方法补齐数据缺失部分,再对用户初步判断是否存在不平衡用电,如存在很有可能存在窃电行为,再利用电量差值权重的分析方法判断用户是否真的存在窃电行为,由于数据差值权重的分析方法需要连续数据,在数据预处理时已补齐用户数据,可以通过评估用户用电量时序数据和线损差异时序数据的权重差异关系,能够在连续时间序列上实现异常值的不间断识别,且数据来源较为简单,能够快速判定用电差异特征。电量差值权重分析方法以用户用电量、线损时间序列数据为基础,按日为单位实现疑似窃电数据判断,实现及时、准确地将符合数据特征的窃电行为消灭在萌芽状态,无需另外投入,即可大大减少因窃电减少的经济损失。

本文档来自技高网...

【技术保护点】

1.基于大数据分析的窃电用户识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于大数据分析的窃电用户识别方法,其特征在于,数据预处理的过程包括:

3.根据权利要求2所述的基于大数据分析的窃电用户识别方法,其特征在于,数据插值法包括水平法和垂直法,

4.根据权利要求1所述的基于大数据分析的窃电用户识别方法,其特征在于,判断用户是否存在不平衡用电的过程包括:

5.根据权利要求4所述的基于大数据分析的窃电用户识别方法,其特征在于,比较基准功率和实际功率的偏差度的过程为:

6.根据权利要求1所述的基于大数据分析的窃电用户识别方法,其特征在于,电量差值权重指数的计算过程为:

7.根据权利要求6所述的基于大数据分析的窃电用户识别方法,其特征在于,判断用户是否存在窃电行为的过程为:

8.基于大数据分析的窃电用户识别系统,其特征在于,包括:

9.一种计算机可读存储介质,其特征在于,包括:

【技术特征摘要】

1.基于大数据分析的窃电用户识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于大数据分析的窃电用户识别方法,其特征在于,数据预处理的过程包括:

3.根据权利要求2所述的基于大数据分析的窃电用户识别方法,其特征在于,数据插值法包括水平法和垂直法,

4.根据权利要求1所述的基于大数据分析的窃电用户识别方法,其特征在于,判断用户是否存在不平衡用电的过程包括:

5.根据权利要求4所述的基...

【专利技术属性】
技术研发人员:席少先何海英
申请(专利权)人:索安赛数据成都有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1