System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于多粒度模糊相对差的无监督窃电检测方法技术_技高网

一种基于多粒度模糊相对差的无监督窃电检测方法技术

技术编号:40483141 阅读:5 留言:0更新日期:2024-02-26 19:16
本发明专利技术公开了一种基于多粒度模糊相对差的无监督窃电检测方法,其具体检测步骤如下所示:原始数据输入;对原始数据进行预处理;构造并计算每个属性的模糊关系矩阵;构造多粒度模糊信息粒序列;计算样本的模糊相对差;计算样本的离群度;通过阈值比较判定用电数据中的异常用户。本发明专利技术提供的基于模糊粗糙集理论的异常检测方法通过构造模糊关系矩阵提取混合型数据的结构信息,从而对数值型和标称型相混合的数据进行统一表示,无需进行额外的数据格式转换,避免了重要信息的丢失;同时利用模糊相对差从多种粒度视角下刻画样本的异常程度,有效提升了混合型电力数据异常检测的准确率。

【技术实现步骤摘要】

本申请专利属于电力数据分析,具体涉及到一种基于多粒度模糊相对差的无监督窃电检测方法


技术介绍

1、窃电检测又称为异常用电检测,是一种基于电力数据的异常检测算法,旨在找出与预期用电行为或模式显著偏离的用户。在智能电网中窃电行为可能会对电网运行和电力企业经济利益造成严重影响,此外,窃电行为也可能引发电力安全隐患,给电网系统和用户安全带来潜在风险。因此,窃电检测在保障电力供应安全、促进电网可靠运行和维护电力企业的经济利益等方面具有重要意义和实用价值。

2、传统的窃电行为检测方法主要采用物理方法,包括人工巡检、线损分析、电量分析和功率因素分析等,这类方法不仅耗费巨大的人力物力,而且严重依赖专家的领域知识,难以建立通用的检测模型,无法进行大范围推广。目前窃电检测主要采用基于机器学习的方法,然而,这类方法大多只适用于数值型数据,对于标称型数据则需要进行格式转换,因而容易导致重要信息的丢失。此外,异常样本与正常样本相比通常十分稀少,人工标记往往比较困难,且存在严重的类别不平衡,因此限制了许多有监督学习检测方法的性能。


技术实现思路

1、本专利技术要解决的技术问题在于提供一种基于多粒度模糊相对差的无监督窃电检测方法,通过构造模糊关系矩阵提取混合型数据的结构信息,解决格式转换造成的信息丢失问题;并利用模糊相对差从多粒度视角下刻画样本的异常程度,有效地提升了混合型电力数据异常检测的准确率。

2、为了解决上述技术问题,本专利技术通过以下方式来实现:

3、一种基于多粒度模糊相对差的无监督窃电检测方法,其具体检测步骤如下所示:

4、s1、原始数据输入;

5、s2、对原始数据进行预处理;

6、s3、构造并计算每个属性的模糊关系矩阵;

7、s4、构造多粒度模糊信息粒序列;

8、s5、计算样本的模糊相对差;

9、s6、计算样本的离群度;

10、s7、通过阈值比较判定用电数据中的异常用户。

11、进一步的,所述步骤s1的原始数据被导入一个信息系统,其中信息系统每一行代表一个用户,每一列代表用户的一个属性;属性的取值包含数值型、标称型、混合型等类型,信息系统采用二元组(u,a)表示,其中u={x1,x2,...,xn}表示n个待检测用户组成的集合,a={a1,a2,...,am}表示m个属性组成的集合。

12、进一步的,所述步骤s2的对原始数据进行预处理,具体方法如下:

13、采用min-max法对原始数据进行归一化处理,将数值型数据的取值范围调整为[0,1]的实数,标称型数据保持不变,其预处理计算公式如下:

14、

15、其中,f(·)表示归一化函数,表示样本x在属性a上的值,va表示样本在属性a上值构成的集合。

16、所述步骤s3的构造并计算每个属性的模糊关系矩阵,具体方法如下:

17、模糊关系是指在u×u上的一个模糊集r:u×u→[0,1],对于任意(x,y)∈u×u,隶属度函数r(x,y),代表样本x与对象y具有关系r的程度,u上的模糊关系r用一个模糊矩阵m(r)来表示,任意属性a∈a可诱导产生一个模糊关系ra,其隶属度计算公式如下:

18、

19、其中,表示对象x和y在属性a上的差值,δ为模糊半径参数;对经过预处理后的数据,通过公式(2)计算得到u中任意两个样本x,y与模糊关系ra的隶属度ra(x,y),得到每个属性a的模糊关系矩阵

20、所述步骤s4的构造多粒度模糊信息粒序列,具体方法如下:

21、s41、计算每个属性对应模糊近似空间的模糊熵

22、利用任模糊关系r对全体对象u进行划分得到一个模糊粒集合u/r={[xi]r|xi∈u,a∈a},其中[xi]r=(r(xi,x1),r(xi,x2),…r(xi,xn))为一个以对象xi为中心的模糊信息粒,其模糊基数计算公式如下:

23、

24、在信息系统(u,a)中,给定任意属性a∈a生成的模糊关系ra,序偶(u,ra)称为一个模糊近似空间,在模糊近似空间的基础上,一个模糊关系ra对应的模糊近似空间(u,ra)的模糊熵计算公式如下:

25、

26、其中,表示模糊关系ra生成的以对象xi为中心的模糊信息粒,根据步骤2所生成的模糊关系矩阵,通过式(3)和式(4)可计算每个属性a对应模糊近似空间的(u,ra)模糊熵h(a)。

27、s42、构造属性子集序列

28、将属性集合a中任意属性按其模糊熵h(a)大小进行排序,使h(ak)≤h(ak+1)得到属性序列s=a′1,a′2,...,a′m,其中a′1,a′2,...,a′m为排序后的属性;

29、从属性序列s中按照每个属性模糊熵的大小顺序,逐一删除重要性最小的一个属性,直到最后得到一个只包含一个属性的集合,属性子集构成的序列ss=a1,a2,...,am,其中a1=a,am={a′m},且ak+1=ak-{a′k};

30、s43、构造多粒度模糊信息粒

31、针对任意属性子集生成的模糊关系的隶属度计算公式如下:

32、

33、对于属性子集序列ss中每一个属性子集ak生成的模糊关系构造一个模糊信息粒得到任意样本xi的多粒度模糊信息粒序列并重复该步骤计算出所有样本的多粒度模糊信息粒序列。

34、所述步骤s5的计算样本的模糊相对差,具体方法如下:

35、样本xi在模糊信息粒序列gs上任意两个相邻模糊粒与的模糊相对差为:

36、

37、通过计算每一个样本xi在序列gs中每一个属性子集ak位置上模糊相对差,得到所有样本在所有位置上的模糊相对差。

38、所述步骤s6的计算样本的离群度,具体方法如下:

39、样本xi的离群度利用模糊粒序列上的平均相对差,其计算公式如下:

40、

41、其中,w(·)表示权重映射函数,其计算公式如下:

42、

43、通过上述公式计算得到全体样本的离群度。

44、所述步骤s7的通过阈值比较判定用电数据中的异常用户,具体方法如下:

45、设置异常用户的离群度阈值为θ,若样本xi的离群度ad(xi)>θ,则判定为异常用户,将用电数据中全体样本的离群度与阈值逐一进行比较,计算出系统中的异常用户集。

46、与现有技术相比,本专利技术具有的有益效果:

47、本专利技术很好地解决传统方法因数据格式转换造成的信息丢失的问题,提供的基于模糊粗糙集理论的异常检测方法通过构造模糊关系矩阵提取混合型数据的结构信息,从而对数值型和标称型相混合的数据进行统一表示,无需进行额外的数据格式转换,避免了重要信息的丢失。同时利用模糊相对差从多种粒度视角下刻画样本的异常程度,有效提升了混合型电力数据异常检测的准确率;检测本文档来自技高网...

【技术保护点】

1.一种基于多粒度模糊相对差的无监督窃电检测方法,其特征在于:具体检测步骤如下所示:

2.根据权利要求1所述一种基于多粒度模糊相对差的无监督窃电检测方法,其特征在于:

3.根据权利要求1所述一种基于多粒度模糊相对差的无监督窃电检测方法,其特征在于:

4.根据权利要求1所述一种基于多粒度模糊相对差的无监督窃电检测方法,其特征在于:

5.根据权利要求1所述一种基于多粒度模糊相对差的无监督窃电检测方法,其特征在于:

6.根据权利要求1所述一种基于多粒度模糊相对差的无监督窃电检测方法,其特征在于:

7.根据权利要求1所述一种基于多粒度模糊相对差的无监督窃电检测方法,其特征在于:

8.根据权利要求1所述一种基于多粒度模糊相对差的无监督窃电检测方法,其特征在于:

【技术特征摘要】

1.一种基于多粒度模糊相对差的无监督窃电检测方法,其特征在于:具体检测步骤如下所示:

2.根据权利要求1所述一种基于多粒度模糊相对差的无监督窃电检测方法,其特征在于:

3.根据权利要求1所述一种基于多粒度模糊相对差的无监督窃电检测方法,其特征在于:

4.根据权利要求1所述一种基于多粒度模糊相对差的无监督窃电检测方法,其特征在于:

【专利技术属性】
技术研发人员:李琪林廖开吉袁钟彭德中
申请(专利权)人:国网四川省电力公司营销服务中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1