System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于数据驱动的用户窃电检测方法技术_技高网

一种基于数据驱动的用户窃电检测方法技术

技术编号:43289838 阅读:20 留言:0更新日期:2024-11-12 16:10
本发明专利技术提供了一种基于数据驱动的用户窃电检测方法,包括以下步骤:步骤1:通过用电信息采集系统,获取某台区的n个用户的用电数据,得到每天96点功率曲线的负荷数据,并进行数据预处理;步骤2:采用格拉姆角场GASF将预处理过的离散点数据转换为二阶矩阵,提取数据特征;步骤3:采用主成分分析法将格拉姆角场GASF矩阵降维,得到数据特征矩阵;步骤4:运用K‑means聚类方法将降维后的数据特征矩阵进行分类,得到聚类中心序列;步骤5:采用皮尔逊相关系数计算聚类中心序列的相似度,设定阈值判断异常用户。应用本技术方案可提高用电异常识别的准确度,并降低漏检率。

【技术实现步骤摘要】

本专利技术涉及电能计量与采集,特别是一种基于数据驱动的用户窃电检测方法


技术介绍

1、随着用电信息采集系统的发展与完善,逐渐庞大的用户数据使得基于数据驱动的用户窃电检测成为了研究热点。及时发现用户窃电行为,就能提前采取相关的措施降低损失。目前,基于数据驱动的用户窃电检测方法主要有:

2、(1)基于聚类的窃电检测。根据用户用电数据(电压、电流、功率因数、用电量和线损率等)来获取表征用户用电行为的特征指标,采用无监督的方式对用户用电特征指标进行聚类,找出偏离正常用户聚类簇的异常用户。但是,传统聚类方法容易受到噪声影响,准确度较低。

3、(2)基于分类的窃电检测。采用决策树、支持向量机和深度学习等有监督的方式对已知类别标签的样本进行训练,构建用电异常行为辨识模型,实现对用电异常用户的检测。但是采用分类的窃电检测方法训练成本较高、数据量要求较大,而且通常情况下带有窃电标签的样本远少于正常用电样本,导致漏检率较高。

4、(3)基于状态估计的窃电检测。采用状态估计的方式根据其他节点的量测值(各节点的节点电压和注入功率等状态量)估计目标用户的状态量,从而进行基于配电网状态估计的窃电检测。但是基于状态估计的窃电检测除要求掌握详细的网络拓扑结构和参数外,还要求线变户表关系正确、与实际系统严格一致,工程应用中局限性较强,成本较高。


技术实现思路

1、有鉴于此,本专利技术的目的在于提供一种基于数据驱动的用户窃电检测方法,实现提高用电异常识别的准确度,并降低漏检率,同时具有较低的计算成本。

2、为实现上述目的,本专利技术采用如下技术方案:一种基于数据驱动的用户窃电检测方法,包括以下步骤:

3、步骤1:通过用电信息采集系统,获取某台区的所有用户的用电数据,得到每天96点功率曲线的负荷数据,并进行数据预处理;

4、步骤2:采用格拉姆角场gasf将预处理过的离散点数据转换为二阶矩阵,提取数据特征;

5、步骤3:采用主成分分析法将格拉姆角场gasf矩阵降维,得到数据特征矩阵;

6、步骤4:运用k-means聚类方法将降维后的数据特征矩阵进行分类,得到聚类中心序列;

7、步骤5:采用皮尔逊相关系数计算聚类中心序列的相似度,设定阈值判断异常用户。

8、在一较佳的实施例中,步骤1所述数据预处理方法具体为:对于数据缺失量不超过20%的用户负荷数据,用插值法补全每天96个点的负荷数据:

9、

10、式中,为第t天第i个负荷数据,为第t天第i+1个负荷数据,为第t天第i-1个负荷数据,表示补充的数据,φ表示空集;如存在不满足以上条件点集,则该天所有负荷数据剔除。

11、在一较佳的实施例中,所述步骤2具体包括:

12、步骤21:对于每一个用户,依据补全完整的负荷数据,将第t天长度为96的日负荷序列归一化到区间[-1,1],构成新负荷序列其中有:

13、

14、式中,max(xt)为xt负荷序列中最大负荷值;min(xt)为xt负荷序列中最小负荷值;

15、步骤22:将归一化后的负荷序列转换到极坐标系,将负荷数值对应夹角余弦值,时间戳对应半径,即:

16、

17、式中,ti为点的时间戳,n=96是一条负荷序列中所包含的所有时间点的数量;其中,极轴ri保留原序列时间上的关系;极角保留原序列数值上的关系;

18、步骤23:采用两角和的余弦函数表示不同时间间隔内负荷数据的相关性,将第t天的离散负荷数据转换为二阶矩阵gt:

19、

20、在一较佳的实施例中,所述步骤3具体包括:

21、步骤31:将二阶矩阵gt表示为n×n阶矩阵x,

22、

23、根据相关系数公式rij=cov(xi,xj),计算相关系数,即:

24、将相关系数表示为协方差矩阵r,

25、

26、步骤32:对协方差矩阵r进行特征分解,求出协方差矩阵的特征值λ和对应的特征向量υ,即rυ=λυ;

27、步骤33:计算各个主成分的贡献率以及累计贡献率,并选取前z个主成分使累计贡献率大于90%;将特征向量按对应特征值从大到小排列,取前z列组成矩阵w,即n×z阶矩阵;其中,各个主成分的贡献率pi为:

28、

29、累计贡献率s(pz)为

30、

31、步骤34:最后计算降到z维后的数据特征矩阵,即n×z阶矩阵。

32、在一较佳的实施例中,所述步骤4具体包括:

33、步骤41:将步骤3所得主成分数据构成数据集,在所述数据集中选取k个对象为初始聚类中心;

34、步骤42:计算所述数据集中其余数据点与各初始聚类中心的欧式距离;

35、步骤43:依据欧式距离将数据点归属于距离最近的聚类中心所代表的簇中;

36、步骤44:计算每个簇中对象的平均值,更新类簇中心;

37、循环步骤42到步骤44直到每个聚类不再发生变化为止,最终得到聚类中心序列:

38、c={c1,c2,...,ck} (12)

39、式中,ci是每个聚类中心序列。

40、在一较佳的实施例中,所述步骤5具体包括:采用皮尔逊相关系数计算各个用户每日聚类中心序列c的相似度ρ,当ρ低于相似度经验值η时,即ρ<η时认为用户用电异常。

41、与现有技术相比,本专利技术具有以下有益效果:

42、1、提出一种基于数据驱动的用户窃电检测方法,能够从用户档案离散点数据中提取出反差较大的特征,提高用电异常识别的准确度,并降低漏检率。

43、2、本专利技术所提出的基于数据驱动的用户窃电检测方法所采用的的格拉姆角场法、主成分分析法和聚类方法具有简单高效、应用成本低的特点。

本文档来自技高网...

【技术保护点】

1.一种基于数据驱动的用户窃电检测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于数据驱动的用户窃电检测方法,其特征在于,步骤1所述数据预处理方法具体为:对于数据缺失量不超过20%的用户负荷数据,用插值法补全每天96个点的负荷数据:

3.根据权利要求1所述的一种基于数据驱动的用户窃电检测方法,其特征在于,所述步骤2具体包括:

4.根据权利要求1所述的一种基于数据驱动的用户窃电检测方法,其特征在于,所述步骤3具体包括:

5.根据权利要求1所述的一种基于数据驱动的用户窃电检测方法,其特征在于,所述步骤4具体包括:

6.根据权利要求1所述的一种基于数据驱动的用户窃电检测方法,其特征在于,所述步骤5具体包括:采用皮尔逊相关系数计算各个用户每日聚类中心序列C的相似度ρ,当ρ低于相似度经验值η时,即ρ<η时认为用户用电异常。

【技术特征摘要】

1.一种基于数据驱动的用户窃电检测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于数据驱动的用户窃电检测方法,其特征在于,步骤1所述数据预处理方法具体为:对于数据缺失量不超过20%的用户负荷数据,用插值法补全每天96个点的负荷数据:

3.根据权利要求1所述的一种基于数据驱动的用户窃电检测方法,其特征在于,所述步骤2具体包括:

4.根据权利要求1...

【专利技术属性】
技术研发人员:王雅平江荣鑫高琛林华夏桃芳丁忠安詹世安鄢盛腾林峰戴蓉林胤戎黄华峰林炜晖陈伟寅
申请(专利权)人:国网福建省电力有限公司营销服务中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1