一种基于大数据分析的台区异常户变关系识别方法技术

技术编号:26379610 阅读:120 留言:0更新日期:2020-11-19 23:48
一种基于大数据分析的台区异常户变关系识别方法,该方法利用现有线损及台区用户用电量数据,利用台区线损波动与异常户变关系之间的联系,通过对数据进行拆解,筛选台区日期、用户用电增量,计算用户用电量增量对台区线损增量的影响系数,识别台区异常户变关系,摒除人工识别人力成本及添加专属识别设备成本的弊端,提高了识别准确率、效率。

【技术实现步骤摘要】
一种基于大数据分析的台区异常户变关系识别方法
本专利技术涉及变压器台区户变关系识别
,具体地说是一种基于大数据分析的台区异常户变关系识别方法。
技术介绍
台区(指一台变压器的供电范围或区域,文本所述方法针对公变台区,文中所述台区均指公变台区,下文中不再进行特别描述)线损是在电能传输和营销过程中自台区配变出线起,至用户电能表止所产生的电能损耗和损失(台区线损=台区总供电量-台区总用电量)户变关系指的是变压器(台区)和用户电表的连接关系,台区户变关系的正确性是实现台区线损准确计算分析的前提。近年由于城市的快速发展,以及历史电网管理遗留的问题,配电网管理仍存在亟需改进之处。其中,户变关系对配电网管理影响较大,影响包括停电通知到户、台区同期线损、设备管理、业扩等大量营销业务。户变关系的准确核查有助于治理台区线损异常,提高用电负荷精细化管理水平。户变关系的判别一直以来都是各供电企业台区线损管理的一大难题。传统台区停电方法虽然可以逐一排查停电台区变压器和户表的对应关系,但是为保证用户供电可靠性,全面停电排查方法无法实施。国内有供电企业采用台区识别仪通过载波通讯方式识别台区,但是需要在线路上加装集中器和采集器等硬件,全面开展受成本条件限制。目前,户变关系准确性已达到较高水平。考虑到剩下的户变关系异常用户数量相对不多且用电行为较隐蔽,再使用人工或通过加装设备进行排查,需花费大量的时间、人力和资金成本,投入产出比极低。
技术实现思路
本专利技术实施例提供了一种基于大数据分析的台区异常户变关系识别方法,用于解决现有技术中识别台区异常户变关系人力物力的成本以及耗时高、效率低的问题。为了解决上述技术问题,本专利技术实施例公开了如下技术方案:一种基于大数据分析的台区异常户变关系识别方法,该方法包括以下步骤:选取最少一年的台区日总用电量、日线损、日抄表成功率数据,并对数据拆分成多个数据集合;计算台区线损日增量、总用电量日增量,生成集合Aj;对多个数据集合进行日期筛选,生成线损增量集合Sj;分别计算线损增量集合中线损增量的离散系数,生成集合CV;对集合CV做聚类操作,选择聚类中心大的一类cv对应的集合形成集合DV,与DV相对应的集合A、S筛选出的集合AV=[A1,Λ,Av],集合SV=[S1,Λ,Sv](v=1...v,v<=i/di);对集合DV的用户用电增量进行筛选,筛选出某一用户任一日期下的用电增量绝对值大于阈值α的用户及其对应的用户用电量增量,形成集合MV;遍历集合DV下的各个集合,进行用户用电增量的筛选,形成集合MV=[M1,Λ,Mv](v=1...v,v<=i/di);遍历集合SV和MV,计算用户用电量增量对台区线损增量的影响系数,生成集合Q;根据集合Q通过预设阈值判断是否为异常用户。在第一种可能实现的方式中,选取最少一年的台区日总用电量、日线损、日抄表成功率数据,并对数据拆分成多个数据集合具体包括以下步骤:S11、选取最少一年的台区日总用电量、日线损、日抄表成功率数据,形成集合Z,式中,i代表日期,pi表示日期i台区总用电量,li表示日期i台区总线损,ri表示日期i台区抄表成功率;S12、筛选集合Zri为1.0的数据,并将集合Z拆分为行数为di的多个小集合,丢弃行数不足di的数据,生成的多个集合分别记为{W1ΛWjΛWn}(j=1,2...n,n=i/di)。在第二种可能实现的方式中,计算台区线损日增量、总用电量日增量,生成集合Aj;对多个数据集合进行日期筛选,生成线损增量集合Sj具体包括以下步骤:S21、对数据集合Wj计算台区线损日增量、总用电量日增量,生成集合Aj,式中,i代表日期,Δli=li-li-1,Δpi=pi-pi-1,Δli为线损增量,li为当前日期的台区线损,li-1为另一日期下的台区线损;Δpi为台区总用电量增量,pi为当前日期的台区总用电量,pi-1为另一日期下的台区总用电量;S22、对集合Aj中进行筛查,筛选出台区线损增量为负值,台区总用电量增量为正值的日期集合Dj及日期对应的线损增量集合Sj;其中d为符合条件的日期,Δld为符合条件的日期下的线损增量。在第三种可能实现的方式中,所述分别计算线损增量集合中线损增量的离散系数,生成集合CV具体包括以下步骤:S31、对所有的集合Wj(j=1...n,n=i/di),执行S21、S22中的筛选工作,得到集合D,S,A;D=[D1,Λ,Dj],A=[A1,Λ,Aj],S=[S1,Λ,Sj](j=1...n,n=i/di);S32、分别计算集合S中各个集合关于线损增量的离散系数(指标为CV,标准差系数),生成集合CV;CV=[cv1,Λ,cvj],在第四种可能实现的方式中,对集合CV做聚类操作,选择聚类中心大的一类cv对应的集合形成集合DV,与DV相对应的集合A、S筛选出的集合AV=[A1,Λ,Av],集合SV=[S1,Λ,Sv](v=1...v,v<=i/di)具体包括以下步骤:S41、选择聚类中心大的一类cv(标准差系数)对应的集合Dj形成集合DV,DV=[D1,Λ,Dv],与DV相对应的集合A、S筛选出的集合AV=[A1,Λ,Av],集合SV=[S1,Λ,Sv](v=1...v,v<=i/di)。在第五种可能实现的方式中,所述cv的计算方法包括:在第六种可能实现的方式中,所述对集合DV的用户用电增量进行筛选,筛选出某一用户任一日期下的用电增量绝对值大于阈值α的用户及其对应的用户用电量增量,形成集合MV具体包括以下步骤:S51、选择日期集合DV下的用户用电量生成用户用电量集合Uv,其中m为集合DV中的日期,k代表用户;S52、计算日期m台区用户的日用电量增量:Δum,k=um,k-um-1,k(m,m-1均代表日期);S53、根据集合Uv计算生成用户用电量增量集合ΔUv:S54、保留在集合ΔUv中任一日期下的用电增量绝对值大于阈值α的用户,移除在所有日期下的增量均小于α的用户;S55、计算用户在日期下的用电量增量的离散系数:S56、选择离散系数大于阈值β的用户及其对应的用户用电量增量形成集合Mv:其中,h表示符合筛选条件的用户,m表示符合筛选条件的日期,mum,h为符合条件用户在符合条件日期下的用电量增量。在第七种可能实现的方式中,所述遍历集合SV和MV,计算用户用电量增量对台区线损增量的影响系数,生成集合Q具体包括以下步骤:S61、根据公式XC=S回归计算得到线损增量的影响系数;式中,自变量表示用户用电量的增量;bm为计算添加的截距,m表示符合筛选条件的日期,mum,h为符合条件用户在符合条件日期下的用电量增量;因变量Sv为集合SV中的小集合;回归取得用户用电增量与台区总用电量增量的线损增量的影响系数(h代表用户本文档来自技高网...

【技术保护点】
1.一种基于大数据分析的台区异常户变关系识别方法,其特征是,该方法包括以下步骤:/n选取最少一年的台区日总用电量、日线损、日抄表成功率数据,并对数据拆分成多个数据集合;/n计算台区线损日增量、总用电量日增量,生成集合A

【技术特征摘要】
1.一种基于大数据分析的台区异常户变关系识别方法,其特征是,该方法包括以下步骤:
选取最少一年的台区日总用电量、日线损、日抄表成功率数据,并对数据拆分成多个数据集合;
计算台区线损日增量、总用电量日增量,生成集合Aj;对多个数据集合进行日期筛选,生成线损增量集合Sj;
分别计算线损增量集合中线损增量的离散系数,生成集合CV;
对集合CV做聚类操作,选择聚类中心大的一类cv对应的集合形成集合DV,与DV相对应的集合A、S筛选出的集合AV=[A1,Λ,Av],集合SV=[S1,Λ,Sv](v=1...v,v<=i/di);
对集合DV的用户用电增量进行筛选,筛选出某一用户任一日期下的用电增量绝对值大于阈值α的用户及其对应的用户用电量增量,形成集合MV;
遍历集合DV下的各个集合,进行用户用电增量的筛选,形成集合MV=[M1,Λ,Mv](v=1...v,v<=i/di);
遍历集合SV和MV,计算用户用电量增量对台区线损增量的影响系数,生成集合Q;
根据集合Q通过预设阈值判断是否为异常用户。


2.根据权利要求1所述的一种基于大数据分析的台区异常户变关系识别方法,其特征是,选取最少一年的台区日总用电量、日线损、日抄表成功率数据,并对数据拆分成多个数据集合具体包括以下步骤:
S11、选取最少一年的台区日总用电量、日线损、日抄表成功率数据,形成集合Z,式中,i代表日期,pi表示日期i台区总用电量,li表示日期i台区总线损,ri表示日期i台区抄表成功率;
S12、筛选集合Zri为1.0的数据,并将集合Z拆分为行数为di的多个小集合,丢弃行数不足di的数据,生成的多个集合分别记为{W1ΛWjΛWn}(j=1,2...n,n=i/di)。


3.根据权利要求2所述的一种基于大数据分析的台区异常户变关系识别方法,其特征是,计算台区线损日增量、总用电量日增量,生成集合Aj;对多个数据集合进行日期筛选,生成线损增量集合Sj具体包括以下步骤:
S21、对数据集合Wj计算台区线损日增量、总用电量日增量,生成集合Aj,式中,i代表日期,Δli=li-li-1,Δpi=pi-pi-1,Δli为线损增量,li为当前日期的台区线损,li-1为另一日期下的台区线损;Δpi为台区总用电量增量,pi为当前日期的台区总用电量,pi-1为另一日期下的台区总用电量;
S22、对集合Aj中进行筛查,筛选出台区线损增量为负值,台区总用电量增量为正值的日期集合Dj及日期对应的线损增量集合Sj;



其中d为符合条件的日期,Δld为符合条件的日期下的线损增量。


4.根据权利要求3所述的一种基于大数据分析的台区异常户变关系识别方法,其特征是,所述分别计算线损增量集合中线损增量的离散系数,生成集合CV具体包括以下步骤:
S31、对所有的集合Wj(j=1...n,n=i/di),执行S21、S22中的筛选工作,得到集合D,S,A;D=[D1,Λ,Dj],A=[A1,Λ,Aj],S=[S1,Λ,Sj](j=1...n,n=i/di);
S32、分别计算集合S中各个集合关于线损增量的离散系数(指标为CV,标准差系数),生成集合CV;CV=[cv1,Λ,cvj],


5.根据权利要求4所述的一种基于大数据分析的台区异常户变关系识别方法,其特征是,对集合CV做聚类操作,选择聚...

【专利技术属性】
技术研发人员:鞠永乾周文俊宋先慧李尔园傅洋陈洪巧
申请(专利权)人:积成电子股份有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1