基于电费出账风险管控的用电信息采集数据二次研判方法技术

技术编号:28782373 阅读:27 留言:0更新日期:2021-06-09 11:15
本发明专利技术属于用电数据分析处理应用领域,涉及一种基于电费出账风险管控的用电信息采集数据二次研判方法。包括以下步骤:S1:采集系统获取用户用电信息;S2:营销系统,根据上述用户用电信息进行一次研判,所述一次研判是指判断是否符合CMS出账规则;如果符合,则直接出账;如果不符合,则进行S3;S3:结合用户历史用电数据,开展数据准备、数据清洗、数据预测、数据判别,进行二次研判;S4:二次研判规则符合,则营销系统直接出账;不符合,则发出指令进行人工抄表。本发明专利技术结果准确且风险可控,充分利用可用的用户用电信息远程采集数据,充分挖掘数据价值,提升自动化电费出账率,大幅减少人工现场抄表工作量,支撑电网公司“提质增效”工作要求。求。求。

【技术实现步骤摘要】
基于电费出账风险管控的用电信息采集数据二次研判方法


[0001]本专利技术属于用电数据分析处理应用领域,尤其涉及基于电费出账风险管控的用电信息采集数据二次研判方法。

技术介绍

[0002]近年,国家电网公司电费采集出账业务的管理在向集约化、标准化、数字化方向发展。提高抄表业务智能化和采集出账成功率也一直是实现国家电网智能化和营销智能化的重要组成部分。现有的营销模式在抄表核算业务环节,优先使用已建成的电力用户用电信息采集系统数据,实施自动化抄表。但由于通信误码、采集设备故障等不可控原因,会偶然发生采集数据为毛刺数据并偏离实际电表实际数据的情况。为避免少数异常数据引起出账错误用户投诉的风险发生,电网公司在出账系统中往往会设置简单、严酷的数据过滤机制,使得每月2%~5%的正确采集数据被弃用,造成了数据价值的严重浪费。被弃用数据的用户,依然会派发人工现场抄表工单,靠人工现场补抄电表完成最终的月电费出账。低压客户的电能量采集数据抄表结算应用率不高,造成了大量的人工浪费和企业运行成本浪费。
[0003]国网上海市电力公司向国家知识产权局提交了201811597971.3,公开了一种电费采集出账数据规则优化方法,首先进行了小用户和大用户采集出账规则分析,运用数据分析透彻掌握采集出账失败情况,在此基础上,添加采集数据常态化管控与优化的规则,便于管理和业务人员及时对采集出账失败数据进行优化,对实际业务问题进行改进,有效提升了用户采集出账异常情况的分析能力和业务管理能力,但并未达到有效提升数据出账率的目的。
[0004]供电企业对用户采集出账成功率的提升愈加重视,为解决以上问题,亟需开展用户侧用电信息采集数据的有效性甄别,在精准辨识的基础上,提升数据可用率,减少企业成本支出。截止到2020年1月,公司营销部统计在目前在中小用户电费出账业务中,每月约有十万左右的用户电表,采集成功却出账失败,主要原因是无法开展有效准确的数据甄别。

技术实现思路

[0005]针对现有技术存在的问题,本专利技术提供了一种提升采集出账率、减少人工抄表,达到提质增效为目的的基于电费出账风险管控的用电信息采集数据二次研判方法。
[0006]本专利技术是这样实现的,基于电费出账风险管控的用电信息采集数据二次研判方法,其特征在于:
[0007]包括以下步骤:
[0008]S1:采集系统获取用户用电信息;
[0009]S2:营销系统,根据上述用户用电信息进行一次研判,所述一次研判是指判断是否符合CMS出账规则;如果符合,则直接出账;如果不符合,则进行S3;
[0010]S3:结合用户历史用电数据,开展数据准备、数据清洗、数据预测、数据判别,进行二次研判;
[0011]S4:二次研判规则符合,则营销系统直接出账;不符合,则发出指令进行人工抄表。
[0012]所述的用户用电信息为营销系统上月出账标记为“用采出账”的电表数据。
[0013]所述的数据透抄包括采集系统首先对本月“结算日冻结数据”进行透抄,得到透抄值x
月末透抄

[0014](1)若|x
月末透抄

x
月末
|≤1kwh,则判定x
月末
有效,可用于出账;
[0015](2)若|x
月末透抄

x
月末
|>1kwh,则判定x
月末
无效,不可用于出账;
[0016](3)剩余透抄失败的电表,进入后续“数据准备”判断;
[0017]上月出账为采集出账且出账示值为C
上月
,本月月末一日采集示数为x
月末
,本月非月末任一日采集示数为x
n
,本月除月末一日采集示数平均值为x。
[0018]所述的二次研判包括以下步骤:数据准备、数据清洗、数据预测、数据判别;
[0019]所述的数据准备包括以下步骤:
[0020]步骤1:若本月用户发生换表,则该用户剔除,不可采集数据出账;
[0021]步骤2:若x
月末
的各费率之和与总电量的差值的绝对值,大于1kwh,则该用户剔除,不可采集数据出账;
[0022]步骤3:若(x
月末

C
上月
)<0、或单相表(x
月末

C
上月
)>1040、或三相表(x
月末

C
上月
)>7000,则该用户剔除,不可采集数据出账;
[0023]步骤4:且某日的(x
n

C
上月
)<0、或单相表(x
n

C
上月
)>1040、或三相表(x
n

C
上月
)>7000,则该用户的该日数据剔除,不参与后续计算;
[0024]步骤5:经过步骤1

4,若当月剩余的可供计算的x
n
的采集成功天数,小于12日,则该用户剔除,不可采集数据出账。
[0025]用户用电量往往与用户电能表配置、用户用电线路负荷配置有很大关系。经过统计分析,月平均用电量大于1040kwh的低压单相用户不到低压单相总用户数的1%,月平均用电量大于7000kwh的低压三相用户不到低压三相总用户数的1%。而采集系统中的异常突变数据往往也落在此区间内。为确保出账数据风险可控,故设定超出该阈值,不属于本方法适用的范畴。
[0026]受远程电量采集成功率的影响,若用户在某月的日电量数据采集成功天数小于N日,通过本方法进行数据预测得到月末一日的预测电量数据,有可能出现偏差较大,导致月末实际采集电量数据准确性的研判规则失效,不利于风险管控。通过对上百万样本的机器学习,为达到数据利用最大化、风险最小化,取N等于12最为合理。
[0027]所述的数据清洗包括以下步骤:
[0028]步骤6:依据上述步骤,计算的标准偏差σ,
[0029][0030]步骤7:依据拉依达准则,剔除毛刺数据;
[0031]设S=3σ。若用户某日时,则的采集数据剔除;
[0032]步骤8:验证数据是否发生飞走或倒走,完成毛刺数据剔除后,验证该用户本月剩余可计算的采集示数为x
n
是否发生飞走或倒走:
[0033](1)飞走判别:平均日用电量,单相表(x
n

x
n
‑1)>254kwh,三相表(x
n

x
n
‑1)>
1268kwh;若上v日连续采集失败,则阈值应乘以v;
[0034]飞走判别阈值:依据用户实际使用电能表的额定电压U
N
、最大电流I
max
,计算该用户最大可能用电量:阈值=U
N
×
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于电费出账风险管控的用电信息采集数据二次研判方法,其特征在于:包括以下步骤:S1:采集系统获取用户用电信息;S2:营销系统,根据上述用户用电信息进行一次研判,所述一次研判是指判断是否符合CMS出账规则;如果符合,则直接出账;如果不符合,则进行S3;S3:结合用户历史用电数据,开展数据准备、数据清洗、数据预测、数据判别,进行二次研判;S4:二次研判规则符合,则营销系统直接出账;不符合,则发出指令进行人工抄表。2.如权利要求1所述的基于电费出账风险管控的用电信息采集数据二次研判方法,其特征在于,所述的数据准备是指基于专家经验构建的用户侧用电信息采集数据初步筛查决策算法,包括以下步骤:步骤1:若本月用户发生换表,则该用户剔除,不可采集数据出账;步骤2:若x
月末
的各费率之和与总电量的差值的绝对值,大于1kwh,则该用户剔除,不可采集数据出账;步骤3:若(x
月末

C
上月
)<0、或单相表(x
月末

C
上月
)>1040、或三相表(x
月末

C
上月
)>7000,则该用户剔除,不可采集数据出账;步骤4:且某日的(x
n

C
上月
)<0、或单相表(x
n

C
上月
)>1040、或三相表(x
n

C
上月
)>7000,则该用户的该日数据剔除,不参与后续计算;步骤5:经过步骤1

4,若当月剩余的可供计算的x
n
的采集成功天数,小于12日,则该用户剔除,不可采集数据出账;为规避数据毛刺发生风险,选取电网单相用户用电量最大1%的用户月用电量1040kwh、低压三相用户用电量最大1%的用户月用电量7000kwh,作为数据初筛依据。3.如权利要求1所述的基于电费出账风险管控的用电信息采集数据二次研判方法,其特征在于,所述的数据清洗是指:运用标准偏差法与拉依达准则构建异常数据甄别与异常数据清洗模型算法,为二次研判构建合理准确的数据依据,包括以下步骤:步骤6:依据上述步骤,计算的标准偏差σ,步骤7:依据拉依达准则,剔除毛刺数据;设S=3σ。若用户某日时,...

【专利技术属性】
技术研发人员:蒋超朱铮戴璐平杜成刚戴辰王晋俞磊许堉坤肖爽张垠尹渭李蕊沈华甄昊涵张芮嘉安佰龙
申请(专利权)人:国网上海市电力公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1