一种基于大数据的高价低接用户识别方法技术

技术编号:23085844 阅读:56 留言:0更新日期:2020-01-11 01:25
本发明专利技术公开了一种基于大数据的高价低接用户识别方法,本方法基于业务规章要求、重点工作开展情况、内外部检查发现的问题,梳理业务特征项,形成模型的基础构建;基于提取的模型特征变量,实现用户行业特征与用电特征不匹配、电价执行与政策不符、档案与电费计算的执行情况不一致等高价低接特征分析;基于神经网络分位数回归模型,建立三层感知器神经网络,并采用交叉验证法、AIC准则以及BIC准则等实现对电价执行标准分类。而且,本发明专利技术通过大数据有监督学习模型,实现机器学习,找出高价低接判断对象的表象特征与高价低接判断问题的潜在关联模式;通过不断优化监控指标及规则,实现问题对象的全面挖掘,提高疑似问题对象的准确率。

【技术实现步骤摘要】
一种基于大数据的高价低接用户识别方法
本专利技术属于
,具体涉及一种基于大数据的高价低接用户识别方法。
技术介绍
电价是售电收入的重要因素,是电力企业经营效益的关键。在日常用电检检查和业务办理中发现存在有些用户的用电类别与其行业类别存在差异,如农业、工业、制造业等行业,这种情况直接给公司经营带来损失,因此通过半监督机器学习等方式建立高价低接用户大数据模型,并通过模型训练等方式最终实现对公司高价低接用户的识别,据此结合用电检查等现场核查工作完成现场甄别,从而为公司挽回经济损失。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种基于大数据的高价低接用户识别方法。本方法针对历史发现的高价低接用户大量的数据进行分析,利用大数据分析工具提取高价低接用户特征,构建高价低接用户识别大数据模型,并通过模型训练完成模型的完善,实现对公司存在高价低接用户的识别。本专利技术是通过以下技术方案实现的:一种基于大数据的高价低接用户识别方法,按照下列步骤进行:步骤一、模型特征变量提取基于业务规章要求、重点工作开展情况、内外部检查发现的问题,梳理业务特征项,形成模型的基础构建;步骤二、高价低接特征分析1)用户行业特征与用电特征不匹配用户行业特征与用电特征不匹配主要分析研究电价为农业排灌,每月存在电量、居民电价用户月用电量过大、学校用电特征不符、居民照明用户电价行业分类为非居民、临时用电户执行大工业电价、临时用电户超期、临时用电户销户还有预收、执行大工业、农业、一般工商业电价的行业分类为居民生活、电采暖电价用户冬季用电量偏小、零售行业谷段电量过大、行业为制造业,负载率低于一定值、充电电价用电,但是用电量较高、合同容量小于110kv户名中含酒店、餐饮、宾馆、饭店、冷库、商城、超市的不应执行分时电价、户名含“居委会”没有执行居委会电价、户名含“学校”“幼儿园”没有执行学校电价、户名含“排灌”没有执行排灌电价等特征数据发掘。2)电价执行与政策不符分析售电价执行与政策不符,主要从如下政策进行分析,挖掘规律:①变压器容量在100KVA以下用户,功率因数标准应该为“不考核”;②变压器容量在100KVA以上的农业户和趸售用户,功率因数标准应该为0.8;③变压器容量在100KVA以上、160KVA以下的工业及非工业用户,功率因数标准应该为0.85;④变压器容量在160KVA以上的工业用户,功率因数标准应该为0.9;⑥功率因数标准执0.9,变压器容量低于160KVA;⑦合同容量小315KVA,不能执行大工业电价;⑦执行农业电价,不应执行分时;⑧需量用户,核定需量小于容量之和40%;⑨减容期满后的用户以及新装、增容用户,两年内申办减容或暂停的基本电费收取50%。3)档案与电费计算的执行情况不一致档案与电费计算的执行情况不一致分析,主要从计量方式为高供低计的用户,未计收变损的情况进行挖掘。步骤三、模型算法设计对用电采集数据进行抽取与存储,通过采集数据治理实现数据预处理,包括数据格式管理、数据完整性检查、营销数据格式校验、档案问题管理、电压电流缺失数据管理、重复数据管理、电压电流错误数据管理、换表行为分析、用户电表异常事件分析等。大数据建模采用深度学习框架TensorFlow搭建,利用GPU设备加速训练。采用K折交叉验证对模型效果进行验证,其中违约用电识别模型采用准确度、召回率、AUC等指标进行效果评估。模型部署后通过离线分析和线上分析同时进行模型评估。离线部分,针对带标签的测试集合,利用AUC指标计算违约用电识别模型的准确性,AUC越大,表示违约用电识别模型越准确。线上实际运行过程中,对接入用户数据进行近实时预测,将超过在建模过程中选择的概率阈值的疑似用户结果提供给业务人员使用,辅助进行违约用电核实,根据核实结果计算违约用电识别模型的查准率,进而评估实际运行过程中的准确性。用电历史核查记录中各种高价低接等违约用电的标签y=1,其它用户作为负样本y=0。针对公变低压用户和专变用户分别建立高价低接分析模型。对比并选择梯度上升决策树、LSTM神经网络时序模型、SVM等模型,通过模型训练,建立X与y的关联。其中,LSTM模型结构图如下图所示:每一个时刻,神经网络模型的输入包含当前时刻的多维特征X,通过各隐藏层的变换,得到当前时刻t的n个状态节点St=<S1,S2,S3,…,Sn>。在此DNN网络基础上,结合时序长短期记忆模型(LongShort-TermMemory,LSTM),时刻t的输出为当前时刻状态St和前一时刻状态St-1的函数Ot=f(St+W*St-1)。LSTM能够同时建模客户长期和短期数据中依赖关系,并随着时间发展迭代训练、预测。模型最终输出违约用电的概率Pi=1/(1+e-Ot)。违约用电识别模型根据人工核实结果,反馈到模型的训练过程中,形成数据优化闭环,持续优化模型效果。考虑到不同地区的样本数据千差万别,在优化过程中对特定地区的用户特性相应建模方法单独进行优化。针对不同用电量规模的用户,其用电行为有显著差异,不同用电量等级的用户的模型建模结果会有所不同。对于不同用电量的用户,应基于其电能表日冻结数据、用电用户档案、电能表规格等信息,分析其用电行为,判断用电量不同对高价低接用电识别带来的影响,将高价低接识别模型不断完善及优化,使得对不同特点的用户识别更加准确。针对不同承载用户量的台区,其线损特性不同,其模型需要进一步优化和适配,不同地区的大用户数台区因供电半径和用户负荷特性不同,需针对具体情况进行优化和适配,并针对现场核查结果进行不断适配,对模型进行调优,不断提高模型计算的准确性。步骤四、机器学习长期积累发现的问题案例数据,定期将核查确定的结果作为经验信息,输入规则优化模型,通过大数据监督学习模型,实现机器学习,找出高价低接判断对象的表象特征与高价低接判断问题的潜在关联模式。不断优化监控指标及规则,提升问题对象挖掘的全面性,提高疑似问题对象的准确率。具体如下:1)对高价低接监控触发时,结合高价低接判断指标与规则体系,全面记录当期各类高价低接判断对象的特征信息(包含高价低接判断对象的所有监控指标信息及其基础属性信息)与疑似问题对象的高价低接判断结果信息(经核实后,疑似问题对象是否确实存在问题)。通过长期积累,形成海量的高价低接判断对象特征信息与高价低接判断结果信息数据,以此数据为训练样本数据,输入规则优化模型开展机器学习训练。2)在高价低接判断周期触发前,基于历史积累的高价低接判断经验数据对当期高价低接判断主题开展机器学习训练,根据历史高价低接判断案例数据中的高价低接判断对象特征信息与高价低接判断结果信息数据,采用有监督学习相关大数据技术,寻找出能表征对象是否存在问题的表象特征,明确高价低接判断对象表象特征与高价低接判断问题的关联模式。基于该模型对历史经验案例的客观分析,为高价低接判断指标与规则体系优化提供指导建议。<本文档来自技高网...

【技术保护点】
1.一种基于大数据的高价低接用户识别方法,其特征在于,按照下列步骤进行:/n步骤一、模型特征变量提取/n基于业务规章要求、重点工作开展情况、内外部检查发现的问题,梳理业务特征项,形成模型的基础构建;/n步骤二、高价低接特征分析/n高价低接特征包括:1)用户行业特征与用电特征不匹配;2)电价执行与政策不符;3)档案与电费计算的执行情况不一致;/n步骤三、模型算法设计/n(1)对用电采集数据进行抽取与存储,通过采集数据治理实现数据预处理;/n(2)采用深度学习框架TensorFlow搭建大数据建模,利用GPU设备加速训练;/n(3)采用K折交叉验证对模型效果进行验证;/n(4)模型部署后通过离线分析和线上分析同时进行模型评估;/n(5)用电历史核查记录中各种高价低接等违约用电的标签y=1,其它用户作为负样本y=0,针对公变低压用户和专变用户分别建立高价低接分析模型,对比并选择梯度上升决策树、LSTM神经网络时序模型、SVM模型,通过模型训练,建立X与y的关联;LSTM模型结构如下所述:每一个时刻,神经网络模型的输入包含当前时刻的多维特征X,通过各隐藏层的变换,得到当前时刻t的n个状态节点St=<S1,S2,S3,…,Sn>,在此DNN网络基础上,结合时序长短期记忆模型,时刻t的输出为当前时刻状态St和前一时刻状态St-1的函数Ot=f(St+W*St-1),LSTM能够同时建模客户长期和短期数据中依赖关系,并随着时间发展迭代训练、预测,模型最终输出违约用电的概率Pi=1/(1+e-Ot);/n(6)违约用电识别模型根据人工核实结果,反馈到模型的训练过程中,形成数据优化闭环,持续优化模型效果;/n步骤四、机器学习/n长期积累发现的问题案例数据,定期将核查确定的结果作为经验信息,输入规则优化模型,通过大数据监督学习模型,实现机器学习,找出高价低接判断对象的表象特征与高价低接判断问题的潜在关联模式,不断优化监控指标及规则,提升问题对象挖掘的全面性,提高疑似问题对象的准确率;/n步骤五、高价低接用户识别/n基于数据模型实现对高价低接用户的识别,根据分析出的结果结合用电检查等现场核查工作完成现场甄别,助力相关的异常问题处理。/n...

【技术特征摘要】
1.一种基于大数据的高价低接用户识别方法,其特征在于,按照下列步骤进行:
步骤一、模型特征变量提取
基于业务规章要求、重点工作开展情况、内外部检查发现的问题,梳理业务特征项,形成模型的基础构建;
步骤二、高价低接特征分析
高价低接特征包括:1)用户行业特征与用电特征不匹配;2)电价执行与政策不符;3)档案与电费计算的执行情况不一致;
步骤三、模型算法设计
(1)对用电采集数据进行抽取与存储,通过采集数据治理实现数据预处理;
(2)采用深度学习框架TensorFlow搭建大数据建模,利用GPU设备加速训练;
(3)采用K折交叉验证对模型效果进行验证;
(4)模型部署后通过离线分析和线上分析同时进行模型评估;
(5)用电历史核查记录中各种高价低接等违约用电的标签y=1,其它用户作为负样本y=0,针对公变低压用户和专变用户分别建立高价低接分析模型,对比并选择梯度上升决策树、LSTM神经网络时序模型、SVM模型,通过模型训练,建立X与y的关联;LSTM模型结构如下所述:每一个时刻,神经网络模型的输入包含当前时刻的多维特征X,通过各隐藏层的变换,得到当前时刻t的n个状态节点St=<S1,S2,S3,…,Sn>,在此DNN网络基础上,结合时序长短期记忆模型,时刻t的输出为当前时刻状态St和前一时刻状态St-1的函数Ot=f(St+W*St-1),LSTM能够同时建模客户长期和短期数据中依赖关系,并随着时间发展迭代训练、预测,模型最终输出违约用电的概率Pi=1/(1+e-Ot);
(6)违约用电识别模型根据人工核实结果,反馈到模型的训练过程中,形成数据优化闭环,持续优化模型效果;
步骤四、机器学习
长期积累发现的问题案例数据,定期将核查确定的结果作为经验信息,输入规则优化模型,通过大数据监督学习模型,实现机器学习,找出高价低接判断对象的表象特征与高价低接判断问题的潜在关联模式,不断优化监控指标及规则,提升问题对象挖掘的全面性,提高疑似问题对象的准确率;
步骤五、高价低接用户识别
基于数据模型实现对高价低接用户的识别,根据分析出的结果结合用电检查等现场核查工作完成现场甄别,助力相关的异常问题处理。


2.如权利要求1所述的一种基于大数据的高价低接用户识别方法,其特征在于:在步骤二中,所述用户行业特征与用电特征不匹配的特征数据包括:电价为农业排灌,每月存在电量、居民电价用户月用电量过大、学校用电特征不符、居民照明用户电价行业分类为非居民、临时用电户执行大工业电价、临时用电户超期、临时用电户销户还有预收、执行大工业、农业、一般工商业电价的行业分类为居民生活、电采暖电价用户冬季用...

【专利技术属性】
技术研发人员:段志田陈莹邹禹平贾嘉董兵高伟臧依璨高嘉伟
申请(专利权)人:国网天津市电力公司国家电网有限公司
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1