一种基于大数据的高价低接用户识别方法技术

技术编号:23085844 阅读:81 留言:0更新日期:2020-01-11 01:25
本发明专利技术公开了一种基于大数据的高价低接用户识别方法,本方法基于业务规章要求、重点工作开展情况、内外部检查发现的问题,梳理业务特征项,形成模型的基础构建;基于提取的模型特征变量,实现用户行业特征与用电特征不匹配、电价执行与政策不符、档案与电费计算的执行情况不一致等高价低接特征分析;基于神经网络分位数回归模型,建立三层感知器神经网络,并采用交叉验证法、AIC准则以及BIC准则等实现对电价执行标准分类。而且,本发明专利技术通过大数据有监督学习模型,实现机器学习,找出高价低接判断对象的表象特征与高价低接判断问题的潜在关联模式;通过不断优化监控指标及规则,实现问题对象的全面挖掘,提高疑似问题对象的准确率。

【技术实现步骤摘要】
一种基于大数据的高价低接用户识别方法
本专利技术属于
,具体涉及一种基于大数据的高价低接用户识别方法。
技术介绍
电价是售电收入的重要因素,是电力企业经营效益的关键。在日常用电检检查和业务办理中发现存在有些用户的用电类别与其行业类别存在差异,如农业、工业、制造业等行业,这种情况直接给公司经营带来损失,因此通过半监督机器学习等方式建立高价低接用户大数据模型,并通过模型训练等方式最终实现对公司高价低接用户的识别,据此结合用电检查等现场核查工作完成现场甄别,从而为公司挽回经济损失。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种基于大数据的高价低接用户识别方法。本方法针对历史发现的高价低接用户大量的数据进行分析,利用大数据分析工具提取高价低接用户特征,构建高价低接用户识别大数据模型,并通过模型训练完成模型的完善,实现对公司存在高价低接用户的识别。本专利技术是通过以下技术方案实现的:一种基于大数据的高价低接用户识别方法,按照下列步骤进行:步骤一、模型特征变量提取>基于业务规章要求、本文档来自技高网...

【技术保护点】
1.一种基于大数据的高价低接用户识别方法,其特征在于,按照下列步骤进行:/n步骤一、模型特征变量提取/n基于业务规章要求、重点工作开展情况、内外部检查发现的问题,梳理业务特征项,形成模型的基础构建;/n步骤二、高价低接特征分析/n高价低接特征包括:1)用户行业特征与用电特征不匹配;2)电价执行与政策不符;3)档案与电费计算的执行情况不一致;/n步骤三、模型算法设计/n(1)对用电采集数据进行抽取与存储,通过采集数据治理实现数据预处理;/n(2)采用深度学习框架TensorFlow搭建大数据建模,利用GPU设备加速训练;/n(3)采用K折交叉验证对模型效果进行验证;/n(4)模型部署后通过离线分...

【技术特征摘要】
1.一种基于大数据的高价低接用户识别方法,其特征在于,按照下列步骤进行:
步骤一、模型特征变量提取
基于业务规章要求、重点工作开展情况、内外部检查发现的问题,梳理业务特征项,形成模型的基础构建;
步骤二、高价低接特征分析
高价低接特征包括:1)用户行业特征与用电特征不匹配;2)电价执行与政策不符;3)档案与电费计算的执行情况不一致;
步骤三、模型算法设计
(1)对用电采集数据进行抽取与存储,通过采集数据治理实现数据预处理;
(2)采用深度学习框架TensorFlow搭建大数据建模,利用GPU设备加速训练;
(3)采用K折交叉验证对模型效果进行验证;
(4)模型部署后通过离线分析和线上分析同时进行模型评估;
(5)用电历史核查记录中各种高价低接等违约用电的标签y=1,其它用户作为负样本y=0,针对公变低压用户和专变用户分别建立高价低接分析模型,对比并选择梯度上升决策树、LSTM神经网络时序模型、SVM模型,通过模型训练,建立X与y的关联;LSTM模型结构如下所述:每一个时刻,神经网络模型的输入包含当前时刻的多维特征X,通过各隐藏层的变换,得到当前时刻t的n个状态节点St=<S1,S2,S3,…,Sn>,在此DNN网络基础上,结合时序长短期记忆模型,时刻t的输出为当前时刻状态St和前一时刻状态St-1的函数Ot=f(St+W*St-1),LSTM能够同时建模客户长期和短期数据中依赖关系,并随着时间发展迭代训练、预测,模型最终输出违约用电的概率Pi=1/(1+e-Ot);
(6)违约用电识别模型根据人工核实结果,反馈到模型的训练过程中,形成数据优化闭环,持续优化模型效果;
步骤四、机器学习
长期积累发现的问题案例数据,定期将核查确定的结果作为经验信息,输入规则优化模型,通过大数据监督学习模型,实现机器学习,找出高价低接判断对象的表象特征与高价低接判断问题的潜在关联模式,不断优化监控指标及规则,提升问题对象挖掘的全面性,提高疑似问题对象的准确率;
步骤五、高价低接用户识别
基于数据模型实现对高价低接用户的识别,根据分析出的结果结合用电检查等现场核查工作完成现场甄别,助力相关的异常问题处理。


2.如权利要求1所述的一种基于大数据的高价低接用户识别方法,其特征在于:在步骤二中,所述用户行业特征与用电特征不匹配的特征数据包括:电价为农业排灌,每月存在电量、居民电价用户月用电量过大、学校用电特征不符、居民照明用户电价行业分类为非居民、临时用电户执行大工业电价、临时用电户超期、临时用电户销户还有预收、执行大工业、农业、一般工商业电价的行业分类为居民生活、电采暖电价用户冬季用...

【专利技术属性】
技术研发人员:段志田陈莹邹禹平贾嘉董兵高伟臧依璨高嘉伟
申请(专利权)人:国网天津市电力公司国家电网有限公司
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1