一种基于大数据的电网用户电费回收模型构建方法技术

技术编号:13339735 阅读:178 留言:0更新日期:2016-07-13 14:03
本发明专利技术公开一种基于大数据的电网用户电费回收模型构建方法,通过分析不同客户的缴交电费行为以及客户基本属性特征,进行客户的电费回收风险预测,有利于对不同客户提前采取差异化的电费回收策略和预防措施,保障企业的电费收入,有效控制企业经营风险。

【技术实现步骤摘要】

本专利技术涉及一种基于大数据的电网用户电费回收模型构建方法,运用算法模型,分析不同客户的缴交电费行为以及客户基本属性特征,进行客户的电费回收风险预测,并在系统中为客户进行标识,有利于对不同客户提前采取差异化的电费回收策略和预防措施,保障企业的电费收入,有效控制企业经营风险。
技术介绍
现在,我国大部分地区电力部门收缴电费采用的是先用电后缴费的制度,这为欠缴、不缴电费提供了可能性。此外法律规定也存在着不足之处,如《电力供应与使用条例》第三十条:逾期未交付电费的,供电企业可以从逾期之日起加收违约金,自逾期之日起超过30日,经催交仍未交付电费的,供电企业可以按照国家规定的程序停止供电。实际上如果逾期3O日停电,用户使用电能量已经是2个月的了,造成供电企业承担的欠费风险进一步加大。电费回收工作涉及千家万户,点多、面广、量大,回收工作面临诸多风险。尤其是十八大后,中央反“四风”专项治理的不断推进,餐饮、旅业、会所等行业经营不善;产业转型升级、淘汰落后产能,传统的造纸、纺织、印刷、化工、建材、煤炭、养殖等行业面临关停,造成电费回收工作形势更加严峻。因电费的回收直接影响到企业的经济效益,关系到企业的生存和发展。供电企业必须从多方面采取行之有效的措施,以防止陈欠电费特别是防止电费呆帐、坏帐的形成,使企业的自身效益得到保障。
技术实现思路
本专利技术提供一种基于大数据的电网用户电费回收模型构建方法,通过该模型分析不同客户的缴交电费的行为以及客户基本属性特征,明确每个客户的电费回收风险等级,找到高风险客户,有针对性地采取差异化的策略和具体措施,确保电费及时回收,降低企业经营风险。为了实现上述目的,本专利技术采用的技术方案如下:基于大数据的电网用户电费回收模型构建方法,包括以下步骤:(1)导入建模样本数据;(2)数据区分为训练、验证和测试集;(3)统计各个变量的区分度和分段区间;(4)运用回归算法建模;(5)全体客户进行打分;(6)分群标准与业务验证与现有技术相比,本专利技术具有以下有益效果:(1)将细分结果嵌入营销系统,逐步实现回收高风险客户的缴费提醒和差异化账单提醒,将催费环节前移到缴费期截止前,从而促进电费回收。附图说明:图1为本专利技术的流程图。具体实施方式:下面结合附图和实施例对本专利技术作进一步说明,本专利技术的实施方式包括但不限于下列实施例。实施例图1为本专利技术的流程图,选取汕头供电局2011年11月—2012年10月的用户数据,实施流程如下:1、导入建模样本数据,汕头局非居民客户25万户中2011年11月-2012年11月之间的欠费人数为1.8万户,占比7.2%,选取“坏客户”标准:非居民客户,一年之内有过2次及以上欠费的,并且累计欠费金额>5000元;汕头局非居民客户174万户中2011年11月-2012年11月之间的欠费人数为15.9万户,占比9.1%,选取“坏客户”标准:居民客户,一年之内有过3次及以上欠费的,并且累计欠费金额>200元。按用户号将预测变量(基本属性及历史行为属性)和目标变量(是否为坏客户)进行拼接,用于最终建模,其中历史行为属性变量取在表现期内,按3、6、12、24月分别加工:用电量、缴费金额、电量增长比例、用电量等级、短信催收次数、违约用电次数、扣款次数等;2、数据区分为训练、验证和测试集,25万非居民中,随机抽取40%样本用于建立模型,174万居民中,随机抽取10%样本用于建立模型,样本数据根据建模需要,通过分区,按40%,30%,30%拆分成训练集、验证集和测试集,训练集用于建立回归模型和计算回归系数,验证集对训练集所建立的模型结果进行验证和细微调整,测试集用于模型测试;3、统计各个变量的区分度和分段区间,运用R软件,直接计算出各字段与是否拨打咨询、投诉、建议停电之间的相关性,通过基尼统计量进行标识,并将最相关的几个变量选择为建模变量,将数据用EXCEL展示相关性,发现与样本客户有较强相关关系的属性字段有合同容量、城市/农村、缴费时长、缴费金额、缴费次数;4、运用回归算法建模,电费回收风险模型中,选择居民客户,一年之内有过3次及以上欠费的,并且累计欠费金额>200元的,非居民客户,一年之内有过2次及以上欠费的,并且累计欠费金额>5000元的,这些客户为电费回收高风险客户,将这些客户的目标变量设定为1,其余客户设定为0,用逻辑回归模型按每个预测变量的所有属性值,自动计算各属性的事件率并进行分组;发现非居民客户数据原始纯度为0.52%(25万非居民客户中,0.52万满足累计欠费金额5000以上且欠费次数2次及以上),采用逻辑回归后,前5%客户的纯度达到8.3%,提升度达到15.8倍,前1%客户的纯度达到27.5%(2491户中有686户满足坏客户条件);非居民客户数据原始纯度为2.7%(174万非居民客户中,4.7万满足累计欠费金额200以上且欠费次数3次及以上),采用逻辑回归后,前5%客户的纯度达到33.1%,提升度达到12.2倍;5、全体客户进行打分,应用逻辑回归公式对全量客户打分,之后对每个分群的敏感客户占比进行统计,发现全量客户中坏客户占比与验证集的比例接近,也就是模型具备较好的普适性,不存在“过拟合”的问题(即该模型对样本客户拟合非常好,但对非选定样本客户则拟合效果差);6、分群标准与业务验证,将电费风险分数从高到低进行排列,各地市局可以按照自己的服务资源,划分不同等级的客户风险度,高风险客户群主要集中在前5%,将前5%客户进一步细分,可以确定前1%的纯度非常高,因此建议分群方法为:前1%:高风险群,2~5%:次高风险群,后95%:低风险群。按照上述实施例,便可很好地实现本专利技术。本文档来自技高网...

【技术保护点】
一种基于大数据的电网用户电费回收模型构建方法,其特征在于:包括以下步骤:步骤一、导入建模样本数据;步骤二、数据区分为训练、验证和测试集;步骤三、统计各个变量的区分度和分段区间;步骤四、运用回归算法建模;步骤五、全体客户进行打分;步骤六、分群标准与业务验证。

【技术特征摘要】
1.一种基于大数据的电网用户电费回收模型构建方法,其特征在于:包括以下步骤:
步骤一、导入建模样本数据;
步骤二、数据区分为训练、验证和测试集;
步骤三、统计各个变量的区分度和分段区间;
步骤四、运用回归算法建模;
步骤五、全体客户进行打分;
步骤六、分群标准与业务验证。
2.如权利要求1所述,在出账后到缴费期截止之间,对潜在电费回收风险高的客户进行温馨提示,并结合...

【专利技术属性】
技术研发人员:李丽陈鹏唐彬
申请(专利权)人:广州铭诚计算机科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1