一种电力大数据的电费风险模型构建方法技术

技术编号:22057063 阅读:54 留言:0更新日期:2019-09-07 15:53
本发明专利技术提出了一种电力大数据的电费风险模型构建方法,首先,从国网内部的营销系统获取当前用电用户的历史用电数据,然后,根据历史特征数据的召回率、精准率和F1度量值并利用逻辑回归算法构建电费风险模型,根据设定的阈值I和阈值II利用电费风险模型预测用电用户的风险等级,根据电费风险模型的输出结果和用户真实缴费情况对电费风险模型进行验证,并根据验证结果优化逻辑回归算法的参数。本发明专利技术根据用电用户的历史信息构建了电费风险模型,利用电费风险模型预测用电用户未来一个月是否欠费,并自动筛查用电用户的拖欠电费风险的高低,营销人员根据预测结果对风险用户采取及时的防控措施,节省了大量的人力、物力资源,有效的提高工作效率。

A Method to Construct Electricity Rate Risk Model with Big Data of Electricity

【技术实现步骤摘要】
一种电力大数据的电费风险模型构建方法
本专利技术涉及一种电费风险模型构建过程,特别一种电力大数据的电费风险模型构建方法。
技术介绍
电费回收工作是一项庞大的系统工程,电费回收的结果与供电企业经营成果息息相关,一直以来,电费回收都是电力营销的重点内容。供电企业拥有十分庞大的客户数量,但是每个用户的资信程度存在着很大的差别,用户的资信程度严重影响着其电费的缴纳状况。部分用电客户为了追求眼前的经济利益,存在故意拖欠电费、占用供电企业资金的情况,严重影响电力企业电费资金回收及其下一步的发展。现阶段电费回收的风险评价主要由人工来进行评估。有经验的电费回收人员会根据用电用户的历史缴费情况,利用一些统计工具进行分析,从而判断该用户是否存在拖欠电费的可能性。这种方法要求电费回收人员具有一定的背景经验,同时要熟悉不同用户的详细情况,需要一个较长时间的积累才能相对准确的判断用户拖欠电费的风险情况。因而,难以大规模的推广。随着用电用户的增加,以及用户用电环境的日益复杂,传统的方法已经无法应对当前局面,亟需一种客观、自动化的电费回收风险评估方法,该方法能够根据用电用户的历史信息自动评价其拖欠电费的风险情况,并对风险超过一定阈值的用户进行预警。
技术实现思路
针对传统电费回收方法存在的电费回收人员背景经验不同,造成对电费回收风险估计的差异性的技术问题,本专利技术提出了一种电力大数据的电费风险模型构建方法,提供一种客观、自动化的电费回收风险评估方法,能够给营销人员提前预警做好防控措施,从而使电费回收工作顺利进行。本专利技术的技术方案是这样实现的:一种电力大数据的电费风险模型构建方法,包括:S1、从国网内部的营销系统获取当前用电用户的历史特征数据;S2、根据历史特征数据的召回率、精准率和F1度量值并利用逻辑回归算法构建电费风险模型;S3、根据设定的阈值I和阈值II利用电费风险模型预测用电用户的风险等级;S4、根据电费风险模型的输出结果和用户真实缴费情况对电费风险模型进行验证,并根据验证结果优化逻辑回归算法的参数。优选地,所述用电用户的历史特征数据获取的方法为:S11、特征数据预处理:(1)特征数据清洗:从国网内部的营销系统获得特征数据后,对特征数据中的异常值和缺失值进行处理,异常值用数值“1”进行替换处理,缺失值用数值“0”进行补充处理;(2)特征数据格式转换:将特征数据中存在的文本型特征数据转换成数值型特征数据,并对类别型特征数据进行类别编码;S12、历史欠费行为相关性分析:(1)历史欠费行为相关性分析:搜集用户的历史特征数据,分析用户的欠费情况与历史缴费的相关性;(2)特征相关性分析:分析不同特征之间的相关性,查找与用户是否欠费相关性高的特征;S13、特征数据扩充:利用用电用户最近6个月内用电行为的信息对特征数据进行扩充,用户用电行为的信息包括特征数据的最大值、最小值、均值、方差和标准差;S14、特征重要度分析:特征数据扩充结束后,对特征数据进行标准化处理,并利用基尼指数计算每个特征数据的特征重要度。优选地,所述电费风险模型的构建包括风险用户的选择、特征数据的选择、训练集选择和算法选择四部分,具体实现过程为:S21、风险用户的选择:选择两年的数据作为观测目标,将数据中未欠过费的用电用户删除,将有过欠费记录的用电用户作为风险用户;S22、特征数据的选择:根据步骤S14中的特征重要度信息,依次删除特征重要度最低的特征进行实验,并将特征的召回率、精准率和F1度量值作为衡量标准,将实验结果最好的一组特征保存到特征集合中;S23、训练集选择:依次选择风险用户的不同周期内的用电数据进行实验,选择实验结果最好的一组用电数据作为训练集;S24、算法选择:从算法预测精度和算法运行时间分别对时间序列算法、神经网络算法、SVM算法、随机森林算法和逻辑回归算法进行比较,选择逻辑回归算法去构建电费风险模型。优选地,所述根据电费风险模型预测用电用户的风险等级的方法为:S31、风险等级划分:根据电费风险模型预测每个风险用户下个月欠费的概率,设置不同的阈值I将风险用户分为高风险用户、中风险用户和低风险用户;S32、对于同一风险等级的用户,设置一个阈值II,将用户分为欠费用户和不欠费用户;欠费概率大于或等于阈值II的用户即判断该用户在预测月份将会欠费,欠费概率小于阈值II的用户即判断该用户在预测月份将不会欠费。优选地,所述步骤S22中的召回率recall为预测正确的欠费用户占真实欠费用户的比例:所述精准率precision为预测正确的欠费个数占所有预测为欠费的用户的比例:所述度量值F1为召回率recall和精准率precision的调和平均数:其中,TP为真实欠费且预测结果也为欠费的个数,TN为真实不欠费且预测结果也为不欠费的个数,FN为真实欠费但是预测结果为不欠费的个数,FP为真实不欠费但是预测结果为欠费的个数。优选地,所述步骤S24中的逻辑回归算法的实现方法为:假设样本是{X,y},y的取值为0或1,y=0表示“不欠费,即用户及时缴纳了电费”,y=1表示“欠费,即用户未能及时交纳电费”,X为n维样本特征向量,X包含x1,x2,…,xn,假设样本X属于负类,则欠费的概率为:其中,g(x)=θ0+θ1x1+θ2x2+...θnxn,θ为回归系数,θ包含θ0,θ1,…,θn;回归系数θ的取值为:S24-1、初始化回归系数θ的值;S24-2、将回归系数θ代入公式(1)得到电费风险模型的输出值S24-3、根据公式(2)计算电费风险模型的输出值与数据实际值y之间的误差:S24-4、根据公式(3)对回归系数θi进行更新:其中,i=1,2,3,...,n,α为常数系数;S24-5、设定阈值t,判断是否成立,如果成立执行步骤S24-6,否则返回步骤S24-2;S24-6、输出回归系数θi的值,根据回归系数θi确定逻辑回归模型。本专利技术产生的有益效果:本专利技术根据用电用户的历史信息构建了电费风险模型,利用电费风险模型预测用电用户未来一个月是否欠费,并自动筛查用电用户的拖欠电费风险的高低,营销人员根据预测结果对风险用户采取及时的防控措施,节省了大量的人力、物力资源,有效的提高工作效率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术流程图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。如图1所示,一种电力大数据的电费风险模型构建方法,具体步骤如下:S1、从国网内部的营销系统获取当前用电用户的历史特征数据。所述获取用电用户的历史特征数据的方法为:S11、特征数据预处理:(1)特征数据清洗:从国网内部的营销系统获得特征数据后,对特征数据进行清洗;首先、用计算机程序输出每个特征数据的最大值和最小值,分析每个特征数据是否在正常范围内,并判断出特征本文档来自技高网...

【技术保护点】
1.一种电力大数据的电费风险模型构建方法,其特征在于,包括:S1、从国网内部的营销系统获取当前用电用户的历史特征数据;S2、根据历史特征数据的召回率、精准率和F1度量值并利用逻辑回归算法构建电费风险模型;S3、根据设定的阈值I和阈值II利用电费风险模型预测用电用户的风险等级;S4、根据电费风险模型的输出结果和用户真实缴费情况对电费风险模型进行验证,并根据验证结果优化逻辑回归算法的参数。

【技术特征摘要】
1.一种电力大数据的电费风险模型构建方法,其特征在于,包括:S1、从国网内部的营销系统获取当前用电用户的历史特征数据;S2、根据历史特征数据的召回率、精准率和F1度量值并利用逻辑回归算法构建电费风险模型;S3、根据设定的阈值I和阈值II利用电费风险模型预测用电用户的风险等级;S4、根据电费风险模型的输出结果和用户真实缴费情况对电费风险模型进行验证,并根据验证结果优化逻辑回归算法的参数。2.根据权利要求1所述的电力大数据的电费风险模型构建方法,其特征在于,所述用电用户的历史特征数据获取的方法为:S11、特征数据预处理:(1)特征数据清洗:从国网内部的营销系统获得特征数据后,对特征数据中的异常值和缺失值进行处理,异常值用数值“1”进行替换处理,缺失值用数值“0”进行补充处理;(2)特征数据格式转换:将特征数据中存在的文本型特征数据转换成数值型特征数据,并对类别型特征数据进行类别编码;S12、历史欠费行为相关性分析:(1)历史欠费行为相关性分析:搜集用户的历史特征数据,分析用户的欠费情况与历史缴费的相关性;(2)特征相关性分析:分析不同特征之间的相关性,查找与用户是否欠费相关性高的特征;S13、特征数据扩充:利用用电用户最近6个月内用电行为的信息对特征数据进行扩充,用户用电行为的信息包括特征数据的最大值、最小值、均值、方差和标准差;S14、特征重要度分析:特征数据扩充结束后,对特征数据进行标准化处理,并利用基尼指数计算每个特征数据的特征重要度。3.根据权利要求1或2所述的电力大数据的电费风险模型构建方法,其特征在于,所述电费风险模型的构建包括风险用户的选择、特征数据的选择、训练集选择和算法选择四部分,具体实现过程为:S21、风险用户的选择:选择两年的数据作为观测目标,将数据中未欠过费的用电用户删除,将有过欠费记录的用电用户作为风险用户;S22、特征数据的选择:根据步骤S14中的特征重要度信息,依次删除特征重要度最低的特征进行实验,并将特征的召回率、精准率和F1度量值作为衡量标准,将实验结果最好的一组特征保存到特征集合中;S23、训练集选择:依次选择风险用户的不同周期内的用电数据进行实验,选择实验结果最好的一组用电数据作为训练集;S24、算法选择:从算法预测精度和算法运行时间分别对时间序列算...

【专利技术属性】
技术研发人员:吴怀广马江涛尚松涛陶红伟胡宗山张明星石永生
申请(专利权)人:郑州轻工业学院
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1