【技术实现步骤摘要】
一种基于逻辑回归算法的电费风险防控模型构建方法
本专利技术涉及一种基于逻辑回归算法的电费风险防控模型构建方法,属于电力运营
技术介绍
近年来社会经济发展趋缓,电力公司电费回收压力日益增加,电费回收风险防控难度不断加大;缺乏一种能够对优劣客户进行科学客观的评价方法,进而无法对客户行为提出有效的鼓励或惩罚举措,无法针对性的实行“一户一策”,不利于供电企业权益的维护。
技术实现思路
针对现有技术的缺陷,本专利技术的目的在于提供一种基于客户用电直接行为与关联行为等数据,采用数据挖掘算法,计算输出事实风险客户与潜在风险客户,并分别给予风险评估,进而便于供电企业主动应对电费回收风险,确保电费回收风险可控、能控、在控,保障电费管理规范高效,便于实行“一户一策”,利于供电企业权益维护的基于逻辑回归算法的电费风险防控模型构建方法。为实现上述目的,本专利技术的技术方案为:一种基于逻辑回归算法的电费风险防控模型构建方法,具体包括以下步骤:第一步,数据采集通过营销系统及95598业务支持系统,收集客户基本属性、交费行为、用电行为、业务变更等信息数据;利用业务人员调研、基层访谈和其他外部系统等方式渠道,收集客户第三方信用信息、行业前景评价、生产经营状况、突发事件等外部信息数据;第二步,数据检验获取数据后,首先应对数据质量进行检验,包括:客户户号ID的唯一性检验,范围和取值检验,缺失值检验,异常值、离群值检验;第三步,数据处理数据处理主要包括对缺失值、 ...
【技术保护点】
1.一种基于逻辑回归算法的电费风险防控模型构建方法,其特征在于,具体包括以下步骤:/n第一步,数据采集/n收集客户基本属性、交费行为、用电行为、业务变更信息数据;利用业务人员调研、基层访谈和其他外部系统方式渠道,收集客户第三方信用信息、行业前景评价、生产经营状况、突发事件外部信息数据;/n第二步,数据检验/n获取数据后,首先应对数据质量进行检验,包括:客户户号ID的唯一性检验,范围和取值检验,缺失值检验,异常值、离群值检验;/n第三步,数据处理/n数据处理主要包括对缺失值、离群值、异常值记录进行清洗处理以及相关衍生变量的生成过程,具体顺序为:缺失值、离群值、异常值处理到衍生变量生成;/n第四步,模型构建/n电费风险防控模型是对客户能否按时、足额缴纳电费的评估,主要从客户信用、用电趋势、行业景气指数和突发事件四个维度考虑;/n客户信用维度主要从信用评价得分和信用变化趋势两方面设计指标;/n用电趋势维度围绕用电量、容量、交费方式三方面来设计指标;/n行业景气指数维度考虑行业景气度与行业景气度变化趋势指标;/n突发事件维度考察当前发生的社会重大事件;/n指标设计具体包括指标名称、计算规则、考 ...
【技术特征摘要】
1.一种基于逻辑回归算法的电费风险防控模型构建方法,其特征在于,具体包括以下步骤:
第一步,数据采集
收集客户基本属性、交费行为、用电行为、业务变更信息数据;利用业务人员调研、基层访谈和其他外部系统方式渠道,收集客户第三方信用信息、行业前景评价、生产经营状况、突发事件外部信息数据;
第二步,数据检验
获取数据后,首先应对数据质量进行检验,包括:客户户号ID的唯一性检验,范围和取值检验,缺失值检验,异常值、离群值检验;
第三步,数据处理
数据处理主要包括对缺失值、离群值、异常值记录进行清洗处理以及相关衍生变量的生成过程,具体顺序为:缺失值、离群值、异常值处理到衍生变量生成;
第四步,模型构建
电费风险防控模型是对客户能否按时、足额缴纳电费的评估,主要从客户信用、用电趋势、行业景气指数和突发事件四个维度考虑;
客户信用维度主要从信用评价得分和信用变化趋势两方面设计指标;
用电趋势维度围绕用电量、容量、交费方式三方面来设计指标;
行业景气指数维度考虑行业景气度与行业景气度变化趋势指标;
突发事件维度考察当前发生的社会重大事件;
指标设计具体包括指标名称、计算规则、考察期和评价规则的设计;
以客户信用、用电趋势和行业景气度三个维度下的指标为基础,利用逻辑回归算法对客户未来是否逾期交费进行评估预测;
第五步,模型输出
基于逻辑回归算法构建的电费风险防控模型,实现对高压高风险用户的命中率和覆盖率、低压非居高风险用户的命中率和覆盖率及低压居民高风险用户统计评估。
2.如权利要求1所述的一种基于逻辑回归算法的电费风险防控模型构建方法,其特征在于,
所述第一步,数据信息具体如下:
基本属性数据:客户户号、户名、客户分类、用电类别、行业分类、容量、催费短信是否订阅;
交费行为数据:电费发行日、实收日期、应收电费、交费截止日、违约金起算日、实收电费、交费方式;
用电行为数据:违约用电历史记录、不法窃电历史记录、用电量历史记录、信用评价历史记录;
关联信息数据:第三方信用信息、行业前景评价、生产经营状况、突发事件。
3.如权利要求1所述的一种基于逻辑回归算法的电费风险防控模型构建方法,其特征在于,
所述第二步,
(1)客户户号ID的唯一性检验:建模训练基础数据集中,每个客户为一条观测数据,因此每个户号ID变量应该仅出现一次,否则需要核查原因,调整数据;
(2)范围和取值检验:建模训练数据集中使用的每个变量都应该来自一个定义清晰、具有已知的或预期取值范围的字段;连续变量的值应该在一定的预期范围内,而名义变量应取维表中的值;
(3)缺失值检验:识别建模训练数据集中每个字段的缺失值及其来源是完整性检验中的基本步骤;缺失值的产生可能是失误的结果,也可能是因为制定的字段没有被定义;
(4)异常值、离群值检验:异常值是指明显偏离数据集的观测值,如过大、过小、负值数据;异常值可能是由于记录错误引起的,也可能是真实数据;因此要检验异常值出现的原因,并相应的处理异常值;离群值被定义为某个变量平均值正负3个标准差以外的数值。
4.如权利要求1所述的一种基于逻辑回归算法的电费风险防控模型构建方法,其特征在于,
所述第三步,
(1)离群值、异常值的处理方法
当出现以上情况时,离群值可用3个标准差的最大值或最小值替换,将离群值调整为距离最近的正常值;异常值要检验异常值出现的原因,并相应的处理异常值;如果离群值或异常值没有业务含义,可直接剔除离群值或异常值或用空值NULL来替代离群值或异常值;
(2)缺失值的处理方法
将缺失值调整为某个固定值;如均值、中间值或一...
【专利技术属性】
技术研发人员:裘炜浩,钟雨星,杨世旺,施焕健,潘红雨,金王英,王迎卜,陈钰莹,翟胜闻,毛晋凯,
申请(专利权)人:国网浙江省电力有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。