一种基于逻辑回归算法的电费风险防控模型构建方法技术

技术编号:24094431 阅读:59 留言:0更新日期:2020-05-09 09:36
本发明专利技术公开了一种基于逻辑回归算法的电费风险防控模型构建方法,属于电力运营技术领域。现有技术不能够对优劣客户进行科学客观的评价方法,进而无法对客户行为提出有效的鼓励或惩罚举措,无法针对性的实行“一户一策”,不利于供电企业权益的维护。本发明专利技术提供一种基于客户用电直接行为与关联行为等数据,采用数据挖掘算法,计算输出事实风险客户与潜在风险客户,并分别给予风险评估,进而便于供电企业主动应对电费回收风险,确保电费回收风险可控、能控、在控,保障电费管理规范高效,便于实行“一户一策”,利于供电企业权益的维护,方案切实可行,便于编程实现。

A construction method of risk prevention and control model of electric charge based on logic regression algorithm

【技术实现步骤摘要】
一种基于逻辑回归算法的电费风险防控模型构建方法
本专利技术涉及一种基于逻辑回归算法的电费风险防控模型构建方法,属于电力运营

技术介绍
近年来社会经济发展趋缓,电力公司电费回收压力日益增加,电费回收风险防控难度不断加大;缺乏一种能够对优劣客户进行科学客观的评价方法,进而无法对客户行为提出有效的鼓励或惩罚举措,无法针对性的实行“一户一策”,不利于供电企业权益的维护。
技术实现思路
针对现有技术的缺陷,本专利技术的目的在于提供一种基于客户用电直接行为与关联行为等数据,采用数据挖掘算法,计算输出事实风险客户与潜在风险客户,并分别给予风险评估,进而便于供电企业主动应对电费回收风险,确保电费回收风险可控、能控、在控,保障电费管理规范高效,便于实行“一户一策”,利于供电企业权益维护的基于逻辑回归算法的电费风险防控模型构建方法。为实现上述目的,本专利技术的技术方案为:一种基于逻辑回归算法的电费风险防控模型构建方法,具体包括以下步骤:第一步,数据采集通过营销系统及95598业务支持系统,收集客户基本属性、交费行为、用电行为、业务变更等信息数据;利用业务人员调研、基层访谈和其他外部系统等方式渠道,收集客户第三方信用信息、行业前景评价、生产经营状况、突发事件等外部信息数据;第二步,数据检验获取数据后,首先应对数据质量进行检验,包括:客户户号ID的唯一性检验,范围和取值检验,缺失值检验,异常值、离群值检验;第三步,数据处理数据处理主要包括对缺失值、离群值、异常值等记录进行清洗处理以及相关衍生变量的生成过程,具体顺序为:缺失值、离群值、异常值处理到衍生变量生成;第四步,模型构建电费风险防控模型是对客户能否按时、足额缴纳电费的评估,主要从客户信用、用电趋势、行业景气指数和突发事件四个维度考虑;客户信用维度主要从信用评价得分和信用变化趋势两方面设计指标;用电趋势维度围绕用电量、容量、交费方式三方面来设计指标;行业景气指数维度考虑行业景气度与行业景气度变化趋势指标;突发事件维度考察当前发生的社会重大事件;指标设计具体包括指标名称、计算规则、考察期和评价规则的设计;以客户信用、用电趋势和行业景气度三个维度下的指标为基础,利用逻辑回归算法对客户未来是否逾期交费进行评估预测;由于电力客户数量庞大,客户基本信息、用电趋势数据量非常大,因此电费风险防控模型优先考虑简单并且并行处理速度较快的算法;同时考虑到要将逾期交费风险划分等级,因此电费风险防控模型优先考虑输出结果易于解释的,且容易划分等级的算法;为此基于上述两点并结合以往历史经验,对细分用电类别市场的逾期交费风险评估,优先采用逻辑回归logistic算法;第五步,模型输出基于逻辑回归算法构建的电费风险防控模型,实现对高压高风险用户的命中率和覆盖率、低压非居高风险用户的命中率和覆盖率及低压居民高风险用户统计评估。本专利技术提供一种基于客户用电直接行为与关联行为等数据,采用数据挖掘算法,计算输出事实风险客户与潜在风险客户,并分别给予风险评估,进而便于供电企业主动应对电费回收风险,确保电费回收风险可控、能控、在控,保障电费管理规范高效,便于实行“一户一策”,利于供电企业权益的维护,方案切实可行,便于编程实现。作为优选技术措施:所述第一步,数据信息具体如下:基本属性数据:客户户号、户名、客户分类、用电类别、行业分类、容量、催费短信是否订阅;交费行为数据:电费发行日、实收日期、应收电费、交费截止日、违约金起算日、实收电费、交费方式;用电行为数据:违约用电历史记录、不法窃电历史记录、用电量历史记录、信用评价历史记录;关联信息数据:第三方信用信息、行业前景评价、生产经营状况、突发事件。作为优选技术措施:所述第二步,(1)客户户号ID的唯一性检验:建模训练基础数据集中,每个客户为一条观测数据,因此每个户号ID变量应该仅出现一次,否则需要核查原因,调整数据;(2)范围和取值检验:建模训练数据集中使用的每个变量都应该来自一个定义清晰、具有已知的或预期取值范围的字段;连续变量的值应该在一定的预期范围内,而名义变量应取维表中的值;(3)缺失值检验:识别建模训练数据集中每个字段的缺失值及其来源是完整性检验中的基本步骤;缺失值的产生可能是失误的结果,也可能是因为制定的字段没有被定义;(4)异常值、离群值检验:异常值是指明显偏离数据集的观测值,如过大、过小、负值数据;异常值可能是由于记录错误引起的,也可能是真实数据;因此要检验异常值出现的原因,并相应的处理异常值;离群值被定义为某个变量平均值正负3个标准差以外的数值。作为优选技术措施:所述第三步,(1)离群值、异常值的处理方法当出现以上情况时,离群值可用3个标准差的最大值或最小值替换,将离群值调整为距离最近的正常值;异常值要检验异常值出现的原因,并相应的处理异常值;如果离群值或异常值没有业务含义,可直接剔除离群值或异常值或用空值NULL来替代离群值或异常值;(2)缺失值的处理方法将缺失值调整为某个固定值;如均值、中间值或一个指定的常数或将缺失值调整为一个服从正态分布的随机值;(3)按户进行数据整合对于一个客户一笔应收电费存在多个电费、罚金记录的,按客户编号按应收电费标识汇总合并;对于一个客户一笔应收电费存在多个实收日的,保留该应收电费最后一次实收日;(4)相关衍生变量的生成衍生变量是服务模型建设的变量,基于数理分析中心数据处理模块的变量计算功能生成与电费风险防控主题相关的各衍生变量。作为优选技术措施:所述步骤四,客户信用指标设计信用风险是客户未能履行约定义务而造成经济损失的风险;信用越高则欠费风险概率越低,反之则越高;客户信用是电费风险评估模型的首要指标,客户信用指标具体包括客户信用评价得分和客户信用变化趋势;指标考察期与评价规则设计:客户信用评价得分指标是对信用历史表现情况的综合评价,欠费风险概率预测对本期信用评价结果最为敏感,故该指标的考察期设置为本期即当前月份;信用变化趋势指标通过增长、平稳、波动和下降来考察客户近六个月信用评价得分的变化情况,并分别赋值为1,0,-1和-2。作为优选技术措施:所述步骤四,用电趋势指标设计用电趋势是客户在用电行为方面的趋势动向;用电平稳或者趋好则欠费风险概率越低,反之则越高;用电趋势是影响电费风险评估的重要指标,用电趋势主要包括现金交费次数占比、用电量变化趋势、容量变化趋势等指标;指标考察期与评价规则设计:考察期较短可能受到偶然因素或生产周期的影响,较长则时效性不足,综合来看,现金交费次数占比、用电量变化趋势和容量变化趋势指标的考察期设置为6个月是比较合适的;现金交费次数占比为0到100%之间的比例值,用电量变化趋势和容量变化趋势则通过增长、本文档来自技高网...

【技术保护点】
1.一种基于逻辑回归算法的电费风险防控模型构建方法,其特征在于,具体包括以下步骤:/n第一步,数据采集/n收集客户基本属性、交费行为、用电行为、业务变更信息数据;利用业务人员调研、基层访谈和其他外部系统方式渠道,收集客户第三方信用信息、行业前景评价、生产经营状况、突发事件外部信息数据;/n第二步,数据检验/n获取数据后,首先应对数据质量进行检验,包括:客户户号ID的唯一性检验,范围和取值检验,缺失值检验,异常值、离群值检验;/n第三步,数据处理/n数据处理主要包括对缺失值、离群值、异常值记录进行清洗处理以及相关衍生变量的生成过程,具体顺序为:缺失值、离群值、异常值处理到衍生变量生成;/n第四步,模型构建/n电费风险防控模型是对客户能否按时、足额缴纳电费的评估,主要从客户信用、用电趋势、行业景气指数和突发事件四个维度考虑;/n客户信用维度主要从信用评价得分和信用变化趋势两方面设计指标;/n用电趋势维度围绕用电量、容量、交费方式三方面来设计指标;/n行业景气指数维度考虑行业景气度与行业景气度变化趋势指标;/n突发事件维度考察当前发生的社会重大事件;/n指标设计具体包括指标名称、计算规则、考察期和评价规则的设计;/n以客户信用、用电趋势和行业景气度三个维度下的指标为基础,利用逻辑回归算法对客户未来是否逾期交费进行评估预测;/n第五步,模型输出/n基于逻辑回归算法构建的电费风险防控模型,实现对高压高风险用户的命中率和覆盖率、低压非居高风险用户的命中率和覆盖率及低压居民高风险用户统计评估。/n...

【技术特征摘要】
1.一种基于逻辑回归算法的电费风险防控模型构建方法,其特征在于,具体包括以下步骤:
第一步,数据采集
收集客户基本属性、交费行为、用电行为、业务变更信息数据;利用业务人员调研、基层访谈和其他外部系统方式渠道,收集客户第三方信用信息、行业前景评价、生产经营状况、突发事件外部信息数据;
第二步,数据检验
获取数据后,首先应对数据质量进行检验,包括:客户户号ID的唯一性检验,范围和取值检验,缺失值检验,异常值、离群值检验;
第三步,数据处理
数据处理主要包括对缺失值、离群值、异常值记录进行清洗处理以及相关衍生变量的生成过程,具体顺序为:缺失值、离群值、异常值处理到衍生变量生成;
第四步,模型构建
电费风险防控模型是对客户能否按时、足额缴纳电费的评估,主要从客户信用、用电趋势、行业景气指数和突发事件四个维度考虑;
客户信用维度主要从信用评价得分和信用变化趋势两方面设计指标;
用电趋势维度围绕用电量、容量、交费方式三方面来设计指标;
行业景气指数维度考虑行业景气度与行业景气度变化趋势指标;
突发事件维度考察当前发生的社会重大事件;
指标设计具体包括指标名称、计算规则、考察期和评价规则的设计;
以客户信用、用电趋势和行业景气度三个维度下的指标为基础,利用逻辑回归算法对客户未来是否逾期交费进行评估预测;
第五步,模型输出
基于逻辑回归算法构建的电费风险防控模型,实现对高压高风险用户的命中率和覆盖率、低压非居高风险用户的命中率和覆盖率及低压居民高风险用户统计评估。


2.如权利要求1所述的一种基于逻辑回归算法的电费风险防控模型构建方法,其特征在于,
所述第一步,数据信息具体如下:
基本属性数据:客户户号、户名、客户分类、用电类别、行业分类、容量、催费短信是否订阅;
交费行为数据:电费发行日、实收日期、应收电费、交费截止日、违约金起算日、实收电费、交费方式;
用电行为数据:违约用电历史记录、不法窃电历史记录、用电量历史记录、信用评价历史记录;
关联信息数据:第三方信用信息、行业前景评价、生产经营状况、突发事件。


3.如权利要求1所述的一种基于逻辑回归算法的电费风险防控模型构建方法,其特征在于,
所述第二步,
(1)客户户号ID的唯一性检验:建模训练基础数据集中,每个客户为一条观测数据,因此每个户号ID变量应该仅出现一次,否则需要核查原因,调整数据;
(2)范围和取值检验:建模训练数据集中使用的每个变量都应该来自一个定义清晰、具有已知的或预期取值范围的字段;连续变量的值应该在一定的预期范围内,而名义变量应取维表中的值;
(3)缺失值检验:识别建模训练数据集中每个字段的缺失值及其来源是完整性检验中的基本步骤;缺失值的产生可能是失误的结果,也可能是因为制定的字段没有被定义;
(4)异常值、离群值检验:异常值是指明显偏离数据集的观测值,如过大、过小、负值数据;异常值可能是由于记录错误引起的,也可能是真实数据;因此要检验异常值出现的原因,并相应的处理异常值;离群值被定义为某个变量平均值正负3个标准差以外的数值。


4.如权利要求1所述的一种基于逻辑回归算法的电费风险防控模型构建方法,其特征在于,
所述第三步,
(1)离群值、异常值的处理方法
当出现以上情况时,离群值可用3个标准差的最大值或最小值替换,将离群值调整为距离最近的正常值;异常值要检验异常值出现的原因,并相应的处理异常值;如果离群值或异常值没有业务含义,可直接剔除离群值或异常值或用空值NULL来替代离群值或异常值;
(2)缺失值的处理方法
将缺失值调整为某个固定值;如均值、中间值或一...

【专利技术属性】
技术研发人员:裘炜浩钟雨星杨世旺施焕健潘红雨金王英王迎卜陈钰莹翟胜闻毛晋凯
申请(专利权)人:国网浙江省电力有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1