一种工单投诉风险预控方法技术

技术编号:32546638 阅读:20 留言:0更新日期:2022-03-05 11:45
本发明专利技术涉及风险控制,具体涉及一种工单投诉风险预控方法,输入训练数据集和测试数据集,检测数据分布情况并统计信息,同时对数据进行预处理,对变量进行筛选,删除对回归模型影响不显著或自相关性较强的变量,利用卡方方法对变量进行分箱,对变量进行WOE转化,并判断变量的稳定性,建立回归模型,利用训练数据集和测试数据集评价回归模型的准确性,将回归模型转换为标准评分卡,并输出各变量分箱后的分数;本发明专利技术提供的技术方案能够有效克服现有技术所存在的根据工单内容不能区别客户的敏感性,导致不能向客户提供具有针对性差异化服务的缺陷。的缺陷。的缺陷。

【技术实现步骤摘要】
一种工单投诉风险预控方法


[0001]本专利技术涉及风险控制,具体涉及一种工单投诉风险预控方法。

技术介绍

[0002]电网用于向用户供电,其承担着向用户进行安全可靠供电的重要任务。因此,及时派发电网检修工单并及时有效地进行处理,成为提高配电网检修效率及供电可靠性的重要因素。其中,电网检修工单是指电网发生故障后,国家电网客服系统根据用户所提供故障信息生成的,最终被派发至各地区相应驻点的运维人员手中,用于指导和记录故障处理的单据。
[0003]随着国家电网客服业务的不断发展,以及逐渐提升的人工话务强度,为了进一步加强对用户隐性特征及诉求的理解与分析,提升国家电网客服系统的服务水平,需要对客户需求及典型场景下的需求进行有效分析,从而实现对敏感用户的需求进行预测并提供更加贴心服务的目的。

技术实现思路

[0004](一)解决的技术问题
[0005]针对现有技术所存在的上述缺点,本专利技术提供了一种工单投诉风险预控方法,能够有效克服现有技术所存在的根据工单内容不能区别客户的敏感性,导致不能向客户提供具有针对性差异化服务的缺陷。
[0006](二)技术方案
[0007]为实现以上目的,本专利技术通过以下技术方案予以实现:
[0008]一种工单投诉风险预控方法,包括以下步骤:
[0009]S1、输入训练数据集和测试数据集,检测数据分布情况并统计信息,同时对数据进行预处理;
[0010]S2、对变量进行筛选,删除对回归模型影响不显著或自相关性较强的变量;/>[0011]S3、利用卡方方法对变量进行分箱,对变量进行WOE转化,并判断变量的稳定性;
[0012]S4、建立回归模型,利用训练数据集和测试数据集评价回归模型的准确性;
[0013]S5、将回归模型转换为标准评分卡,并输出各变量分箱后的分数。
[0014]优选地,S1中检测数据分布情况并统计信息,同时对数据进行预处理,包括:
[0015]统计数据的缺失比例、最大值、最小值相关信息,确定各字段的长度、类型,将存在异常数据的字段处理为正常数据。
[0016]优选地,S2中对变量进行筛选,删除对回归模型影响不显著或自相关性较强的变量,包括:
[0017]计算每个变量的信息价值,根据信息价值和变量间自相关性对变量进行筛选,并结合逐步回归删除对回归模型影响不显著或自相关性较强的变量。
[0018]优选地,所述根据信息价值和变量间自相关性对变量进行筛选,包括:
[0019]保留信息价值大于0.01且变量间自相关性系数大于0.7的变量。
[0020]优选地,S3中利用卡方方法对变量进行分箱,包括:
[0021]分箱后观察分箱结果,当分箱结果不理想时进行手动调整分箱。
[0022]优选地,S3中对变量进行WOE转化,包括:
[0023]采用下式对变量进行WOE转化:
[0024][0025]其中,i为某个特征的第i个分箱,Bad
i
为在第i个分箱中坏标签的数量,Bad
T
为坏标签的总数,Good
i
为在第i个分箱中好标签的数量,Good
T
为好标签的总数。
[0026]优选地,S3中判断变量的稳定性,包括:
[0027]计算每列特征的PSI值,并基于PSI值判断变量的稳定性。
[0028]优选地,S4中建立回归模型,利用训练数据集和测试数据集评价回归模型的准确性,包括:
[0029]利用logistic回归建立回归模型,并对训练数据集和测试数据集进行预测,分别计算两个数据集的KS值和AUC值,评价回归模型的准确性。
[0030](三)有益效果
[0031]与现有技术相比,本专利技术所提供的一种工单投诉风险预控方法,基于电力服务工单系统的数据,通过变量筛选及逻辑回归建模,建立各变量的评分卡模型,科学地评价每一个字段的不同区间属性对用户敏感性的解释程度,针对新客户及新工单都有很好的解释及预测能力,从而能够对每个用户的敏感性进行打分与识别,以便针对性地进行服务资源分配及调度、面对突发情况及时做好应对措施,有助于减少工单投诉压力,最终有效提升服务质量。
附图说明
[0032]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0033]图1为本专利技术的流程示意图。
具体实施方式
[0034]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0035]一种工单投诉风险预控方法,如图1所示,输入训练数据集和测试数据集,检测数据分布情况并统计信息,同时对数据进行预处理。
[0036]其中,检测数据分布情况并统计信息,同时对数据进行预处理,包括:
[0037]统计数据的缺失比例、最大值、最小值相关信息,确定各字段的长度、类型,将存在
异常数据(异常值/缺失值)的字段处理为正常数据。
[0038]本申请技术方案中,将电力服务工单系统的数据以4:1的比例分为训练数据集、测试数据集,其中训练数据集负责训练模型,测试数据集负责测试训练后模型的拟合效果。
[0039]对变量进行筛选,删除对回归模型影响不显著或自相关性较强的变量,具体包括:
[0040]计算每个变量的信息价值,根据信息价值和变量间自相关性对变量进行筛选,保留信息价值大于0.01且变量间自相关性系数大于0.7的变量,并结合逐步回归(双向)删除对回归模型影响不显著或自相关性较强的变量。
[0041]本申请技术方案中,信息价值(即IV值)用来衡量变量的预测能力,IV值越大,表示该变量的预测能力越强。
[0042]利用卡方方法对变量进行分箱,对变量进行WOE转化,并判断变量的稳定性。
[0043]①
利用卡方方法对变量进行分箱,包括:
[0044]分箱后观察分箱结果,当分箱结果不理想时进行手动调整分箱。
[0045]②
对变量进行WOE转化(即证据权重),包括:
[0046]采用下式对变量进行WOE转化:
[0047][0048]其中,i为某个特征的第i个分箱,Bad
i
为在第i个分箱中坏标签的数量,Bad
T
为坏标签的总数,Good
i
为在第i个分箱中好标签的数量,Good
T
为好标签的总数。
[0049]WO本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种工单投诉风险预控方法,其特征在于:包括以下步骤:S1、输入训练数据集和测试数据集,检测数据分布情况并统计信息,同时对数据进行预处理;S2、对变量进行筛选,删除对回归模型影响不显著或自相关性较强的变量;S3、利用卡方方法对变量进行分箱,对变量进行WOE转化,并判断变量的稳定性;S4、建立回归模型,利用训练数据集和测试数据集评价回归模型的准确性;S5、将回归模型转换为标准评分卡,并输出各变量分箱后的分数。2.根据权利要求1所述的工单投诉风险预控方法,其特征在于:S1中检测数据分布情况并统计信息,同时对数据进行预处理,包括:统计数据的缺失比例、最大值、最小值相关信息,确定各字段的长度、类型,将存在异常数据的字段处理为正常数据。3.根据权利要求1所述的工单投诉风险预控方法,其特征在于:S2中对变量进行筛选,删除对回归模型影响不显著或自相关性较强的变量,包括:计算每个变量的信息价值,根据信息价值和变量间自相关性对变量进行筛选,并结合逐步回归删除对回归模型影响不显著或自相关性较强的变量。4.根据权利要求3所述的工单投诉风险预控方法,其特征在于:所述根据信息价值和变量间自相关性对变量进行筛选,包括:保留信息价值...

【专利技术属性】
技术研发人员:刘峰罗玉
申请(专利权)人:安徽数升数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1