一种基于随机森林的电力客户诉求敏感度监督及预警方法技术

技术编号:25272359 阅读:34 留言:0更新日期:2020-08-14 23:05
本发明专利技术公开了一种基于随机森林的电力客户诉求敏感度监督及预警方法,S1、分别构建生产停电诉求和欠费停复电诉求的客户敏感度关联因素集;S2、抽取历史数据并滤除异常数据形成机器学习数据集合;S3、将所述机器学习数据集合划分为训练集和验证集;S4、基于所述训练集和验证集分别得到生产停电诉求和欠费停复电诉求的随机森林预测模型;S5、基于所述生产停电诉求和欠费停复电诉求的随机森林预测模型分别构建生产停电诉求和欠费停复电诉求的敏感度指数模型;S6、基于所述机器学习数据集合确定预警等级的敏感度指数界限;S7、开展客户诉求的预警等级预测。本发明专利技术进一步感知电力客户需求,提升电力服务质量。

【技术实现步骤摘要】
一种基于随机森林的电力客户诉求敏感度监督及预警方法
本专利技术涉及电力大数据与人工智能
,尤其涉及一种基于随机森林的电力客户诉求敏感度监督及预警方法。
技术介绍
大数据分析是指对大规模数据进行分析。大数据可以概括为5个V,数据量大(Volume)、速度快(Velocity)、类型多(Variety)、价值(Value)、真实性(Veracity)。电力大数据是能源变革中电力工业技术革新的必然过程,而不是简单的技术范畴。电力大数据不仅仅是技术进步,更是涉及整个电力系统在大数据时代下发展理念、管理体制和技术路线等方面的重大变革,是下一代智能化电力系统在大数据时代下价值形态的跃升。重塑电力核心价值和转变电力发展方式是电力大数据的两条核心主线。现有技术中,一般采用随机森林算法对停电诉求预测,但停电类型可以分为生产类停电和欠费停电,分别对应生产停电诉求和欠费停复电诉求,由于生产类停电主要非客户原因导致,而欠费停电存在部分客户原因,因此客户对两种不同类型停电的敏感度存在较大差异,因此不分类型对停电进行诉求预测的准确性有待提高。可以根据客户服务工单以及客户档案、费控电费余额等数据中得知客户服务诉求,不同停电类型导致客户服务诉求的关联因素不同,针对生产停电敏感的客户,会在所在台区发生故障停电期间,进行故障报修,所以将台区故障与客户故障报修进行关联融合;而对欠费停复电敏感的客户,在欠费停电期间,交费后会进行“复电登记”申请,所以将客户欠费停电后交费记录与“复电登记”服务申请进行关联融合。且现有技术中的预测结论仅包括可能投诉和不可能投诉两种结论,有待对预测结论做进一步的细化,以便进一步准确感知电力客户需求,提升电力服务质量,减少客户投诉的发生。
技术实现思路
(一)要解决的技术问题基于上述问题,本专利技术提供一种基于随机森林的电力客户诉求敏感度监督及预警方法,分别对生产停电和欠费停复电两种停电类型进行建模、预测,并对预测结果中的可能投诉进一步细化为中风险、中高风险和高风险,有利于进一步感知电力客户需求,提升电力服务质量。(二)技术方案基于上述的技术问题,本专利技术提供一种基于随机森林的电力客户诉求敏感度监督及预警方法,所述方法包括以下步骤:S1、分别构建生产停电诉求和欠费停复电诉求的客户敏感度关联因素集;S2、抽取历史数据、滤除异常数据、数据规范化形成机器学习数据集合:所述机器学习数据集合为标记是否发生生产停电投诉或欠费停复电投诉的与关联因素关联的规范化的有效的历史数据集合;S3、将所述机器学习数据集合划分为训练集和验证集:S4、基于所述训练集和验证集分别得到生产停电诉求和欠费停复电诉求的随机森林预测模型,分别输出是否生产停电投诉和是否欠费停复电投诉,并计算出各关联因素对对应预测结果影响的重要性占比;S5、基于所述生产停电诉求和欠费停复电诉求的随机森林预测模型分别构建生产停电诉求和欠费停复电诉求的敏感度指数模型:S5.1、对所述关联因素进行归一化处理,量化为0-1之间,得到每个关联因素的量化值;S5.2、对每个关联因素的量化值根据对应的所述每个关联因素的重要性占比进行加权求和,得到0-1之间的关联因素的敏感度指数;S6、基于所述机器学习数据集合确定预警等级的敏感度指数界限:基于所述机器学习数据集合,对于发生的生产停电投诉和欠费停复电投诉历史数据分别代入步骤S5计算对应的敏感度指数,并分别采用聚类分析的方法分为三类:中风险、中高风险和高风险,分别得到中风险、中高风险和高风险的生产停电诉求或欠费停复电诉求敏感度指数界限;S7、开展客户诉求的预警等级预测:基于客户服务实际情况,根据停电类型代入步骤S4对应的所述随机森林预测模型预测是否生产停电投诉和是否欠费停复电投诉,若为不可能生产停电投诉或不可能欠费停复电投诉,则记为低风险;若为可能生产停电投诉或可能欠费停复电投诉,则按步骤S5计算对应的敏感度指数,并根据步骤S6对应的敏感度指数界限判断预警等级为中风险、中高风险或高风险。优选地,步骤S1中的所述生产停电诉求的客户敏感度关联因素集的关联因素包括客户所属城市、客户呼叫次数、客户呼叫时间、客户报修次数、台区故障时间;所述欠费停复电诉求的客户敏感度关联因素集的关联因素包括客户所属城市、客户欠费信息、客户呼叫次数、客户呼叫时间、客户缴费信息、客户“复电登记”申请次数,客户欠费信息包括客户欠费金额、客户欠费起始时间、客户已欠费时间,客户缴费信息包括客户缴费金额、客户缴费起始时间、客户已缴费时间。进一步的,步骤S2中的所述关联是将客户属性表和客户投诉记录按客户编码进行关联。进一步的,步骤S2中的所述数据规范化具体为:将客户所属城市分别表示归一化处理,映射到[0,1]之间,将将客户呼叫次数、客户呼叫时间、客户报修次数、台区故障时间、客户“复电登记”申请次数、客户欠费金额、客户欠费起始时间、客户已欠费时间、客户缴费金额、客户缴费起始时间、客户已缴费时间等数值型字段分别通过(原始值-最小值)/(最大值-最小值)规范化为[0,1]之间。优选地,步骤S3中的所述训练集和验证集按1:1比例划分。进一步的,步骤S4包括以下步骤:S4.1、所述训练集数据样本为N,从中有放回地随机抽取容量相同的样本,形成训练子集;S4.2、抽样得到的所述训练子集有M个特征,所述特征即关联因素,对于是否生产停电投诉的特征包括客户所属城市、客户呼叫次数、客户呼叫时间、客户报修次数、台区故障时间,对于是否欠费停复电投诉的特征包括客户所属城市、客户欠费信息、客户呼叫次数、客户呼叫时间、客户缴费信息、客户“复电登记”申请次数,分别从中随机抽取m个作为分裂特征子集,m≤M,后续采用CART算法分裂而不剪枝;S4.3、重复n次步骤S4.1和S4.2,生成相应数量的n棵子树,分别构成两个随机森林预测模型,代入各子树,对各子树结果以多胜少的方式得到的结果即为所述随机森林预测模型的输出,分别输出是否生产停电投诉或是否欠费停复电投诉;S4.4、采用所述测试集数据样本分别验证两个随机森林模型的预测结果,评估预测结果,若预测结果满足应用需求,则进入步骤S4.5,否则调整模型参数,返回步骤S4.1;S4.5、计算两个随机森林模型的各特征对应的Gini指数,即每个再除以所有关联因素的重要性之和得到每个关联因素的重要性占比,其中,k表示数据集中类别的个数,pi表示第i个类别的样本数量占总样本的比例。本专利技术也公开了一种基于随机森林的电力客户诉求敏感度监督及预警系统,包括:至少一个处理器;以及与所述处理器通信连接的至少一个存储器,其中:所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行一种基于随机森林的电力客户诉求敏感度监督及预警方法。本专利技术也公开了一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行一种基于随机森林的电本文档来自技高网
...

【技术保护点】
1.一种基于随机森林的电力客户诉求敏感度监督及预警方法,其特征在于,所述方法包括以下步骤:/nS1、分别构建生产停电诉求和欠费停复电诉求的客户敏感度关联因素集;/nS2、抽取历史数据、滤除异常数据、数据规范化形成机器学习数据集合:所述机器学习数据集合为标记是否发生生产停电投诉或欠费停复电投诉的与关联因素关联的规范化的有效的历史数据集合;/nS3、将所述机器学习数据集合划分为训练集和验证集:/nS4、基于所述训练集和验证集分别得到生产停电诉求和欠费停复电诉求的随机森林预测模型,分别输出是否生产停电投诉和是否欠费停复电投诉,并计算出各关联因素对对应预测结果影响的重要性占比;/nS5、基于所述生产停电诉求和欠费停复电诉求的随机森林预测模型分别构建生产停电诉求和欠费停复电诉求的敏感度指数模型:/nS5.1、对所述关联因素进行归一化处理,量化为0-1之间,得到每个关联因素的量化值;/nS5.2、对每个关联因素的量化值根据对应的所述每个关联因素的重要性占比进行加权求和,得到0-1之间的关联因素的敏感度指数;/nS6、基于所述机器学习数据集合确定预警等级的敏感度指数界限:/n基于所述机器学习数据集合,对于发生的生产停电投诉和欠费停复电投诉历史数据分别代入步骤S5计算对应的敏感度指数,并分别采用聚类分析的方法分为三类:中风险、中高风险和高风险,分别得到中风险、中高风险和高风险的生产停电诉求或欠费停复电诉求敏感度指数界限;/nS7、开展客户诉求的预警等级预测:/n基于客户服务实际情况,根据停电类型代入步骤S4对应的所述随机森林预测模型预测是否生产停电投诉和是否欠费停复电投诉,若为不可能生产停电投诉或不可能欠费停复电投诉,则记为低风险;若为可能生产停电投诉或可能欠费停复电投诉,则按步骤S5计算对应的敏感度指数,并根据步骤S6对应的敏感度指数界限判断预警等级为中风险、中高风险或高风险。/n...

【技术特征摘要】
1.一种基于随机森林的电力客户诉求敏感度监督及预警方法,其特征在于,所述方法包括以下步骤:
S1、分别构建生产停电诉求和欠费停复电诉求的客户敏感度关联因素集;
S2、抽取历史数据、滤除异常数据、数据规范化形成机器学习数据集合:所述机器学习数据集合为标记是否发生生产停电投诉或欠费停复电投诉的与关联因素关联的规范化的有效的历史数据集合;
S3、将所述机器学习数据集合划分为训练集和验证集:
S4、基于所述训练集和验证集分别得到生产停电诉求和欠费停复电诉求的随机森林预测模型,分别输出是否生产停电投诉和是否欠费停复电投诉,并计算出各关联因素对对应预测结果影响的重要性占比;
S5、基于所述生产停电诉求和欠费停复电诉求的随机森林预测模型分别构建生产停电诉求和欠费停复电诉求的敏感度指数模型:
S5.1、对所述关联因素进行归一化处理,量化为0-1之间,得到每个关联因素的量化值;
S5.2、对每个关联因素的量化值根据对应的所述每个关联因素的重要性占比进行加权求和,得到0-1之间的关联因素的敏感度指数;
S6、基于所述机器学习数据集合确定预警等级的敏感度指数界限:
基于所述机器学习数据集合,对于发生的生产停电投诉和欠费停复电投诉历史数据分别代入步骤S5计算对应的敏感度指数,并分别采用聚类分析的方法分为三类:中风险、中高风险和高风险,分别得到中风险、中高风险和高风险的生产停电诉求或欠费停复电诉求敏感度指数界限;
S7、开展客户诉求的预警等级预测:
基于客户服务实际情况,根据停电类型代入步骤S4对应的所述随机森林预测模型预测是否生产停电投诉和是否欠费停复电投诉,若为不可能生产停电投诉或不可能欠费停复电投诉,则记为低风险;若为可能生产停电投诉或可能欠费停复电投诉,则按步骤S5计算对应的敏感度指数,并根据步骤S6对应的敏感度指数界限判断预警等级为中风险、中高风险或高风险。


2.根据权利要求1所述的一种基于随机森林的电力客户诉求敏感度监督及预警方法,其特征在于,步骤S1中的所述生产停电诉求的客户敏感度关联因素集的关联因素包括客户所属城市、客户呼叫次数、客户呼叫时间、客户报修次数、台区故障时间;
所述欠费停复电诉求的客户敏感度关联因素集的关联因素包括客户所属城市、客户欠费信息、客户呼叫次数、客户呼叫时间、客户缴费信息、客户“复电登记”申请次数,客户欠费信息包括客户欠费金额、客户欠费起始时间、客户已欠费时间,客户缴费信息包括客户缴费金额、客户缴费起始时间、客户已缴费时间。


3.根据权利要求1所述的一种基于随机森林的电力客户诉求敏感度监督及预警方法,其特征在于,步骤S2中的所述关联是将客户属性表和客户投诉记...

【专利技术属性】
技术研发人员:邹晟易洋谢小平鄢重叶志吴文娴何海零毛坚申浩平程莺王薇周滨王庭婷马斌易璐傅政军刘志泽罗鑫黄颖曾娟孙飞
申请(专利权)人:国网湖南省电力有限公司国网湖南省电力有限公司供电服务中心计量中心国家电网有限公司
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1