【技术实现步骤摘要】
一种基于梯度提升树的停电投诉风险预测方法
本专利技术涉及停电投诉风险预测
,特别是一种基于梯度提升树(Gradient-boostedtrees)的停电投诉风险预测方法。
技术介绍
当前,包括企业、个人等各类客户对于供电服务品质的期望值不断提高,对服务品质提出了更高的要求。而在现有技术中,供电企业大多无法对不同用户的停电敏感类型进行划分,以根据不同用户对停电的敏感程度采取不同的安抚和引导策略,从而带来大量的停电投诉,对企业形象造成负面影响,给企业的正常运营造成困扰,甚至衍生各类法律纠纷。
技术实现思路
本专利技术的目的在于提供一种基于梯度提升树的停电投诉风险预测方法,该方法有利于准确判别不同用户对停电的敏感程度,以据此采取不同的安抚和引导策略,减少用户的停电投诉量。为实现上述目的,本专利技术的技术方案是:一种基于梯度提升树的停电投诉风险预测方法,包括以下步骤:步骤A:建立用户用电信息表,用户用电信息表中包括用户信息、停电信息以及用户停电投诉信息;步骤B:对用户用电信息表中的用户用电信息数据集进行预处理;步骤C:采用Canopy算法、KMeans算法对用户用电信息 ...
【技术保护点】
一种基于梯度提升树的停电投诉风险预测方法,其特征在于,包括以下步骤:步骤A:建立用户用电信息表,用户用电信息表中包括用户信息、停电信息以及用户停电投诉信息;步骤B:对用户用电信息表中的用户用电信息数据集进行预处理;步骤C:采用
【技术特征摘要】
1.一种基于梯度提升树的停电投诉风险预测方法,其特征在于,包括以下步骤:步骤A:建立用户用电信息表,用户用电信息表中包括用户信息、停电信息以及用户停电投诉信息;步骤B:对用户用电信息表中的用户用电信息数据集进行预处理;步骤C:采用Canopy算法、KMeans算法对用户用电信息数据集进行聚类,通过客户画像分析对用户用电信息数据集进行敏感类别标记,然后通过基于SPARK的SMOTE过采样算法对不平衡分布的用户用电信息数据集进行数据处理,以提高分类准确性;步骤D:对步骤C处理后的用户用电信息数据集进行梯度提升树的训练,得到停电投诉风险模型;步骤E:运行步骤D得到的停电投诉风险模型,预测用户的停电敏感类别。2.根据权利要求1所述的一种基于梯度提升树的停电投诉风险预测方法,其特征在于,步骤B中对用户用电信息表中的用户用电信息数据集进行预处理,具体包括以下步骤:步骤B1:进行数据填充,在整个模型输入宽表中,对于枚举类型字段,采用默认值填充方式,即分别填充一个预先设定的默认类别;对于数值型字段,采用平均值填充法或零值填充法;步骤B2:进行异常值处理,对于异常值所占比例小于设定值的字段,采用直接删除含异常值记录的方法;对于异常值所占比例大于设定值的字段,采用基于箱型图的异常值检测方法;步骤B3:进行规范化处理,对于数值型字段,进行区间规范化,即根据公式(1)将数值归一化到[0,1]区间;对于取值全为0的特征项,不对该特征规范化,即保持原始值0;(1)其中Vnorm为规范化处理结果,Vinitial为特征原始值,Vmin为该特征项的最小值,Vmax为最大值;步骤B4:进行连续属性离散化,采用等宽法将具有连续属性的字段进行离散化,分为多个类别,即将连续属性的值域根据数据特点或设定分成具有相同宽度的区间,以便于类别分析。3.根据权利要求1所述的一种基于梯度提升树的停电投诉风险预测方法,其特征在于,步骤C中对用户用电信息数据集进行聚类和敏感类别标记,以及对不平衡分布的训练集数据进行处理,具体包括以下步骤:步骤C1:采用Canopy算法完成簇数K及初始簇中...
【专利技术属性】
技术研发人员:陈羽中,郭昆,郭文忠,陈培坤,
申请(专利权)人:福州大学,
类型:发明
国别省市:福建,35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。