【技术实现步骤摘要】
一种基于随机森林的电力客户诉求敏感度监督及预警方法
本专利技术涉及电力大数据与人工智能
,尤其涉及一种基于随机森林的电力客户诉求敏感度监督及预警方法。
技术介绍
大数据分析是指对大规模数据进行分析。大数据可以概括为5个V,数据量大(Volume)、速度快(Velocity)、类型多(Variety)、价值(Value)、真实性(Veracity)。电力大数据是能源变革中电力工业技术革新的必然过程,而不是简单的技术范畴。电力大数据不仅仅是技术进步,更是涉及整个电力系统在大数据时代下发展理念、管理体制和技术路线等方面的重大变革,是下一代智能化电力系统在大数据时代下价值形态的跃升。重塑电力核心价值和转变电力发展方式是电力大数据的两条核心主线。现有技术中,一般采用随机森林算法对停电诉求预测,但停电类型可以分为生产类停电和欠费停电,分别对应生产停电诉求和欠费停复电诉求,由于生产类停电主要非客户原因导致,而欠费停电存在部分客户原因,因此客户对两种不同类型停电的敏感度存在较大差异,因此不分类型对停电进行诉求预测的准确性有待提高。可以根据客户服务工单以及客户档案、费控电费余额等数据中得知客户服务诉求,不同停电类型导致客户服务诉求的关联因素不同,针对生产停电敏感的客户,会在所在台区发生故障停电期间,进行故障报修,所以将台区故障与客户故障报修进行关联融合;而对欠费停复电敏感的客户,在欠费停电期间,交费后会进行“复电登记”申请,所以将客户欠费停电后交费记录与“复电登记”服务申请进行关联融合。且现有技术中的预测结论仅包 ...
【技术保护点】
1.一种基于随机森林的电力客户诉求敏感度监督及预警方法,其特征在于,所述方法包括以下步骤:/nS1、分别构建生产停电诉求和欠费停复电诉求的客户敏感度关联因素集;/nS2、抽取历史数据、滤除异常数据、数据规范化形成机器学习数据集合:所述机器学习数据集合为标记是否发生生产停电投诉或欠费停复电投诉的与关联因素关联的规范化的有效的历史数据集合;/nS3、将所述机器学习数据集合划分为训练集和验证集:/nS4、基于所述训练集和验证集分别得到生产停电诉求和欠费停复电诉求的随机森林预测模型,分别输出是否生产停电投诉和是否欠费停复电投诉,并计算出各关联因素对对应预测结果影响的重要性占比;/nS5、基于所述生产停电诉求和欠费停复电诉求的随机森林预测模型分别构建生产停电诉求和欠费停复电诉求的敏感度指数模型:/nS5.1、对所述关联因素进行归一化处理,量化为0-1之间,得到每个关联因素的量化值;/nS5.2、对每个关联因素的量化值根据对应的所述每个关联因素的重要性占比进行加权求和,得到0-1之间的关联因素的敏感度指数;/nS6、基于所述机器学习数据集合确定预警等级的敏感度指数界限:/n基于所述机器学习数据集合 ...
【技术特征摘要】
1.一种基于随机森林的电力客户诉求敏感度监督及预警方法,其特征在于,所述方法包括以下步骤:
S1、分别构建生产停电诉求和欠费停复电诉求的客户敏感度关联因素集;
S2、抽取历史数据、滤除异常数据、数据规范化形成机器学习数据集合:所述机器学习数据集合为标记是否发生生产停电投诉或欠费停复电投诉的与关联因素关联的规范化的有效的历史数据集合;
S3、将所述机器学习数据集合划分为训练集和验证集:
S4、基于所述训练集和验证集分别得到生产停电诉求和欠费停复电诉求的随机森林预测模型,分别输出是否生产停电投诉和是否欠费停复电投诉,并计算出各关联因素对对应预测结果影响的重要性占比;
S5、基于所述生产停电诉求和欠费停复电诉求的随机森林预测模型分别构建生产停电诉求和欠费停复电诉求的敏感度指数模型:
S5.1、对所述关联因素进行归一化处理,量化为0-1之间,得到每个关联因素的量化值;
S5.2、对每个关联因素的量化值根据对应的所述每个关联因素的重要性占比进行加权求和,得到0-1之间的关联因素的敏感度指数;
S6、基于所述机器学习数据集合确定预警等级的敏感度指数界限:
基于所述机器学习数据集合,对于发生的生产停电投诉和欠费停复电投诉历史数据分别代入步骤S5计算对应的敏感度指数,并分别采用聚类分析的方法分为三类:中风险、中高风险和高风险,分别得到中风险、中高风险和高风险的生产停电诉求或欠费停复电诉求敏感度指数界限;
S7、开展客户诉求的预警等级预测:
基于客户服务实际情况,根据停电类型代入步骤S4对应的所述随机森林预测模型预测是否生产停电投诉和是否欠费停复电投诉,若为不可能生产停电投诉或不可能欠费停复电投诉,则记为低风险;若为可能生产停电投诉或可能欠费停复电投诉,则按步骤S5计算对应的敏感度指数,并根据步骤S6对应的敏感度指数界限判断预警等级为中风险、中高风险或高风险。
2.根据权利要求1所述的一种基于随机森林的电力客户诉求敏感度监督及预警方法,其特征在于,步骤S1中的所述生产停电诉求的客户敏感度关联因素集的关联因素包括客户所属城市、客户呼叫次数、客户呼叫时间、客户报修次数、台区故障时间;
所述欠费停复电诉求的客户敏感度关联因素集的关联因素包括客户所属城市、客户欠费信息、客户呼叫次数、客户呼叫时间、客户缴费信息、客户“复电登记”申请次数,客户欠费信息包括客户欠费金额、客户欠费起始时间、客户已欠费时间,客户缴费信息包括客户缴费金额、客户缴费起始时间、客户已缴费时间。
3.根据权利要求1所述的一种基于随机森林的电力客户诉求敏感度监督及预警方法,其特征在于,步骤S2中的所述关联是将客户属性表和客户投诉记...
【专利技术属性】
技术研发人员:邹晟,易洋,谢小平,鄢重,叶志,吴文娴,何海零,毛坚,申浩平,程莺,王薇,周滨,王庭婷,马斌,易璐,傅政军,刘志泽,罗鑫,黄颖,曾娟,孙飞,
申请(专利权)人:国网湖南省电力有限公司,国网湖南省电力有限公司供电服务中心计量中心,国家电网有限公司,
类型:发明
国别省市:湖南;43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。