一种95598故障工单数预测方法技术

技术编号：24209047 阅读：28 留言：0更新日期：2020-05-20 15:59

本发明专利技术公开了一种95598故障工单数预测方法，包括使用过采样法选取若干种可能的采样倍率以生成n个不同的数据集；然后利用欠采样法分别剔除这n个数据集中的部分冗余多数类样本；再利用新生成的这n个数据集对应训练n个预测模型；对预测模型进行筛选，剔除带有错误倾向性的预测模型；通过余下的预测模型共同集成投票决定最终待定的故障工单数。该技术方案利用混合采样技术，对采样倍率的选取方式进行改进，并将预测模型的集成学习与数据集的重构技术相结合，利用多个较优的采样倍率进行组合提升来达到更好的采样效果，对95598故障工单数据进行处理，构造故障工单预测模型，从而提高预测模型的预测性能。

A prediction method of 95598 work orders

全部详细技术资料下载

【技术实现步骤摘要】
一种95598故障工单数预测方法
本专利技术涉及一种电力话务工单分析方法，尤其涉及一种95598故障工单数预测方法。
技术介绍
对于95598故障工单数预测是95598日常分析工作重点，亦是工作难点，历来都是依靠人工检阅数据、手工清理数据进行指标预测等方式，但是在现代信息化的社会，这种人工预测的方式已严重跟不上发展需求，分析模式单一、效率低下、及时性差且浪费人力资源。中国专利文献CN109784471A公开了一种“基于多预测模型的95598话务工单预测与异动预警方法”。采用了LSTM神经网络深度学习技术，通过建立科学的指标异动预测模型，研究各项指标的数理关系，实现短期话务工单置信异动预测与智能预警应用。本技术方案更高效、更精益、更智能地从大量指标中取得指标分析预警，提高客服指标分析与质量管控的工作效率。弥补传统曲线拟合建模需要定期模型修正的不足，支持在线实时动态学习预测与预警分析，提升日常指标的监控预警、问题定位、趋势预测能力。上述预测方法是建立在原始数据充足且平衡的前提下，但很多时候获得的原始数据是不平衡的，数据集的不平衡造成多数标准学习算法性能降低。因此，当处理复杂的不平衡数据集时，这些标准的预测算法得不到令人满意的分类效果。目前较多地利用采样法来重构不平衡数据集，采样法主要包括过采样法和欠采样法，两种方法各有优劣，当数据过度偏斜或者只有很少的少数类样本时，采用过采样和欠采样相结合的方法比较有效。在采样方法中所使用的采样倍率都是多数类样本数量与少数类样本数量的比值，目的在于通过采样使得各个类之间达...

【技术保护点】
1.一种95598故障工单数预测方法，其特征在于，包括以下步骤：/n(1)使用过采样法选取若干种可能的采样倍率以生成n个不同的数据集；/n(2)然后利用欠采样法分别剔除这n个数据集中的部分冗余多数类样本；/n(3)再利用新生成的这n个数据集对应训练n个预测模型；/n(4)对预测模型进行筛选，剔除带有错误倾向性的预测模型；/n(5)通过余下的预测模型共同集成投票决定最终待定的故障工单数。/n

【技术特征摘要】
1.一种95598故障工单数预测方法，其特征在于，包括以下步骤：
(1)使用过采样法选取若干种可能的采样倍率以生成n个不同的数据集；
(2)然后利用欠采样法分别剔除这n个数据集中的部分冗余多数类样本；
(3)再利用新生成的这n个数据集对应训练n个预测模型；
(4)对预测模型进行筛选，剔除带有错误倾向性的预测模型；
(5)通过余下的预测模型共同集成投票决定最终待定的故障工单数。

2.根据权利要求1所述的一种95598故障工单数预测方法，其特征在于，所述步骤(1)中的过采样法选用SMOTE法，所述SMOTE法为：采样最邻近算法，计算出每个少数类样本的K个近邻，从K个近邻中随机挑选N个样本进行随机线性插值，构造新的少数类样本，将新样本与原数据合成，产生新的训练集。

3.根据权利要求1所述的一种95598故障工单数预测方法，其特征在于，所述步骤(2)中的欠采样法选用单边选择法，所述单边选择法为：将多数类样本区分为噪声样本、边界样本和安全样本，把噪声样本和边界样本去掉，即分别剔除这若干个数据集中的部分冗余多数类样本。

【专利技术属性】
技术研发人员：王晓辉，李松琛，夏通，黎自若，周艳梅，付健艺，石哲方，朱好，吴雨涛，葛梦亮，孙研缤，杨嘹嘹，屈天天，叶吉超，程翔，
申请(专利权)人：国网浙江省电力有限公司丽水供电公司，国家电网有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人