一种95598故障工单数预测方法技术

技术编号:24209047 阅读:28 留言:0更新日期:2020-05-20 15:59
本发明专利技术公开了一种95598故障工单数预测方法,包括使用过采样法选取若干种可能的采样倍率以生成n个不同的数据集;然后利用欠采样法分别剔除这n个数据集中的部分冗余多数类样本;再利用新生成的这n个数据集对应训练n个预测模型;对预测模型进行筛选,剔除带有错误倾向性的预测模型;通过余下的预测模型共同集成投票决定最终待定的故障工单数。该技术方案利用混合采样技术,对采样倍率的选取方式进行改进,并将预测模型的集成学习与数据集的重构技术相结合,利用多个较优的采样倍率进行组合提升来达到更好的采样效果,对95598故障工单数据进行处理,构造故障工单预测模型,从而提高预测模型的预测性能。

A prediction method of 95598 work orders

【技术实现步骤摘要】
一种95598故障工单数预测方法
本专利技术涉及一种电力话务工单分析方法,尤其涉及一种95598故障工单数预测方法。
技术介绍
对于95598故障工单数预测是95598日常分析工作重点,亦是工作难点,历来都是依靠人工检阅数据、手工清理数据进行指标预测等方式,但是在现代信息化的社会,这种人工预测的方式已严重跟不上发展需求,分析模式单一、效率低下、及时性差且浪费人力资源。中国专利文献CN109784471A公开了一种“基于多预测模型的95598话务工单预测与异动预警方法”。采用了LSTM神经网络深度学习技术,通过建立科学的指标异动预测模型,研究各项指标的数理关系,实现短期话务工单置信异动预测与智能预警应用。本技术方案更高效、更精益、更智能地从大量指标中取得指标分析预警,提高客服指标分析与质量管控的工作效率。弥补传统曲线拟合建模需要定期模型修正的不足,支持在线实时动态学习预测与预警分析,提升日常指标的监控预警、问题定位、趋势预测能力。上述预测方法是建立在原始数据充足且平衡的前提下,但很多时候获得的原始数据是不平衡的,数据集的不平衡造成多数标准学习算法性能降低。因此,当处理复杂的不平衡数据集时,这些标准的预测算法得不到令人满意的分类效果。目前较多地利用采样法来重构不平衡数据集,采样法主要包括过采样法和欠采样法,两种方法各有优劣,当数据过度偏斜或者只有很少的少数类样本时,采用过采样和欠采样相结合的方法比较有效。在采样方法中所使用的采样倍率都是多数类样本数量与少数类样本数量的比值,目的在于通过采样使得各个类之间达到样本数量上的平衡,但由于每个不平衡数据集都有样本分布的独特性,因此没有一个固定的最佳采样倍率总能达到最好的采样效果。
技术实现思路
本专利技术主要解决原有的分析模式单一、效率低下且预测准确度对原始数据要求高的技术问题,提供一种95598故障工单数预测方法,利用混合采样技术,对采样倍率的选取方式进行改进,并将预测模型的集成学习与数据集的重构技术相结合,利用多个较优的采样倍率进行组合提升来达到更好的采样效果,对95598故障工单数据进行处理,构造故障工单预测模型,从而提高预测模型的预测性能。本专利技术的上述技术问题主要是通过下述技术方案得以解决的:本专利技术包括以下步骤:(1)使用过采样法选取若干种可能的采样倍率以生成n个不同的数据集;(2)然后利用欠采样法分别剔除这n个数据集中的部分冗余多数类样本;(3)再利用新生成的这n个数据集对应训练n个预测模型;(4)对预测模型进行筛选,剔除带有错误倾向性的预测模型;(5)通过余下的预测模型共同集成投票决定最终待定的故障工单数。作为优选,所述的步骤(1)中的过采样法选用SMOTE法,所述SMOTE法为:采样最邻近算法,计算出每个少数类样本的K个近邻,从K个近邻中随机挑选N个样本进行随机线性插值,构造新的少数类样本,将新样本与原数据合成,产生新的训练集。作为优选,所述的步骤(2)中的欠采样法选用单边选择法,所述单边选择法为:将多数类样本区分为噪声样本、边界样本和安全样本,把噪声样本和边界样本去掉,即分别剔除这若干个数据集中的部分冗余多数类样本。作为优选,所述的步骤(1)中对过采样法(例如SMOTE法)选取若干种可能的采样倍率:生成n+1个不同的数据集,其中n为选定参数。例如,n取10,则选取11种不同的倍率,分别是1:1.5,1:1.4,:1:1.3,…,1:0.9,1:0.8,1:0.5,每个采样倍率生成1个数据集,共产生11个数据集。作为优选,所述的步骤(3)中的给定N个训练样本(xi,ti),训练样本x的隐层输出表示为一个行向量h(x)=[h1(x),h2(x),…,hL(x)]。设H为隐层输出矩阵,β为输出权,T为目标故障工单数矩阵,其中计算βi=HiT(HiHiT)-1Ti,工单数oi=h(x)βi,作为优选,所述的步骤(4)中的筛选方式为:统计步骤(3)中n+1个模型预测的故障工单数,将故障工单数从小到大排列,剔除最高的10%和最低的10%对应的预测模型。避免带有错误倾向性的预测模型预测的故障工单数与真实故障工单数相差过大,影响最终的故障工单计算,导致最终预测结果不准确。作为优选,所述的步骤(4)中的最终待定的故障工单数为余下的预测模型预测的故障工单数的平均值。本专利技术的有益效果是:利用混合采样技术,对采样倍率的选取方式进行改进,并将预测模型的集成学习与数据集的重构技术相结合,利用多个较优的采样倍率进行组合提升来达到更好的采样效果,对95598故障工单数据进行处理,构造故障工单预测模型,从而提高预测模型的预测性能。具体实施方式下面通过实施例,对本专利技术的技术方案作进一步具体的说明。实施例:本实施例的一种95598故障工单数预测方法,包括以下步骤:(1)使用过采样法选取若干种可能的采样倍率以生成n个不同的数据集。过采样法选用SMOTE法:采样最邻近算法,计算出每个少数类样本的K个近邻,从K个近邻中随机挑选N个样本进行随机线性插值,构造新的少数类样本,将新样本与原数据合成,产生新的训练集。对过采样法(SMOTE法)选取若干种可能的采样倍率:生成n+1个不同的数据集,其中n为选定参数。(2)然后利用欠采样法分别剔除这n个数据集中的部分冗余多数类样本。欠采样法选用单边选择法:将多数类样本区分为噪声样本、边界样本和安全样本,把噪声样本和边界样本去掉,即分别剔除这若干个数据集中的部分冗余多数类样本。(3)再利用新生成的这n个数据集对应训练n个预测模型。给定N个训练样本(xi,ti),训练样本x的隐层输出表示为一个行向量h(x)=[h1(x),h2(x),…,hL(x)]。设H为隐层输出矩阵,β为输出权,T为目标故障工单数矩阵,其中计算βi=HiT(HiHiT)-1Ti,工单数oi=h(x)βi,(4)对预测模型进行筛选,剔除带有错误倾向性的预测模型。统计步骤(3)中n+1个模型预测的故障工单数,将故障工单数从小到大排列,剔除最高的10%和最低的10%对应的预测模型。(5)通过余下的预测模型共同集成投票决定最终待定的故障工单数。求余下的预测模型预测的故障工单数的平均值,该平均值为最终待定的故障工单数。本文档来自技高网
...

【技术保护点】
1.一种95598故障工单数预测方法,其特征在于,包括以下步骤:/n(1)使用过采样法选取若干种可能的采样倍率以生成n个不同的数据集;/n(2)然后利用欠采样法分别剔除这n个数据集中的部分冗余多数类样本;/n(3)再利用新生成的这n个数据集对应训练n个预测模型;/n(4)对预测模型进行筛选,剔除带有错误倾向性的预测模型;/n(5)通过余下的预测模型共同集成投票决定最终待定的故障工单数。/n

【技术特征摘要】
1.一种95598故障工单数预测方法,其特征在于,包括以下步骤:
(1)使用过采样法选取若干种可能的采样倍率以生成n个不同的数据集;
(2)然后利用欠采样法分别剔除这n个数据集中的部分冗余多数类样本;
(3)再利用新生成的这n个数据集对应训练n个预测模型;
(4)对预测模型进行筛选,剔除带有错误倾向性的预测模型;
(5)通过余下的预测模型共同集成投票决定最终待定的故障工单数。


2.根据权利要求1所述的一种95598故障工单数预测方法,其特征在于,所述步骤(1)中的过采样法选用SMOTE法,所述SMOTE法为:采样最邻近算法,计算出每个少数类样本的K个近邻,从K个近邻中随机挑选N个样本进行随机线性插值,构造新的少数类样本,将新样本与原数据合成,产生新的训练集。


3.根据权利要求1所述的一种95598故障工单数预测方法,其特征在于,所述步骤(2)中的欠采样法选用单边选择法,所述单边选择法为:将多数类样本区分为噪声样本、边界样本和安全样本,把噪声样本和边界样本去掉,即分别剔除这若干个数据集中的部分冗余多数类样本。

【专利技术属性】
技术研发人员:王晓辉李松琛夏通黎自若周艳梅付健艺石哲方朱好吴雨涛葛梦亮孙研缤杨嘹嘹屈天天叶吉超程翔
申请(专利权)人:国网浙江省电力有限公司丽水供电公司国家电网有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1