基于自然邻居过采样的系统缺陷预测方法、装置及设备制造方法及图纸

技术编号:40321950 阅读:34 留言:0更新日期:2024-02-09 14:17
本发明专利技术提供了基于自然邻居过采样的系统缺陷预测方法、装置及设备,方法包括:基于系统历史数据构建系统缺陷数据集;对系统缺陷数据集进行数据处理和转换;对预处理后的系统缺陷数据集中的数据进行过采样,形成数据分布平衡的系统缺陷数据集;基于数据分布平衡的系统缺陷数据集,对系统缺陷预测模型进行训练,得到训练好的系统缺陷预测模型;获取待预测的系统数据,利用训练好的系统缺陷预测模型对待预测的系统数据进行系统缺陷预测,得到系统缺陷预测结果<subgt;。</subgt;本发明专利技术采用基于自然邻居的过采样方法,对预处理后的系统缺陷数据集中的数据进行过采样,从而从根源上解决了现有的缺陷数据集中数据不平衡,导致系统缺陷预测的精度低的问题。

【技术实现步骤摘要】

本专利技术属于系统缺陷预测,具体涉及一种基于自然邻居过采样的系统缺陷预测方法、装置及设备


技术介绍

1、系统缺陷决定着系统产品的质量和性能,也是系统产品必然存在的部分。系统缺陷预测技术是系统质量保证中的重要技术,系统缺陷预测可以指导系统测试的方向,正确地进行系统缺陷预测可以节省系统开发时间、提高系统质量。

2、系统缺陷预测是为了发现系统中有缺陷的高风险模块,然而,在系统缺陷数据分布中,无缺陷模块往往要比有缺陷模块要多的多,这种分布满足二八原则,20%的模块集中了80%的缺陷数。无论是工程实践,还是提供研究的公共数据仓库中,系统缺陷数据集存在着严重的类不平衡问题,也就是说系统缺陷预测是不平衡数据分类问题。目前,在系统缺陷预测研究中,存在缺陷数据集的不平衡问题,导致系统缺陷预测精度低的问题。

3、因此,如何解决缺陷数据集中数据不平衡,导致系统缺陷预测的精度低,是本领域亟待解决的问题。


技术实现思路

1、本专利技术的目的是针对现有技术的缺陷,提供一种基于自然邻居过采样的系统缺陷预测方法、装本文档来自技高网...

【技术保护点】

1.一种基于自然邻居过采样的系统缺陷预测方法,其特征在于,包括步骤:

2.根据权利要求1所述的方法,其特征在于,步骤S1中,获取系统历史数据,从所述系统历史数据中抽取出多个系统模块,提取出系统模块中与系统缺陷有关的特征,并构建系统缺陷数据集。

3.根据权利要求1所述的方法,其特征在于,步骤S2中,对所述系统缺陷数据集进行数据处理和转换,包括对重复数据的处理以及对缺失数据的填充处理。

4.根据权利要求1所述的方法,其特征在于,步骤S4中,所述系统缺陷预测模型为SVM。

5.根据权利要求1所述的方法,其特征在于,步骤S5中,系统缺陷预测结果为所...

【技术特征摘要】

1.一种基于自然邻居过采样的系统缺陷预测方法,其特征在于,包括步骤:

2.根据权利要求1所述的方法,其特征在于,步骤s1中,获取系统历史数据,从所述系统历史数据中抽取出多个系统模块,提取出系统模块中与系统缺陷有关的特征,并构建系统缺陷数据集。

3.根据权利要求1所述的方法,其特征在于,步骤s2中,对所述系统缺陷数据集进行数据处理和转换,包括对重复数据的处理以及对缺失数据的填充处理。

4.根据权利要求1所述的方法,其特征在于,步骤s4中,所述系统缺陷预测模型为svm。

5.根据权利要求1所述的...

【专利技术属性】
技术研发人员:杨力军王文彤杨俊涛唐东明干可
申请(专利权)人:西南民族大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1