【技术实现步骤摘要】
本专利技术涉及软件缺陷,特别是加权stacking的即时软件缺陷预测方法及系统。
技术介绍
1、随着软件规模的不断增加和软件结构的日益复杂,软件缺陷的存在已成为一个不可避免的事实。软件缺陷不仅阻碍了软件的应用和开发,还造成了巨大的经济损失。因此,迫切需要一种有效的软件缺陷预测模型。传统的缺陷预测技术主要基于对文件、模块或软件包等粗粒度软件实体的分析,这需要花费大量的时间和精力。因此,出现了一种新的软件缺陷预测技术—即时软件缺陷预测。即时软件缺陷预测技术可以认为是一项分类任务,包括根据历史数据和软件度量或特征,将软件模块分类为缺陷或无效。软件特性或度量反映了软件模块的特性。
2、然而,不管是传统软件缺陷预测还是即时软件缺陷预测,模型预测的准确性均受到数据集类别不平衡的影响。软件工程领域20%的缺陷可能存在于80%的模块中。在多数情况下不会引起缺陷的代码更改占比更大,因此数据集中存在不平衡率,即少数和多数类别之间的失衡,会影响模型的分类预测效果。大多数类,即不会产生缺陷的代码更改会使模型具有虚高的预测准确率,难以在实际应用中获得
...【技术保护点】
1.加权Stacking的即时软件缺陷预测方法,其特征在于:包括,
2.如权利要求1所述的加权Stacking的即时软件缺陷预测方法,其特征在于:所述建立分类器包括,在MinMax策略上建立随机森林RF分类器得到分类器M-RF,在Z-Score策略上建立LightGBMF分类器得到分类器Z-LGBM,在Robust策略上建立AdaBoost分类器得到分类器R-Ada;
3.如权利要求2所述的加权Stacking的即时软件缺陷预测方法,其特征在于:所述给定概率p选取为0.9;所述特征子集Fn表示为,Fn=[f1,f2,f3,...,fn],其中n
...【技术特征摘要】
1.加权stacking的即时软件缺陷预测方法,其特征在于:包括,
2.如权利要求1所述的加权stacking的即时软件缺陷预测方法,其特征在于:所述建立分类器包括,在minmax策略上建立随机森林rf分类器得到分类器m-rf,在z-score策略上建立lightgbmf分类器得到分类器z-lgbm,在robust策略上建立adaboost分类器得到分类器r-ada;
3.如权利要求2所述的加权stacking的即时软件缺陷预测方法,其特征在于:所述给定概率p选取为0.9;所述特征子集fn表示为,fn=[f1,f2,f3,...,fn],其中n为特征个数;所述随机选取包括,每个初级模型选择特征子集之前,先打乱全部特征的顺序,模型从第一个特征开始选取90%的特征作为入模特征。
4.如权利要求3所述的加权stacking的即时软件缺陷预测方法,其特征在于:所述分类器m-rf包括,将训练集xtrain划分成五等份,
5.如权利要求4所述的加权stacking的即时软件缺陷预测方法,其特征在于:所述分类器z-lgbm包括,将训练集xtrain划分成五等份,
6.如权利要求5所述的...
【专利技术属性】
技术研发人员:陈丽琼,张庆庆,孙怀英,虞才珠,
申请(专利权)人:上海应用技术大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。