加权Stacking的即时软件缺陷预测方法及系统技术方案

技术编号:39948791 阅读:26 留言:0更新日期:2024-01-08 23:08
本发明专利技术公开了加权Stacking的即时软件缺陷预测方法及系统,涉及软件缺陷技术领域,包括对原始缺陷数据集进行概率随机特征选择得到特征子集F<subgt;n</subgt;;利用不同的特征变换策略,对各个特征子集中的原始的特征数据进行缩放,并建立分类器;构建初级分类器,构建次级分类器LR,根据分类器求得新的训练集和测试集;将LR在新的测试集上的预测结果和测试集对应的标签对比计算,得到集成模型的各种评价指标得分。本发明专利技术改进传统的Stacking模型,给初级分类器分配了权重,减少数据集分配不均带来的差异性,并且对数据进行变换策略,有效防止特征量级的差异影响模型内部处理。

【技术实现步骤摘要】

本专利技术涉及软件缺陷,特别是加权stacking的即时软件缺陷预测方法及系统。


技术介绍

1、随着软件规模的不断增加和软件结构的日益复杂,软件缺陷的存在已成为一个不可避免的事实。软件缺陷不仅阻碍了软件的应用和开发,还造成了巨大的经济损失。因此,迫切需要一种有效的软件缺陷预测模型。传统的缺陷预测技术主要基于对文件、模块或软件包等粗粒度软件实体的分析,这需要花费大量的时间和精力。因此,出现了一种新的软件缺陷预测技术—即时软件缺陷预测。即时软件缺陷预测技术可以认为是一项分类任务,包括根据历史数据和软件度量或特征,将软件模块分类为缺陷或无效。软件特性或度量反映了软件模块的特性。

2、然而,不管是传统软件缺陷预测还是即时软件缺陷预测,模型预测的准确性均受到数据集类别不平衡的影响。软件工程领域20%的缺陷可能存在于80%的模块中。在多数情况下不会引起缺陷的代码更改占比更大,因此数据集中存在不平衡率,即少数和多数类别之间的失衡,会影响模型的分类预测效果。大多数类,即不会产生缺陷的代码更改会使模型具有虚高的预测准确率,难以在实际应用中获得预期的结果。并且缺陷本文档来自技高网...

【技术保护点】

1.加权Stacking的即时软件缺陷预测方法,其特征在于:包括,

2.如权利要求1所述的加权Stacking的即时软件缺陷预测方法,其特征在于:所述建立分类器包括,在MinMax策略上建立随机森林RF分类器得到分类器M-RF,在Z-Score策略上建立LightGBMF分类器得到分类器Z-LGBM,在Robust策略上建立AdaBoost分类器得到分类器R-Ada;

3.如权利要求2所述的加权Stacking的即时软件缺陷预测方法,其特征在于:所述给定概率p选取为0.9;所述特征子集Fn表示为,Fn=[f1,f2,f3,...,fn],其中n为特征个数;所述随机...

【技术特征摘要】

1.加权stacking的即时软件缺陷预测方法,其特征在于:包括,

2.如权利要求1所述的加权stacking的即时软件缺陷预测方法,其特征在于:所述建立分类器包括,在minmax策略上建立随机森林rf分类器得到分类器m-rf,在z-score策略上建立lightgbmf分类器得到分类器z-lgbm,在robust策略上建立adaboost分类器得到分类器r-ada;

3.如权利要求2所述的加权stacking的即时软件缺陷预测方法,其特征在于:所述给定概率p选取为0.9;所述特征子集fn表示为,fn=[f1,f2,f3,...,fn],其中n为特征个数;所述随机选取包括,每个初级模型选择特征子集之前,先打乱全部特征的顺序,模型从第一个特征开始选取90%的特征作为入模特征。

4.如权利要求3所述的加权stacking的即时软件缺陷预测方法,其特征在于:所述分类器m-rf包括,将训练集xtrain划分成五等份,

5.如权利要求4所述的加权stacking的即时软件缺陷预测方法,其特征在于:所述分类器z-lgbm包括,将训练集xtrain划分成五等份,

6.如权利要求5所述的...

【专利技术属性】
技术研发人员:陈丽琼张庆庆孙怀英虞才珠
申请(专利权)人:上海应用技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1