加权Stacking的即时软件缺陷预测方法及系统技术方案

技术编号：39948791 阅读：26 留言：0更新日期：2024-01-08 23:08

本发明专利技术公开了加权Stacking的即时软件缺陷预测方法及系统，涉及软件缺陷技术领域，包括对原始缺陷数据集进行概率随机特征选择得到特征子集F<subgt;n</subgt;；利用不同的特征变换策略，对各个特征子集中的原始的特征数据进行缩放，并建立分类器；构建初级分类器，构建次级分类器LR，根据分类器求得新的训练集和测试集；将LR在新的测试集上的预测结果和测试集对应的标签对比计算，得到集成模型的各种评价指标得分。本发明专利技术改进传统的Stacking模型，给初级分类器分配了权重，减少数据集分配不均带来的差异性，并且对数据进行变换策略，有效防止特征量级的差异影响模型内部处理。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及软件缺陷，特别是加权stacking的即时软件缺陷预测方法及系统。

技术介绍

1、随着软件规模的不断增加和软件结构的日益复杂，软件缺陷的存在已成为一个不可避免的事实。软件缺陷不仅阻碍了软件的应用和开发，还造成了巨大的经济损失。因此，迫切需要一种有效的软件缺陷预测模型。传统的缺陷预测技术主要基于对文件、模块或软件包等粗粒度软件实体的分析，这需要花费大量的时间和精力。因此，出现了一种新的软件缺陷预测技术—即时软件缺陷预测。即时软件缺陷预测技术可以认为是一项分类任务，包括根据历史数据和软件度量或特征，将软件模块分类为缺陷或无效。软件特性或度量反映了软件模块的特性。

2、然而，不管是传统软件缺陷预测还是即时软件缺陷预测，模型预测的准确性均受到数据集类别不平衡的影响。软件工程领域20％的缺陷可能存在于80％的模块中。在多数情况下不会引起缺陷的代码更改占比更大，因此数据集中存在不平衡率，即少数和多数类别之间的失衡，会影响模型的分类预测效果。大多数类，即不会产生缺陷的代码更改会使模型具有虚高的预测准确率，难以在实际应用中获得...

【技术保护点】

1.加权Stacking的即时软件缺陷预测方法，其特征在于：包括，

2.如权利要求1所述的加权Stacking的即时软件缺陷预测方法，其特征在于：所述建立分类器包括，在MinMax策略上建立随机森林RF分类器得到分类器M-RF，在Z-Score策略上建立LightGBMF分类器得到分类器Z-LGBM，在Robust策略上建立AdaBoost分类器得到分类器R-Ada；

3.如权利要求2所述的加权Stacking的即时软件缺陷预测方法，其特征在于：所述给定概率p选取为0.9；所述特征子集Fn表示为，Fn＝[f1，f2，f3，...，fn]，其中n为特征个数；所述随机...

【技术特征摘要】

1.加权stacking的即时软件缺陷预测方法，其特征在于：包括，

2.如权利要求1所述的加权stacking的即时软件缺陷预测方法，其特征在于：所述建立分类器包括，在minmax策略上建立随机森林rf分类器得到分类器m-rf，在z-score策略上建立lightgbmf分类器得到分类器z-lgbm，在robust策略上建立adaboost分类器得到分类器r-ada；

3.如权利要求2所述的加权stacking的即时软件缺陷预测方法，其特征在于：所述给定概率p选取为0.9；所述特征子集fn表示为，fn＝[f1，f2，f3，...，fn]，其中n为特征个数；所述随机选取包括，每个初级模型选择特征子集之前，先打乱全部特征的顺序，模型从第一个特征开始选取90％的特征作为入模特征。

4.如权利要求3所述的加权stacking的即时软件缺陷预测方法，其特征在于：所述分类器m-rf包括，将训练集xtrain划分成五等份，

5.如权利要求4所述的加权stacking的即时软件缺陷预测方法，其特征在于：所述分类器z-lgbm包括，将训练集xtrain划分成五等份，

6.如权利要求5所述的...

【专利技术属性】
技术研发人员：陈丽琼，张庆庆，孙怀英，虞才珠，
申请(专利权)人：上海应用技术大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人