【技术实现步骤摘要】
基于皮尔森相关性加权关联分类规则的软件缺陷预测方法
本专利技术涉及软件缺陷预测
,特别涉及一种基于皮尔森相关性加权关联分类规则的软件缺陷预测方法。
技术介绍
随着软件规模和复杂性日益增加,保证软件质量越来越重要。软件缺陷预测是一种提高软件质量的方法,也是减轻软件代码审查及改善测试资源分配的有效手段。常用的软件缺陷预测方法主要包含分类、回归、聚类和关联规则(associationrule)。关联规则是以挖掘隐含于数据中的关联关系为目的的算法,采用产生式的表示形式符合人的思维逻辑,其蕴含式:ifXthenC或其中且X∩C=φ,前件X是一组特征(或项或度量元)集合,后件C可以是特征集也可以是类别(如正类和反类),I={I1,I1,···,Im-1,C}是包含m个特征的项集,通常用支持度(support)和置信度(confidence)度量一条关联规则是否有用,支持度和置信度越大,则规则越有用。支持度揭示了X与C同时发生的概率,而置信度揭示了在X发生时,C出现的概率。在软件开发生命周期中,基于关联规则的软件缺陷预测有益于提高预 ...
【技术保护点】
1.基于皮尔森相关性加权关联分类规则的软件缺陷预测方法,其特征在于,包括:/nS1、根据相应静态代码分析工具,提取待检测软件度量元数据集;/nS2、基于皮尔森相关性的特征选择方法评价每个度量元与类别之间的相关性,并对相关性进行排序,将排序值较大的前30-50%作为被选择的度量元;/nS3、将选择的度量元与相应的类别,代入基于皮尔森相关性加权关联分类规则的软件缺陷预测模型,进行预测并输出预测结果。/n
【技术特征摘要】
1.基于皮尔森相关性加权关联分类规则的软件缺陷预测方法,其特征在于,包括:
S1、根据相应静态代码分析工具,提取待检测软件度量元数据集;
S2、基于皮尔森相关性的特征选择方法评价每个度量元与类别之间的相关性,并对相关性进行排序,将排序值较大的前30-50%作为被选择的度量元;
S3、将选择的度量元与相应的类别,代入基于皮尔森相关性加权关联分类规则的软件缺陷预测模型,进行预测并输出预测结果。
2.如权利要求1所述的预测方法,其特征在于,所述基于皮尔森相关性加权关联分类规则的软件缺陷预测模型,构建步骤包括:
S31、将获取的软件缺陷数据进行预处理,获得软件缺陷训练集和软件缺陷测试集;所述软件缺陷训练集为有缺陷倾向训练集和无缺陷倾向训练集;
S32、分别设置有缺陷倾向类最小加权支持度和无缺陷倾向类最小加权支持度,利用加权Apriori算法分别对有缺陷倾向训练集和无缺陷倾向训练集构建有缺陷倾向关联规则集和无缺陷倾向关联规则集;
S33、对有缺陷倾向关联规则集和无缺陷倾向关联规则集进行排序;
S34、利用冲突规则剪枝和冗余规则剪枝方法同时对有缺陷倾向关联规则集和无缺陷倾向关联规则集进行规则剪枝优化;
S35、利用优化后的有缺陷倾向关联规则集和无缺陷倾向关联规则集对软件模块进行预测。
3.如权利要求2所述的预测方法,其特征在于,所述构建步骤还包括:
S36、通过所述测试集对所述基于皮尔森相关性加权关联分类规则的软件缺陷预测模型进行验证。
4.如权利要求2所述的预测方法,其特征在于,所述步骤S31,包括:
S311、根据类别对每个数据集D进行第一次水平划分,分为有缺陷倾向数据集TS和无缺陷倾向数据集FS;其满足公式D=TS∪FS和TS∩FS=φ;
S312、对有缺陷倾向数据集TS和无缺陷倾向数据集FS进行第一次垂直划分,分为有缺陷倾向训练集TTS、有缺陷倾向测试集Ttest和无缺陷倾向训练集FTS、无缺陷倾向测试集Ftest;且满足D=TTS∪Ttest,TTS∩Ttest=φ,D=FTS∪Ftest和FTS∩Ftest=φ;所述有缺陷倾向训练集TTS和无缺陷倾向训练集FTS构成一个完整的训练集;
S313、采用基于皮尔森相关性的特征选择方法,评价所述训练集的每个特征与类别之间的相关性,并对相关性进行排序,将排序值较大的前30-50%作为被选择的特征;
S314、利用5阶等频方法对特征选择后的训练集进行离散化处理,将每个特征按着数值属性的大小顺序,将训练集平均分为五个区间;
S315、将离散化的训练集DS进行第二次水平划分,将其划分为离散化的有缺陷倾向训练集FDS和离散化的无缺陷倾向训练集TDS,且满足DS=FDS∪TDS和FDS∩TDS=φ。
5.如权利要求4所述的预测方法,其特征在于,所述步骤S312包括:
采用5折交叉验证进行评估,各选取4折作为训练集,1折作为测试集,每次对数据进行随机化,并重复10次,对有缺陷倾向数据集TS和无缺陷倾向数据集FS进行第一次垂直划分。
6.如权利要求4所述的预测方法,其特征在于,所述步骤S32,包括:
S321、利用...
【专利技术属性】
技术研发人员:王世海,邵元勋,刘斌,严潇波,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。