一种多源异构跨项目软件缺陷预测方法技术

技术编号:34774502 阅读:41 留言:0更新日期:2022-08-31 19:43
本发明专利技术公开了一种多源异构跨项目软件缺陷预测方法,包括将多个源项目原始缺陷数据与目标项目原始缺陷数据进行数据标准化、样本标签标记、类不平衡处理;初始化各个源项目缺陷数据的权重;将类不平衡处理后的源项目、目标项目缺陷数据作为多源谱嵌入映射算法的输入,输出源项目和目标项目的最优映射数据;根据样本标签标记分别对源项目的的最优映射数据和目标项目的最优映射数据进行标记选择,选择出源项目原始数据和目标项目原始数据;度量每个源项目原始数据和目标项目原始数据之间的距离,根据度量值更新源项目缺陷数据的权重;将源项目的的最优映射数据作为机器学习模型的输入进行训练,并基于目标项目原始数据进行模型预测。型预测。型预测。

【技术实现步骤摘要】
一种多源异构跨项目软件缺陷预测方法


[0001]本专利技术涉及异构跨项目软件缺陷预测
,更具体的说是涉及一种 多源异构跨项目软件缺陷预测方法。

技术介绍

[0002]软件缺陷预测技术可以利用软件缺陷历史数据来对测试资源进行前瞻性 的配置和管理,通过挖掘并分析软件的历史缺陷数据,构建软件缺陷预测模 型,从而预测出被测软件模块的缺陷倾向性,最终达到优化测试资源分配和 提高软件产品质量的目的。软件缺陷倾向预测是指预测模型把软件模块划分 为有缺陷倾向的模块或无缺陷倾向模块。假设预测模型的预测结果具有较高 的准确性,则可以依据预测结果使有限的测试资源向有缺陷倾向的模块倾斜, 重点关注并优先测试那些有缺陷倾向的模块。想要预测装备软件缺陷倾向性, 则要求有充足的历史缺陷数据进行预测模型的训练,并且新的预测数据应该 与训练数据服从相同的分布。通常,这种缺陷预测被称为项目内软件缺陷预 测。但是,对于一个新项目,由于没有或者只有极少量的缺陷数据,所以很 难有效进行项目内软件缺陷预测。通过分析,在实际的软件开发场景中,软 件缺陷预测主要面临以下问题:
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多源异构跨项目软件缺陷预测方法,其特征在于,包括:将多个源项目原始缺陷数据与目标项目原始缺陷数据进行数据标准化;对标准化后的数据进行样本标签标记;将样本标签处理后的源项目缺陷数据和目标项目缺陷数据进行类不平衡处理;初始化各个源项目缺陷数据的权重;将类不平衡处理后的源项目缺陷数据和目标项目缺陷数据作为多源谱嵌入映射算法的输入,输出源项目的的最优映射数据和目标项目的最优映射数据;根据样本标签标记分别对源项目的的最优映射数据和目标项目的最优映射数据进行标记选择,选择出源项目原始数据和目标项目原始数据;基于项目间相似性度量方法度量每个源项目原始数据和目标项目原始数据之间的距离,根据度量值更新源项目缺陷数据的权重;将源项目的的最优映射数据作为机器学习模型的输入进行训练,并基于目标项目原始数据进行模型预测。2.根据权利要求1所述的一种多源异构跨项目软件缺陷预测方法,其特征在于,多源谱嵌入映射算法具体包括以下步骤:初始化最优特征空间维数k,核函数为K(x,x);剔除源项目缺陷数据样本和目标项目缺陷数据样本中的重复样本和含缺失值的样本;构造矩阵B和对称矩阵A:其中,n为源项目缺陷数据的样本数量,矩阵A内子矩阵计算公式如下:矩阵A内子矩阵计算公式如下:矩阵A内子矩阵计算公式如下:矩阵A内子矩阵计算公式如下:i,j=1,2,

,n;其中,S
i
表示第i个源项目缺陷数据,T表示目标项目缺陷数据,令Φ(
·
)表示一个映射函数,和分别表示源数据和目标...

【专利技术属性】
技术研发人员:吴玉美姚京秀王江山胡峥涛于永利
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1