基于P-K的软件缺陷预测方法、装置、电子设备及介质制造方法及图纸

技术编号：33297469 阅读：15 留言：0更新日期：2022-05-06 12:01

本申请公开了一种基于P

全部详细技术资料下载

【技术实现步骤摘要】
基于P-K的软件缺陷预测方法、装置、电子设备及介质

[0001]本专利技术涉及软件测试及数据挖掘领域，更具体地，涉及一种基于P-K的软件缺陷预测方法、装置、电子设备及介质。

技术介绍

[0002]从1970年开始，软件缺陷预测技术开始发展；随着软件系统规模变得越来越大，逻辑日趋复杂，软件缺陷也势必增加，影响软件质量，由于软件缺陷预测帮助测试人员了解软件的状态和质量，帮助制定交付标准，所以软件缺陷的预测也变得重要起来。
[0003]目前，软件缺陷预测分为静态和动态两种预测方法。随着软件迭代更新次数以及同类软件的增多，基于软件历史开发数据及发现的缺陷数，进行缺陷数目、类型、分布的预测成为一种切实可行方法。研究指出影响缺陷预测有3个因素，度量元的选取、缺陷预测模型的构建方法和数据集。也就是根据缺陷相关的度量元数据(代码行数、类数、方法数等)，选择适当预测模型，选择适当的数据集可以有效的提高缺陷预测的转去额度。本文就基于以上静态缺陷预测方法展开研究。
[0004]怎么样从大量的开发历史数据中找到与缺陷相关的数据，也就是度量元选取问题变成首要问题，这就涉及到数据挖掘领域。现在主要运用的是PCA，LDA，LLE以及ICA等方法。其中PCA(Principle Component Analysis)，主成分分析法，常用于提取数据的主要特征分量，用来对高维数据进行降维，提高运算效率。
[0005]对于静态软件缺陷预测技术，有分类、回归和基于神经网络的贝叶斯、CNN、DNN等方法，这就涉及预测模型选取问题。由于...

【技术保护点】

【技术特征摘要】
1.一种基于P-K的软件缺陷预测方法，其特征在于，包括：收集软件历史缺陷数据，将所述软件历史缺陷数据划分为训练数据集与测试数据集；针对所述训练数据集内的度量元进行降维，获得特征向量；根据降维后的训练数据集与所述特征向量，进行KNN分类训练；调整降维参数与KNN参数，获得最优模型；根据所述最优模型，针对所述测试数据集内的度量元进行降维，并进行KNN分类训练，预测所述测试数据集的缺陷。2.根据权利要求1所述的基于P-K的软件缺陷预测方法，其中，针对所述训练数据集内的度量元进行降维，获得特征向量包括：通过PCA主成分分析技术，将高维数据进行特征选择，去冗余，获得前k个特征值对应的特征向量。3.根据权利要求2所述的基于P-K的软件缺陷预测方法，其中，将高维数据进行特征选择之前，先针对所述高维数据进行标准化处理。4.根据权利要求1所述的基于P-K的软件缺陷预测方法，其中，所述最优模型包括最优降维参数与最优KNN参数。5.根据权利要求4所述的基于P-K的软件缺陷预测方法，其中，根据所述最优模型，针对所述测试数据集内的度量元进行降维，并进行KNN分类训练，预测所述测试数据集的缺陷包括：根据所述最优降维参数针对所述测试数据集内的度量元进行降维，根据所述最优KNN参数进行KNN分类训练，...

【专利技术属性】
技术研发人员：王婷婷，
申请(专利权)人：中国石油化工股份有限公司石油物探技术研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人