基于强化混合专家模型的跨项目软件缺陷预测方法技术

技术编号：27006148 阅读：15 留言：0更新日期：2021-01-08 17:09

本发明专利技术涉及一种基于强化混合专家模型的软件缺陷预测方法，属于计算机与信息科学技术领域。主要解决跨项目软件缺陷预测中混合专家模型未能学习跨项目软件的全局信息造成软件缺陷预测性能下降的问题。本发明专利技术首先全局训练随机森林，由森林中的树经过挑选与强化构成专家，然后经过改进的EM算法计算每个样本的后验概率并迭代执行专家模型的挑选与强化过程，最后根据迭代重构后的子簇训练门控网络，组合优化好的专家模型构成完整的强化混合专家模型，预测本项目待预测软件模块的缺陷。结果表明本发明专利技术能达到较好的分类效果，进一步提升了跨项目软件缺陷预测的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
基于强化混合专家模型的跨项目软件缺陷预测方法
本专利技术涉及一种基于强化混合专家模型的跨项目软件缺陷预测方法，属于计算机与信息科学

技术介绍
软件缺陷是指软件产品中存在的，导致其无法满足软件需求和规格要求，需要进行修复的瑕疵、问题。软件缺陷是软件失效的源头和影响软件可靠性的重要因素，尽早地预测软件中存在的缺陷，以合理分配测试验证资源并保证软件质量在软件工程领域尤为重要。目前已有很多高效的软件缺陷预测方法被提出，这些方法主要基于项目历史软件模块的度量特征，采用统计学和机器学习的技术构建软件缺陷预测模型，然后将待测软件模块的度量特征输入软件缺陷预测模型，从而得到该软件模块的缺陷预测结果。但是当待预测的软件项目没有充足的历史数据时，很难顺利进行预测，得到可靠结果。这种情况下需通过引入其他已有软件项目的历史数据，协助进行跨项目软件缺陷预测。不同软件项目既会由于开发过程、编程规范及应用领域不同而存在数据差异性，也会因为采用相同的开发语言、相近的编码风格或相似的体系结构从而存在共性。这些共性能够作为模式和规律传递的桥梁，建立不同概率分布样本集之间的联系，因此从不同软件项目中提取全局的共性信息并分辨局部的特性信息是实现跨项目软件缺陷预测的关键。混合专家模型常用来处理分布差异的数据，它可以通过门控函数将分布相近的项目软件数据划分到相同的簇中、分布差异的项目软件数据划分到不同的簇中，针对每个簇分别训练专家模型来共同执行软件缺陷预测任务。通过这个过程，混合专家模型能学习到不同项目软件的特性信息，将其应用...

【技术保护点】
1.基于强化混合专家模型的跨项目软件缺陷预测方法，其特征在于，包括以下步骤：/n步骤1，提取跨项目软件模块数据，首先抽取跨项目软件模块的历史数据，然后提取跨项目软件模块的度量特征，最后标注所有跨项目软件模块的缺陷属性；/n步骤2，提取跨项目软件模块数据中的全局信息，首先对所有跨项目软件模块数据进行k均值聚类，将全局数据划分为多个子集，然后基于所有跨项目软件模块数据，全局训练随机森林；/n步骤3，基于划分得到的不同簇，迭代执行预专家模型的分配和强化，提取跨项目软件模块数据中的局部信息，首先设置阈值，为聚类获得的每个子集分配专家模型，然后使用每个子集中的局部数据优化预专家模型，再根据预专家模型的分类性能对样本点重新分配，最后重复执行预专家模型的强化与重构过程，直到模型的性能最优；/n步骤4，根据迭代重构后的子集划分结果训练门控网络，组合优化好的专家模型构成完整的强化混合专家模型；/n步骤5，用训练得到的强化混合专家模型预测本项目软件模块是否存在缺陷。/n

【技术特征摘要】
1.基于强化混合专家模型的跨项目软件缺陷预测方法，其特征在于，包括以下步骤：
步骤1，提取跨项目软件模块数据，首先抽取跨项目软件模块的历史数据，然后提取跨项目软件模块的度量特征，最后标注所有跨项目软件模块的缺陷属性；
步骤2，提取跨项目软件模块数据中的全局信息，首先对所有跨项目软件模块数据进行k均值聚类，将全局数据划分为多个子集，然后基于所有跨项目软件模块数据，全局训练随机森林；
步骤3，基于划分得到的不同簇，迭代执行预专家模型的分配和强化，提取跨项目软件模块数据中的局部信息，首先设置阈值，为聚类获得的每个子集分配专家模型，然后使用每个子集中的局部数据优化预专家模型，再根据预专家模型的分类性能对样本点重新分配，最后重复执行预专家模型的强化与重构过程，直到模型的性能最优；
步骤4，根据迭代重构后的子集划分结果训练门控网络，组合优化好的专家模型构成完整的强化混合专家模型；

【专利技术属性】
技术研发人员：潘丽敏，尹培宇，罗森林，王殿元，
申请(专利权)人：北京理工大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人