当前位置: 首页 > 专利查询>中南大学专利>正文

一种增量式的软件缺陷预测方法、系统、设备及存储介质技术方案

技术编号:33119205 阅读:24 留言:0更新日期:2022-04-17 00:15
本发明专利技术公开了一种增量式的软件缺陷预测方法、系统、设备及存储介质,该方法通过获取第一训练集,对第一训练集进行预处理,获得第二训练集;基于第二训练集,构建代价敏感LightGBM模型;将代价敏感LightGBM模型作为基分类器构建增量式预测模型,并计算总训练样本数和总缺陷样本数;根据总训练样本数和总缺陷样本数,计算分类阈值;使用增量式预测模型对待预测样本进行预测,获得最终预测值;基于分类阈值和最终预测值,判断待预测样本的类别。本方法能够在原模型的基础上增加新基分类器,学习新数据的同时,无需重复训练历史样本,并能够降低模型计算量,节省存储空间,提高训练效率,不断完善模型,提高软件缺陷预测的准确率。率。率。

【技术实现步骤摘要】
一种增量式的软件缺陷预测方法、系统、设备及存储介质


[0001]本专利技术涉及软件缺陷预测
,具体涉及一种增量式的软件缺陷预测方法、系统、设备及存储介质。

技术介绍

[0002]在信息化时代的今天,软件的规模变得越来越大,软件结构复杂度也在不断提高。为了排查软件缺陷,确保软件正常运行,软件测试成本的占比应该在软件开发成本中超过50%。但在实际开发中,由于时间、成本、人力的限制,软件测试的成本往往占比很低。因此如何合理地分配软件测试资源、如何高质量、高效的进行软件测试就成为了研究人员和软件测试团队所关心的问题。软件缺陷预测可以将软件模块分成有缺陷倾向的软件模块和无缺陷倾向的软件模块。软件测试团队根据有缺陷倾向的软件模块和无缺陷倾向的软件模块,分配有限的测试资源来更密集地测试有缺陷倾向的软件模块,以此帮助软件测试团队更高效地进行软件测试,节省测试成本并及时发现软件缺陷。
[0003]由于软件不断迭代更新,进而导致新的软件缺陷数据的不断增加,但针对软件缺陷预测中不断产生的新缺陷样本的学习问题,目前的研究较少。鉴于软件是不断演化并完善的,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种增量式的软件缺陷预测方法,其特征在于,包括步骤:步骤S100、获取第一训练集,对所述第一训练集进行预处理,获得第二训练集;步骤S200、基于所述第二训练集,构建代价敏感LightGBM模型;步骤S300、将所述代价敏感LightGBM模型作为基分类器,基于所述基分类器构建增量式预测模型,以及计算总训练样本数和总缺陷样本数,具体过程包括:步骤S310、累计获取所述第一训练集的次数;步骤S320、将每次获取的所述第一训练集进行预处理后,输入至所述代价敏感LightGBM模型中,获取新的基分类器;步骤S330、将所述新的基分类器加入历史基分类器组中,判断是否要删除所述历史基分类器组中的基分类器,以构建增量式预测模型,以及计算所述总训练样本数和所述总缺陷样本数,判断步骤包括:步骤S331、根据当前累计获取的所述第一训练集的次数,限定当前基分类器的数量;步骤S332、当所述历史基分类器组中历史基分类器的数量小于当前基分类器的限定数量时,将新的基分类器直接加入所述历史基分类器组中,获得第一基分类器组,根据所述第一基分类器组训练的训练样本数,计算第一总训练样本数和第一总缺陷样本数;步骤S333、当所述历史基分类器组中历史基分类器的数量大于或等于当前基分类器的限定数量时,使用所述历史基分类器组中的每个历史基分类器对所述第一训练集进行预测,计算每个历史基分类器预测所述第一训练集的准确率;将每个所述历史基分类器的所述准确率进行排序,删除预测准确率最小的历史基分类器,获得新的历史基分类器组,将新的基分类器加入所述新的历史基分类器组中,获得第二基分类器组,根据所述第二基分类器组训练的训练样本数,计算第二总训练样本数和第二总缺陷样本数;步骤S334、计算所述步骤S332获得的所述第一基分类器组或所述步骤S333获得的所述第二基分类器组中各个基分类器的权重;步骤S335、根据所述步骤S334计算获得的权重,更新所述步骤S332获得的所述第一基分类器组或所述步骤S333获得的所述第二基分类器组中各个基分类器的权重,并将更新完权重的各个基分类器构建成一个增量式预测模型;步骤S400、根据所述总训练样本数和所述总缺陷样本数,计算分类阈值;步骤S500、使用所述增量式预测模型对待预测样本进行预测,获得最终预测值;步骤S600、基于所述分类阈值和所述最终预测值,判断所述待预测样本的类别。2.根据权利要求1所述的增量式的软件缺陷预测方法,其特征在于,所述对所述第一训练集进行预处理,获得第二训练集,包括:对所述第一训练集中的各个训练样本进行分类;删除所有数据项相同且标签相同的训练样本;对缺失一半或一半以上特征项的训练样本进行删除,对缺失一半以下特征项的训练样本采用均值进行填补缺失的特征项;对训练样本中特征值连续的特征项进行归一化,获得第二训练集。3.根据权利要求1所述的增量式的软件缺陷预测方法,其特征...

【专利技术属性】
技术研发人员:任胜兵毛栋张光辉柳叶晟
申请(专利权)人:中南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1