当前位置: 首页 > 专利查询>吉林大学专利>正文

一种基于谱聚类的小样本Bug Report有效性预测方法技术

技术编号:46468601 阅读:7 留言:0更新日期:2025-09-23 22:30
本发明专利技术涉及软件工程领域,公开了一种基于谱聚类的小样本Bug Report有效性预测方法。首先,对n个项目的全部Bug Report文本进行预处理,包括文本提取、规范化、分词、去除停用词及word2vec向量化;其次,使用谱聚类算法结合多个评估指标将项目向量聚类为k个簇C={C1,C2,...,Ck};再其次,计算每个项目的干扰度指标,对簇内项目间干扰进行检测与绑定,对聚类结果进行调整,使每个簇内样本规模不小于3000与正负样本比例处于[1/1.6,1.6/1]范围内的同时,全局的标准差达到最小,最终得到调整后的m个簇C′={C1′,C2′,…,Cm′};最后,对于调整后的m个簇,为每个簇单独训练CNN模型用于Bug Report有效性分类预测。训练得到m个CNN模型,使用训练好的模型预测新提交的Bug Report的有效性。本发明专利技术给出一种小规模样本项目的Bug Report有效性预测方法,此方法能有效缓解小样本项目中数据稀缺问题,提升预测准确率,具有良好的通用性与工程应用价值,能够大大提升软件维护和Bug修复的效率,节省大量人力成本,为小样本场景下的模型训练提供了新的路线。

【技术实现步骤摘要】

【】本专利技术属于人工智能与软件工程领域,涉及到机器学习、深度学习与自然语言处理技术,具体涉及基于谱聚类的小样本bug report有效性预测方法。


技术介绍

0、
技术介绍

1、开发人员都使用bug report来修复软件系统或项目的bug。bug report的提交量增长十分迅速,但是提交者可能会提交大量无效的bug report,开发人员需要筛选有效的bug report来帮助维护项目和修复bug。人工筛选效率十分低下,且传统基于监督学习的预测方法需要使用大规模bug report进行训练,在小样本项目中效果不佳。因此,如何在小样本条件下高效准确地预测bug report的有效性,成为一个亟待解决的问题。


技术实现思路

0、
技术实现思路

1、为解决上述问题,本专利技术提出一种基于谱聚类的小样本项目的bug report有效性预测方法。使用谱聚类算法将n个项目的bug report聚类为k个簇,然后使用调整策略将k个簇调整为m个簇,最后为每个簇分别训练cnn分类模型以预测bu本文档来自技高网...

【技术保护点】

1.一种基于谱聚类的小样本Bug Report有效性预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于谱聚类的小样本Bug Report有效性预测方法,其特征是所述步骤S1中对Bug Report文本进行预处理的过程包括:

3.根据权利要求1所述的一种基于谱聚类的小样本Bug Report有效性预测方法,其特征是所述步骤S2中使用谱聚类将项目聚类为若干个簇的过程包括:

4.根据权利要求1所述的一种基于谱聚类的小样本Bug Report有效性预测方法,其特征是所述步骤S3中对聚类结果进行调整的过程包括:

>5.根据权利要求1...

【技术特征摘要】

1.一种基于谱聚类的小样本bug report有效性预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于谱聚类的小样本bug report有效性预测方法,其特征是所述步骤s1中对bug report文本进行预处理的过程包括:

3.根据权利要求1所述的一种基于谱聚类的小样本bug report有效性预测方法,其特征是所述步...

【专利技术属性】
技术研发人员:马鸿张鹏卜傲李慧
申请(专利权)人:吉林大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1