【技术实现步骤摘要】
相似缺陷报告推荐方法、系统、计算机设备和存储介质
本专利技术属于软件开发与维护领域,特别涉及一种相似缺陷报告推荐方法、系统、计算机设备和存储介质。
技术介绍
软件缺陷,即计算机软件或程序中存在的某种破坏正常运行能力的问题、错误、或者隐藏的功能缺陷。缺陷的存在往往会导致软件产品在某种程度上不能满足用户的需要。在软件开发和维护的过程中,缺陷很难避免,随着软件规模的增大,软件缺陷也会相应增加。为了解决这个问题,许多软件项目建立了缺陷跟踪系统,如Bugzilla、Trac等,主要完成对缺陷报告的记录、分析和状态更新等管理。一个完善的缺陷跟踪系统对于测试的成功实施是非常重要的。当用户遇到一个新缺陷时,会撰写一份缺陷报告,来详细描述所遇到的问题以及相关信息(平台、组件、类型等)。对于用户提交的缺陷报告,开发人员需要花费大量的精力,尽可能的修复缺陷报告中提及的缺陷。若缺陷报告中涉及到的相同源代码文件数目超过一半,则称这些缺陷报告为相似缺陷报告,给开发人员推荐相似缺陷报告能够有效节约开发人员修复缺陷的时间。目前,为了帮助开发者高效地 ...
【技术保护点】
1.一种相似缺陷报告推荐方法,其特征在于,所述方法包括以下步骤:/n步骤1,对待处理的新缺陷报告A进行预处理,构建该缺陷报告A的第一实体集合S1;/n步骤2,计算所述第一实体集合S1中每个实体的TF-IDF值,并按照TF-IDF值对实体进行降序排列,构建第二实体集合S2;/n步骤3,针对第二实体集合S2中的每个实体S,结合缺陷知识图谱,利用图数据库查询语言查询与新缺陷报告A通过实体S相关联的缺陷报告,构建第一缺陷报告集合Buglist1;/n步骤4,针对第一缺陷集合Buglist1中的每个关联缺陷报告b,求取其与新缺陷报告A的余弦相似度,构建第二缺陷报告集合Buglist2 ...
【技术特征摘要】
1.一种相似缺陷报告推荐方法,其特征在于,所述方法包括以下步骤:
步骤1,对待处理的新缺陷报告A进行预处理,构建该缺陷报告A的第一实体集合S1;
步骤2,计算所述第一实体集合S1中每个实体的TF-IDF值,并按照TF-IDF值对实体进行降序排列,构建第二实体集合S2;
步骤3,针对第二实体集合S2中的每个实体S,结合缺陷知识图谱,利用图数据库查询语言查询与新缺陷报告A通过实体S相关联的缺陷报告,构建第一缺陷报告集合Buglist1;
步骤4,针对第一缺陷集合Buglist1中的每个关联缺陷报告b,求取其与新缺陷报告A的余弦相似度,构建第二缺陷报告集合Buglist2;
步骤5,求取第一缺陷集合Buglist1与第二缺陷报告集合Buglist2对应位置元素的相似度值,构建第三缺陷报告集合Buglist3;
步骤6,结合上述第三缺陷报告集合Buglist3和缺陷知识图谱,返回新缺陷报告A的相似缺陷报告列表。
2.根据权利要求1所述的相似缺陷报告推荐方法,其特征在于,步骤1所述预处理具体为自然语言处理,包括分词、词性标注及命名实体抽取。
3.根据权利要求1或2所述的相似缺陷报告推荐方法,其特征在于,步骤3中所述缺陷知识图谱采用三元组形式,包括缺陷ID、关系和实体。
4.根据权利要求3所述的相似缺陷报告推荐方法,其特征在于,步骤3中所述第一缺陷集合Buglist1中的每个元素包括实体S的TF-IDF值及其对应的所有关联缺陷报告的ID。
5.根据权利要求4所述的相似缺陷报告推荐方法,其特征在于,步骤4中所述第二缺陷报告集合Buglist2中的每个元素包括关联缺陷报告的ID及其对应的余弦相似度,且所有元素按余弦相似度值降序排列。
6.根据权利要求5所述的相似缺陷报告推荐方法,其特征在于,步骤4中所述针对第一缺陷集合Buglist1中的每个关联缺陷报告b,求取其与新缺陷报告A的余弦相似度,具体过程包括:
利用缺陷知识图谱将新缺陷报告A以及每个关联缺陷报告b的属性量化为...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。