一种基于缺陷报告的缺陷代码路径定位方法技术

技术编号：21952157 阅读：29 留言：0更新日期：2019-08-24 17:36

本发明专利技术公开了一种基于缺陷报告的缺陷代码路径定位方法，基于深度学习的方法从已修复的缺陷报告和对应修复代码路径中学习出文本与代码之间的关联关系，从而对新缺陷报告进行关联缺陷代码文件路径的预测。具体包括2个部分：(1)基于缺陷报告的缺陷代码路径树生成模型BRSP；(2)基于规则约束的缺陷代码路径树预测算法。本发明专利技术的优点是可以根据缺陷报告给出关联的缺陷代码文件路径信息，辅助开发人员进行缺陷代码定位，节省开发人员的时间和精力，从而提高软件项目的维护效率。

A Defect Code Path Location Method Based on Defect Reporting

全部详细技术资料下载

【技术实现步骤摘要】
一种基于缺陷报告的缺陷代码路径定位方法
本专利技术涉及一种基于缺陷报告的缺陷代码路径定位方法，属于软件测试

技术介绍
在大型开源软件开发过程中，广泛使用Bugzilla,Jira,GNATS,trac等缺陷跟踪管理系统来跟踪管理项目的缺陷。以Eclipse项目中的缺陷跟踪管理系统Bugzilla为例，在对整个项目进行开发、测试和维护的过程中，当软件开发参与者发现了项目中的Bug时，可以登录BugZilla系统提交一份缺陷报告。在BugZilla中，每个缺陷报告都有Status、Resolution这两个关键属性表示其状态。其中，Status表示bug的一般状态，下面是其取值和各个取值的说明以及转换的可能性。Unconfirmed(未证实)表明bug是最近加入到数据库的，没有人证实这个bug的存在。拥有“确定/取消Bug"权限的用户可以转变bug的状态为：1.确认这个bug，改变它的状态为新提交的(NEW)2.解决这个bug，标志为已解决(RESOLVED)New(新提交的)这个bug已经分发给某位开发人员处理。这个状态的bug可以转变为以下状态：1.当前被指派的开发人员接受该bug，状态转变为已指派(ASSIGNED)2.该bug被指派给别的开发人员，状态维持为新提交的(NEW)已解决，状态转变为已解决(RESOLVED)Assigned(已指派)这个bug尚未解决，但已经被指派给正确的人进行解决。这个状态的bug可能转换为以下状态：1.被指派给别的开发人员，状态转变为新提交的(NEW)2.被解决，状态转变为已解决(RESOLVED)Reopen...

【技术保护点】
1.一种基于缺陷报告的缺陷代码路径定位方法，其特征在于：使用基于深度学习的方法从已修复的缺陷报告和对应修复代码路径中学习出文本与代码之间的关联关系，从而对新缺陷报告进行关联缺陷代码文件路径的预测，训练得到基于缺陷报告的缺陷代码路径定位模型；在基于缺陷报告的缺陷代码路径定位模型的基础上，利用源文件路径存在层级结构的特性，添加了带有约束规则的路径树预测算法。

【技术特征摘要】
1.一种基于缺陷报告的缺陷代码路径定位方法，其特征在于：使用基于深度学习的方法从已修复的缺陷报告和对应修复代码路径中学习出文本与代码之间的关联关系，从而对新缺陷报告进行关联缺陷代码文件路径的预测，训练得到基于缺陷报告的缺陷代码路径定位模型；在基于缺陷报告的缺陷代码路径定位模型的基础上，利用源文件路径存在层级结构的特性，添加了带有约束规则的路径树预测算法。2.如权利要求1所述的基于缺陷报告的缺陷代码路径定位方法，其特征在于，基于缺陷报告的缺陷代码路径定位模型BRSP的训练方法，包括如下内容：将缺陷源代码文件的路径模块作为模型的预测标签；缺陷报告d可以表示成一个单词序列其中wi表示为文档中第i个单词，Nd表示缺陷报告d的单词序列单词的总数；所有缺陷报告的所有词语构成词汇集V；将单词序列Wd当做模型的输入，模型最终输出序列化的缺陷代码文件路径树。3.如权利要求2所述的基于缺陷报告的缺陷代码路径定位方法，其特征在于，模型包含嵌入(embedding)层和编码(encoder)部分以及解码(decoder)部分，而编码(encoder)部分和解码(decoder)部分分别包含三层循环神经网络层；输入模型的单词序列Wd首先经过嵌入(embedding)层，对序列中的每个单词wi执行嵌入(embedding)操作，即首先获得每个单词的独热(one-hot)向量表示，然后与查找(look-up)矩阵相乘，最终得到一个形状为1×dim的向量作为当前单词的嵌入(embedding)表示；此时包含Nd个单词的单词序列Wd变成了一个Nd×dim的矩阵x，接着将该矩阵继续传递给模型的剩余部分。4.如权利要求3所述的基于缺陷报告的缺陷代码路径定位方法，其特征在于，使用三层循环神经网络RNN构建模型的编码(encoder)部分获取文本信息，使用RNN的其中一种变体：门控循环单元GRU，该模型的公式如下：zt＝σ(Wz·[ht-1，xt])其中ht-1为GRU的上一时刻隐状态，而xt是当前时刻输入模型的单词，Wz为可训练参数，σ是sigmoid函数，公式为：rt＝σ(Wr·[ht-1，xt])符号含义同上，其中最终得到了当前隐状态ht；经过同样的过程得到解码(decoder)...

【专利技术属性】
技术研发人员：吕建，徐锋，姚远，唐士杰，
申请(专利权)人：南京大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人