The invention discloses a software defect assisted dispatch method based on degree of text and active developers, by considering the defect report text information and active developers, text features on the one hand the use of two-way circulation network and pool extraction method of defect report, using one-way network to extract specific time hand developer activity characteristics and, two, gives a new assignment model based on defect text and developers activity defect reports, so as to improve the accuracy of low defect distribution problems better auxiliary. Experimental results on four different open source data sets such as Eclipse show that this method has significantly improved the accuracy of defect allocation prediction compared with the same kind of work.
【技术实现步骤摘要】
一种基于文本和开发者活跃度的软件缺陷辅助分派方法
本专利技术涉及一种基于文本和开发者活跃度的软件缺陷辅助分派方法,属于软件辅助缺陷分派
本专利技术利用包含词序关系的文本信息,以及开发者活跃度信息,基于循环神经网络训练模型,有效增强了对新缺陷报告分派开发者的能力,提高了辅助缺陷分派系统的推荐精度。
技术介绍
近年来,随着软件规模不断扩大,大型软件项目往往使用缺陷追踪系统进行统一管理。当一份缺陷报告提交到缺陷追踪系统,管理人员(高级开发者或者项目负责人)需要浏览缺陷报告,并为其选择适合的开发者。这种为缺陷报告指定开发者的过程,被称为缺陷分派。然而,缺陷分派是一项耗时耗力的事情。一方面,大型项目每天收到的缺陷报告数量较多,如Eclipse项目平均每天收到91份缺陷报告、Redhat项目平均每天收到222份缺陷报告;另一方面,大型项目的开发与维护往往需要大量的开发者,对于Eclipse、Mozilla项目,分别有超过1800名开发者参与到缺陷修复的工作中。如果由人工进行缺陷分派,会消耗大量的时间和人力资源。为解决此问题,一种可行的办法是辅助缺陷分派,即通过统计、学 ...
【技术保护点】
一种基于文本和开发者活跃度的软件缺陷辅助分派方法,其特征在于,分为训练和推荐两个阶段:训练阶段,通过学习历史已经包含修复开发者的缺陷报告建立模型;预测阶段,向模型输入新的、未分派的缺陷报告,模型将输出候选开发者列表。
【技术特征摘要】
1.一种基于文本和开发者活跃度的软件缺陷辅助分派方法,其特征在于,分为训练和推荐两个阶段:训练阶段,通过学习历史已经包含修复开发者的缺陷报告建立模型;预测阶段,向模型输入新的、未分派的缺陷报告,模型将输出候选开发者列表。2.如权利要求1所述的基于文本和开发者活跃度的软件缺陷辅助分派方法,其特征在于,首先获取缺陷追踪系统中已修复的缺陷报告,对数据进行预处理,提取其文本信息,以及开发者活动序列信息;在训练阶段,训练深度神经网络模型;将文本信息、开发者活动序列信息一同输入到一个深度神经网络中,令缺陷报告b=(br,pc),其中br表示文本信息,pc表示产品、模块信息;又令al表示当前时刻所有开发者的活动序列;定义函数:subal(al,pc)输入当前时刻开发者的活动序列全集al,以及特定的产品、模块组合pc,得到特定pc下的开发者修复序列;随后,模型使用了两个子神经网络,提取文本信息和开发者活动序列信息的高层特征:hbr=G(br)hal=H(subal(al,pc))其中,G表示了利用双向循环网络加池化方法提取缺陷报告的文本特征,H表示了利用单向循环网络提取特定时刻的开发者活跃度特征;其次,将两部分高层特征进行拼接:c=Combine(hbr,hal)函数Combine输入两个高层特征向量,输出一个经过融合的向量;最终,对某特定开发者d的评分函数,表示为:sθ(d,br,subal(al,pc))=c*w+b其中,w为一行权重向量,b为一个特定数值,两者作为模型的参数,对于每一个开发者皆存在一组w和b;利用历史已修复数据对此深度神经网络模型进行训练,并基于训练完成的模型进行新的缺陷报告的修复者预测。3.如权利要求1所述的基于文本和开发者活跃度的软件缺陷辅助分派方法,其特征在于,定义预测函数F为:
【专利技术属性】
技术研发人员:吕建,徐锋,姚远,席圣渠,
申请(专利权)人:南京大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。