一种缺陷修复者自动推荐方法技术

技术编号：20272227 阅读：66 留言：0更新日期：2019-02-02 03:33

本发明专利技术提出了一种缺陷修复者自动推荐方法，首先当一个新报告提交到系统后，该方法将搜索相似的报告；然后从相似的报告中提取相关特征，比如候选的缺陷修复者。最后综合上述的因素进行推荐。实验证明本发明专利技术所述方法不仅提高了修复的可能性，避免了过多的重复推荐，而且减少了修复时间。

全部详细技术资料下载

【技术实现步骤摘要】
一种缺陷修复者自动推荐方法
本专利技术属于软件工程
，特别是涉及一种缺陷修复者自动推荐方法。
技术介绍
随着软件系统复杂性和规模的增加，软件缺陷的发生也越来越频繁，甚至造成巨大的经济损失，修复缺陷成为一项刻不容缓的工作。像Bugzilla一类的缺陷追踪系统使用大量的开发者人工对缺陷进行统一排查，并以缺陷报告的形式反馈给需要缺陷信息的开发者。所以他们面临着一些问题。重复推荐是其中之一，由于软件系统每天产生的缺陷及形成的缺陷报告数量庞大，内容相似的报告、相似的缺陷极易推荐给不同的开发者，造成重复推荐，从而导致修复上的困难和时间的浪费。
技术实现思路
本专利技术目的是为了解决现有技术中存在的问题，提出了一种缺陷修复者自动推荐方法。本专利技术所述方法不仅提高了修复的可能性，避免了过多的重复推荐，而且减少了修复时间。本专利技术的目的通过以下技术方案实现：一种缺陷修复者自动推荐方法，包括以下步骤：步骤一、将新生成的缺陷报告加入到数据库；步骤二、使用自然语言处理技术对缺陷报告进行预处理，并利用余弦定理计算该缺陷报告与其他缺陷报告的相似度；步骤三、使用支持向量机SVM将新生成的缺陷报告归类到与他相似度最高的一类中；步骤四、提取相关特征；步骤五、执行修复者推荐算法，得到最终的修复者推荐名单。进一步地，所述利用余弦定理计算该缺陷报告与其他缺陷报告的相似度，具体为：使用余弦相似度计算两个缺陷报告之间的相似度，公式如下：其中，Vi和Vj表示不同缺陷报告的向量，Wki指缺陷报告di中第k个词的权重，Wkj指缺陷报告dj中第k个词的权重，n代表词集的大小；两个权重的值通过TF-ID...

【技术保护点】
1.一种缺陷修复者自动推荐方法，其特征在于，包括以下步骤：步骤一、将新生成的缺陷报告加入到数据库；步骤二、使用自然语言处理技术对缺陷报告进行预处理，并利用余弦定理计算该缺陷报告与其他缺陷报告的相似度；步骤三、使用支持向量机SVM将新生成的缺陷报告归类到与他相似度最高的一类中；步骤四、提取相关特征；步骤五、执行修复者推荐算法，得到最终的修复者推荐名单。

【技术特征摘要】
1.一种缺陷修复者自动推荐方法，其特征在于，包括以下步骤：步骤一、将新生成的缺陷报告加入到数据库；步骤二、使用自然语言处理技术对缺陷报告进行预处理，并利用余弦定理计算该缺陷报告与其他缺陷报告的相似度；步骤三、使用支持向量机SVM将新生成的缺陷报告归类到与他相似度最高的一类中；步骤四、提取相关特征；步骤五、执行修复者推荐算法，得到最终的修复者推荐名单。2.根据权利要求1所述的方法，其特征在于，所述利用余弦定理计算该缺陷报告与其他缺陷报告的相似度，具体为：使用余弦相似度计算两个缺陷报告之间的相似度，公式如下：其中，Vi和Vj表示不同缺陷报告的向量，Wki指缺陷报告di中第k个词的权重，Wkj指缺陷报告dj中第k个词的权重，n代表词集的大小；两个权重的值通过TF-IDF来计算，公式如下：其中，tfki是缺陷报告di中第k个词的频率，N是总的缺陷报告数，nk代表第k个词至少出现一次的缺陷报告数；仅提取缺陷报告的标题和描述，分别独立计算两个缺陷报告标题之间和描述之间的文本相似值，根据以下公式得到两个缺陷报告之间的相似度(SBBR)：SBBR(bi，bj)＝α×tsij+(1-α)xdsij其中，tsij是指缺陷报告bi和bj标题之间的文本相似值，dsij是指缺陷报告bi和bj描述之间的文本相似值，α指标题在缺陷报告中所占的相对权重。3.根据权利要求2所述的方法，其特征在于，所述步骤三具体为：使用K-means聚类算法，将已有的缺陷报告聚类得到相似报告集，所述K-means聚类算法描述为：1)在空间中任意放置K个缺陷报告作为参考数据点，并保证他们足够分散，所述参考数据点将作为初始的簇的形心；2)将每一个缺陷报告分配到形心离他最近的那个簇中；3)当所有的缺陷...

【专利技术属性】
技术研发人员：张涛，杨泽浩，栾思敏，
申请(专利权)人：哈尔滨工程大学，
类型：发明
国别省市：黑龙江,23

全部详细技术资料下载我是这个专利的主人