重复缺陷报告识别方法、装置及电子设备制造方法及图纸

技术编号:24207866 阅读:47 留言:0更新日期:2020-05-20 15:28
本申请提供了一种重复缺陷报告识别方法、装置及电子设备,应用于计算机技术领域,其中该方法包括:实现了待识别缺陷报告是否为重复缺陷报告的自动识别,从而提升重复缺陷报告识别的效率,此外,基于第一相似度以及各个部分的内容信息与至少一个目标缺陷报告的相对应部分的第二相似度,确定所述待识别缺陷报告与至少一个目标缺陷报告的第三相似度,然后,基于所述待识别缺陷报告与至少一个目标缺陷报告的第三相似度,确定所述待识别缺陷报告是否为重复缺陷报告,即从多个维度计算的相似度确定是否为重复缺陷报告,从而提升了是否为重复缺陷报告的准确性。

Identification method, device and electronic equipment of repetitive defect report

【技术实现步骤摘要】
重复缺陷报告识别方法、装置及电子设备
本申请涉及计算机
,具体而言,本申请涉及一种重复缺陷报告识别方法、装置及电子设备。
技术介绍
缺陷报告是一种用自然语言发布的文档,描述了软件在运行过程中出现的无法正常运行和满足需求的故障情况,通常由软件的用户或测试人员提交,随后交给软件质量维护人员,而如何避免提交重复的缺陷报告成为了一个问题。目前,重复缺陷报告的识别是通过人工的方式实现的,即通过人工阅读各个提交的缺陷报告,确定是否为重复缺陷报告。然而,根据目前通过人工阅读确定是否为缺陷报告的方式,需要人工逐篇阅读提交的缺陷报告,然后判断是否为重复提交的缺陷报告,非常耗时。因此,现有的人工识别是否为重复缺陷报告的方式,存在效率低的问题。
技术实现思路
本申请提供了一种重复缺陷识别方法、装置及电子设备,用于提升重复缺陷报告的识别效率及准确性,本申请采用的技术方案如下:第一方面,提供了一种重复缺陷识别方法,该方法包括,计算确定待识别缺陷报告与至少一个目标缺陷报告的第一相似度;获取待识别缺陷报告的多个部分的内容信息,并分别确定各个部分的内容信息与至少一个目标缺陷报告的相对应部分的第二相似度,得到各个部分的内容信息的第二相似度;基于预定的第一相似度与各个部分的内容信息的第二相似度的权重值,确定待识别缺陷报告与至少一个目标缺陷报告的第三相似度;基于待识别缺陷报告与至少一个目标缺陷报告的第三相似度,确定待识别缺陷报告是否为重复缺陷报告。可选地,分别确定各个部分的内容信息与至少一个目标缺陷报告的相对应部分的第二相似度,包括:确定各个部分的内容信息的类型;基于各个部分的内容信息的类型,确定各个部分的内容信息与至少一个目标缺陷报告的相对应部分的第二相似度。可选地,多个部分的内容信息包括:测试案例信息、测试环境信息、缺陷创建者信息、缺陷责任人信息、缺陷标签信息;基于各个部分的内容信息的类型,确定各个部分的内容信息与至少一个目标缺陷报告的相对应部分的第二相似度,包括:当内容信息为测试案例信息、测试环境信息、缺陷标签信息时,通过计算文本向量之间的距离确定相应内容信息与至少一个目标缺陷报告的相对应部分的第二相似度;当内容信息为缺陷创建者信息、缺陷责任人信息时,通过关键词匹配的方式确定相应内容信息与至少一个目标缺陷报告的相对应部分的第二相似度。进一步地,该方法还包括:获取现有缺陷报告;判断现有缺陷报告与待识别缺陷报告是否包含相同的缺陷组件名称;当现有缺陷报告与待识别缺陷报告包含相同的缺陷组件名称时,将现有缺陷报告作为目标缺陷报告。进一步地,该方法还包括:对待识别缺陷报告与目标缺陷报告进行去停用词处理,停用词包括缺陷报告的固定模板字段;计算确定待识别缺陷报告与至少一个目标缺陷报告的第一相似度,具体包括:计算确定去停用词后的待识别缺陷报告与去停用词后的至少一个目标缺陷报告的第一相似度。第二方面,提供了一种重复缺陷报告识别装置,该装置包括,计算确定模块,用于计算确定待识别缺陷报告与至少一个目标缺陷报告的第一相似度;第一确定模块,用于获取待识别缺陷报告的多个部分的内容信息,并分别确定各个部分的内容信息与至少一个目标缺陷报告的相对应部分的第二相似度,得到各个部分的内容信息的第二相似度;第二确定模块,用于基于预定的第一相似度与各个部分的内容信息的第二相似度的权重值,确定待识别缺陷报告与至少一个目标缺陷报告的第三相似度;第三确定模块,用于基于待识别缺陷报告与至少一个目标缺陷报告的第三相似度,确定待识别缺陷报告是否为重复缺陷报告。可选地,第一确定模块,包括:第一确定单元,用于确定各个部分的内容信息的类型;第二确定单元,用于基于各个部分的内容信息的类型,确定各个部分的内容信息与至少一个目标缺陷报告的相对应部分的第二相似度。可选地,多个部分的内容信息包括:测试案例信息、测试环境信息、缺陷创建者信息、缺陷责任人信息、缺陷标签信息;第二确定单元,具体用于当内容信息为测试案例信息、测试环境信息、缺陷标签信息时,通过计算文本向量之间的距离确定相应内容信息与至少一个目标缺陷报告的相对应部分的第二相似度;和/或,具体用于当内容信息为缺陷创建者信息、缺陷责任人信息时,通过关键词匹配的方式确定相应内容信息与至少一个目标缺陷报告的相对应部分的第二相似度。进一步地,该装置还包括:获取模块,用于获取现有缺陷报告;判断模块,用于判断现有缺陷报告与待识别缺陷报告是否包含相同的缺陷组件名称;作为模块,用于当现有缺陷报告与待识别缺陷报告包含相同的缺陷组件名称时,将现有缺陷报告作为目标缺陷报告。进一步地,该装置还包括:去除模块,用于对待识别缺陷报告与目标缺陷报告进行去停用词处理,停用词包括缺陷报告的固定模板字段;第一计算确定模块,具体用于计算确定去停用词后的待识别缺陷报告与去停用词后的至少一个目标缺陷报告的第一相似度。第三方面,提供了一种电子设备,该电子设备包括:一个或多个处理器;存储器;一个或多个应用程序,其中一个或多个应用程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序配置用于:执行第一方面所示的重复缺陷报告识别方法。第四方面,提供了一种计算机可读存储介质,计算机存储介质用于存储计算机指令,当其在计算机上运行时,使得计算机可以执行第一方面所示的重复缺陷报告识别方法。本申请提供了一种重复缺陷报告识别方法、装置及电子设备,与现有技术通过人工的方式确定是否为重复缺陷报告相比,本申请通过计算确定待识别缺陷报告与至少一个目标缺陷报告的第一相似度,然后获取待识别缺陷报告的多个部分的内容信息,并分别确定各个部分的内容信息与至少一个目标缺陷报告的相对应部分的第二相似度,得到各个部分的内容信息的第二相似度,继而基于预定的第一相似度与各个部分的内容信息的第二相似度的权重值,确定待识别缺陷报告与至少一个目标缺陷报告的第三相似度,最后基于待识别缺陷报告与至少一个目标缺陷报告的第三相似度,确定待识别缺陷报告是否为重复缺陷报告。即实现了待识别缺陷报告是否为重复缺陷报告的自动识别,从而提升重复缺陷报告识别的效率,此外,基于第一相似度以及各个部分的内容信息与至少一个目标缺陷报告的相对应部分的第二相似度,确定待识别缺陷报告与至少一个目标缺陷报告的第三相似度,然后,基于待识别缺陷报告与至少一个目标缺陷报告的第三相似度,确定待识别缺陷报告是否为重复缺陷报告,即从多个维度计算的相似度确定是否为重复缺陷报告,从而提升了是否为重复缺陷报告的准确性。本申请附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本申请的实践了解到。附图说明本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图本文档来自技高网...

【技术保护点】
1.一种重复缺陷报告识别方法,其特征在于,包括:/n计算确定待识别缺陷报告与至少一个目标缺陷报告的第一相似度;/n获取待识别缺陷报告的多个部分的内容信息,并分别确定各个部分的内容信息与至少一个目标缺陷报告的相对应部分的第二相似度,得到各个部分的内容信息的第二相似度;/n基于预定的所述第一相似度与所述各个部分的内容信息的第二相似度的权重值,确定所述待识别缺陷报告与至少一个目标缺陷报告的第三相似度;/n基于所述待识别缺陷报告与至少一个目标缺陷报告的第三相似度,确定所述待识别缺陷报告是否为重复缺陷报告。/n

【技术特征摘要】
1.一种重复缺陷报告识别方法,其特征在于,包括:
计算确定待识别缺陷报告与至少一个目标缺陷报告的第一相似度;
获取待识别缺陷报告的多个部分的内容信息,并分别确定各个部分的内容信息与至少一个目标缺陷报告的相对应部分的第二相似度,得到各个部分的内容信息的第二相似度;
基于预定的所述第一相似度与所述各个部分的内容信息的第二相似度的权重值,确定所述待识别缺陷报告与至少一个目标缺陷报告的第三相似度;
基于所述待识别缺陷报告与至少一个目标缺陷报告的第三相似度,确定所述待识别缺陷报告是否为重复缺陷报告。


2.根据权利要求1所述的方法,其特征在于,所述分别确定各个部分的内容信息与至少一个目标缺陷报告的相对应部分的第二相似度,包括:
确定所述各个部分的内容信息的类型;
基于各个部分的内容信息的类型,确定所述各个部分的内容信息与至少一个目标缺陷报告的相对应部分的第二相似度。


3.根据权利要求1所述的方法,其特征在于,所述多个部分的内容信息包括:测试案例信息、测试环境信息、缺陷创建者信息、缺陷责任人信息、缺陷标签信息;
所述基于各个部分的内容信息的类型,确定所述各个部分的内容信息与至少一个目标缺陷报告的相对应部分的第二相似度,包括:
当所述内容信息为测试案例信息、测试环境信息、缺陷标签信息时,通过计算文本向量之间的距离确定相应内容信息与至少一个目标缺陷报告的相对应部分的第二相似度;
当所述内容信息为缺陷创建者信息、缺陷责任人信息时,通过关键词匹配的方式确定相应内容信息与至少一个目标缺陷报告的相对应部分的第二相似度。


4.根据权利要求1所述的方法,其特征在于,该方法还包括:
获取现有缺陷报告;
判断现有缺陷报告与所述待识别缺陷报告是否包含相同的缺陷组件名称;
当所述现有缺陷报告与所述待识别缺陷报告包含相同的缺陷组件名称时,将所述现有缺陷报告作为目标缺陷报告。


5.根据权利要求1-4任一项所述的方法,其特征在于,该方法还包括:
对所述待识别缺陷报告与所述目标缺陷报告进行去停用词处理,所述停用词包括缺陷报告的固定模板字段;
所述计算确定待识别缺陷报告与至少一个目标缺陷报告的第一相似度,具体包括:

【专利技术属性】
技术研发人员:章岩王建秋付晨孟博曹邦中由军强
申请(专利权)人:中信银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1