相关问题推荐方法、设备和存储介质技术

技术编号:39260428 阅读:11 留言:0更新日期:2023-10-30 12:12
本申请提供一种相关问题推荐方法、设备和存储介质,该方法包括:获取第一项目中的第一问题;构建与第一问题对应的跨项目候选问题集合,跨项目候选问题集合中包括与第一问题可能相关的多个第二问题,多个第二问题来自于多个第二项目;将第一问题分别与多个第二问题组合,以形成多个待检测问题对;确定多个待检测问题对各自的文本特征和项目特征,根据多个待检测问题对各自的文本特征和项目特征以及预先训练的分类模型,从多个第二问题中确定与第一问题相关的目标第二问题,通过该方法,及时准确地推荐与问题相关的跨项目问题,提升问题的修复效率。的修复效率。的修复效率。

【技术实现步骤摘要】
相关问题推荐方法、设备和存储介质


[0001]本专利技术涉及计算机
,尤其涉及一种相关问题推荐方法、设备和存储介质。

技术介绍

[0002]开源软件在大规模群体的协同开发过程中彼此关联、共同发展,促进了软件供应链的形成和发展。开源项目之间往往彼此关联,一个项目中软件的产生可能来源于它的上游项目,也可能来源于它的下游项目,这种关联到其它项目的问题的软件修复时间通常比项目内问题的修复时间长,同时,需要的开发人员数量也比项目内问题中的开发人员数量多,这不仅给开发人员的修复工作增加了难度,同时也对维护软件供应链带来了挑战。
[0003]开源软件开发社区提供了问题追踪系统(I ssue Tracking System),以辅助开发人员管理项目中以及项目间出现的问题。在问题追踪系统中,用户可以报告开发过程中发现的软件,其他开发人员可以围绕感兴趣的问题参与讨论,开发人员可能在问题的讨论中指出与问题相关的来自其他项目中的问题,而这种指出的跨项目相关问题为问题的修复提供更多有效的信息,可以帮助开发人员尽快修复问题,降低修复工作的难度和修复时间。
[0004]然而,在一个问题刚发布时,从海量的项目和问题中发现与问题相关的问题需要开发人员花费大量的时间和精力,而且,识别软件的跨项目相关问题往往需要依赖开发人员的开发经验和知识,使得人工识别跨项目相关问题具有挑战性。

技术实现思路

[0005]本专利技术实施例提供一种相关问题推荐方法、设备和存储介质,用以快速准确地推荐与问题相关的跨项目问题。
[0006]第一方面,本专利技术实施例提供一种相关问题推荐方法,所述方法包括:
[0007]获取第一项目中的第一问题;
[0008]构建与所述第一问题对应的跨项目候选问题集合,所述跨项目候选问题集合中包括与所述第一问题可能相关的多个第二问题,所述多个第二问题来自于多个第二项目;
[0009]将所述第一问题分别与所述多个第二问题组合,以形成多个待检测问题对;
[0010]确定所述多个待检测问题对各自的文本特征和项目特征,其中,任一待检测问题对的文本特征用于反映所述任一待检测问题对中两个问题的描述信息之间的文本相关性,所述任一待检测问题对的项目特征用于反映所述任一待检测问题对中两个问题所属的两个项目之间的相关性;
[0011]根据所述多个待检测问题对各自的文本特征和项目特征以及预先训练的分类模型,从所述多个第二问题中确定与所述第一问题相关的目标第二问题。
[0012]第二方面,本专利技术实施例提供一种相关问题推荐装置,所述装置包括:
[0013]获取模块,用于获取第一项目中的第一问题;
[0014]确定模块,用于构建与所述第一问题对应的跨项目候选问题集合,所述跨项目候选问题集合中包括与所述第一问题可能相关的多个第二问题,所述多个第二问题来自于多
个第二项目;以及,将所述第一问题分别与所述多个第二问题组合,以形成多个待检测问题对;
[0015]推荐模块,用于确定所述多个待检测问题对各自的文本特征和项目特征,根据所述多个待检测问题对各自的文本特征和项目特征以及预先训练的分类模型,从所述多个第二问题中确定与所述第一问题相关的目标第二问题,其中,任一待检测问题对的文本特征用于反映所述任一待检测问题对中两个问题的描述信息之间的文本相关性,所述任一待检测问题对的项目特征用于反映所述任一待检测问题对中两个问题所属的两个项目之间的相关性。
[0016]第三方面,本专利技术实施例提供一种电子设备,包括:存储器、处理器、通信接口;其中,所述存储器上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如第一方面所述的相关问题推荐方法或第三方面所述的训练方法。
[0017]第四方面,本专利技术实施例提供了一种非暂时性机器可读存储介质,所述非暂时性机器可读存储介质上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器至少可以实现如第一方面所述的相关问题推荐方法或第三方面所述的训练方法。
[0018]本专利技术实施例中,获取第一项目中新发布的第一问题,构建与第一问题对应的跨项目候选问题集合,其中,跨项目候选问题集合中包括与第一问题可能相关的多个第二问题,通过构建跨项目候选问题集合的方式,缩小相关问题的选取范围,同时尽可能保留与第一问题相关的问题,降低相关问题推荐的复杂度和推荐的工作量。之后,将第一问题分别与跨项目候选问题集合中的每个问题进行组合,以形成多个待检测问题对。确定多个待检测问题对各自的文本特征和项目特征,文本特征反映了每个待检测问题对中跨项目候选问题集合中的问题(也就是第二问题)与第一问题之间的文本相关性,项目特征反映了每个待检测问题对中跨项目候选问题集合中的问题(也就是第二问题)与第一问题之间的项目相关性,由于问题的描述信息是以文本的形式呈现,同时,问题来自于项目,因此,问题的文本特征和项目特征从多维度呈现了每个待检测问题对中两个问题之间的相关性,使得两个问题之间相关性的确定更具有全面性和客观性,最后,结合多个待检测问题对各自的文本特征和项目特征以及预先训练的分类模型,从多个第二问题中确定与第一问题相关的目标第二问题,自学习的分类模型有助于提升相关问题确定的准确性。通过上述方法,在第一问题发布时,能够准确从海量的项目和问题中推荐与第一问题相关的跨项目问题,提高跨项目相关问题的推荐效率,进而提升问题的修复时间,并降低问题的修复难度。
附图说明
[0019]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020]图1为本专利技术实施例提供的一种相关问题推荐方法的流程图;
[0021]图2为本专利技术实施例提供的一种相关问题推荐方法的原理图;
[0022]图3为本专利技术实施例提供的一种候选问题集合构建方法的示意图;
[0023]图4为本专利技术实施例提供的一种阈值和时间范围确定方法的流程图;
[0024]图5为本专利技术实施例提供的一种相关问题推荐方法的流程图;
[0025]图6为本专利技术实施例提供的一种分类模型训练方法的流程图;
[0026]图7为本专利技术实施例提供的一种相关问题推荐方法的原理图;
[0027]图8为本专利技术实施例提供的一种相关问题推荐装置的结构示意图;
[0028]图9为本实施例提供的一种电子设备的结构示意图。
具体实施方式
[0029]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。另外,下述各方法实施例中的步骤本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种相关问题推荐方法,其特征在于,所述方法包括:获取第一项目中的第一问题;构建与所述第一问题对应的跨项目候选问题集合,所述跨项目候选问题集合中包括与所述第一问题可能相关的多个第二问题,所述多个第二问题来自于多个第二项目;将所述第一问题分别与所述多个第二问题组合,以形成多个待检测问题对;确定所述多个待检测问题对各自的文本特征和项目特征,其中,任一待检测问题对的文本特征用于反映所述任一待检测问题对中两个问题的描述信息之间的文本相关性,所述任一待检测问题对的项目特征用于反映所述任一待检测问题对中两个问题所属的两个项目之间的相关性;根据所述多个待检测问题对各自的文本特征和项目特征以及预先训练的分类模型,从所述多个第二问题中确定与所述第一问题相关的目标第二问题。2.根据权利要求1所述的方法,其特征在于,所述构建与所述第一问题对应的跨项目候选问题集合,包括:对于任一候选项目,确定所述候选项目与所述第一项目之间存在的历史相关问题对的数量,其中,所述历史相关问题对是指在所述第一问题发生之前所述第一项目与所述候选项目之间已经确定出的相关的问题对;若所述候选项目与所述第一项目之间存在的历史相关问题对的数量大于目标阈值,则从所述候选项目对应的多个历史问题中确定发布时间与所述第一问题的发布时间在目标时间范围内的目标历史问题,以将所述目标历史问题添加到所述跨项目候选问题集合中,其中,所述候选项目为所述多个第二项目中的一个。3.根据权利要求2所述的方法,其特征在于,所述目标阈值是从多个阈值中确定的,所述目标时间范围是从多个时间范围中确定的;所述方法还包括:基于任一参数组,获取多个历史问题对应的多个跨项目候选问题集合,所述任一参数组中包括所述多个阈值中任一阈值和所述多个时间范围中任一时间范围;根据所述多个跨项目候选问题集合中各自包含的问题数量,确定所述多个历史问题在所述任一参数组下对应的候选问题对均值;对于所述多个历史问题中任一历史问题,确定与所述任一历史问题相关的问题的参考数量,以及所述任一历史问题对应的跨项目候选问题集合中与所述任一历史问题相关的问题的实际数量;根据所述多个历史问题各自对应的所述实际数量和所述参考数量,确定所述多个历史问题在所述任一参数组下对应的相关问题对覆盖率;根据所述多个历史问题在多个参数组下分别对应的候选问题对均值和相关问题对覆盖率,确定目标参数组,所述目标参数组中包括所述目标阈值和所述目标时间范围。4.根据权利要求1所述的方法,其特征在于,确定所述多个待检测问题对各自的文本特征,包括:对于所述多个待检测问题对中的目标待检测问题对,确定所述第一问题的文本向量与所述目标待检测问题对中第二问题的文本向量;确定所述第一问题的文本向量与所述第二问题的文本向量之间的多个相似度,所述多
个相似度对应于多种相似度计算方式;根据所述多个相似度确定所述目标待检测问题对的文本特征。5.根据权利要求4所述的方法,其特征在于,所述第一问题和所述第二问题的描述信息中均包括用于简要描述相应问题的标题描述信息以及用于详细描述相应问题的正文描述信息;所述第一问题的文本向量和所述第二问题的文本向量中均包括与相...

【专利技术属性】
技术研发人员:聂笑盈刘宝川
申请(专利权)人:苏州云上看科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1