System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及计算机,尤其涉及一种众测产品的缺陷判定方法、装置、设备及存储介质。
技术介绍
1、一般情况下,企业将待测产品上传至众测平台,在一定时间内,众测人员会对该待测产品进行测试,并将测试到的缺陷描述文本上传至众测平台,由管理人员收集缺陷描述文本,再进行产品缺陷的汇总。
2、然而,在这个过程中,众测人员发现的产品缺陷重复率较高,提交的缺陷描述文本格式也比较多样,增加了管理人员对产品缺陷的汇总难度,降低了众测产品的缺陷判定效率。
技术实现思路
1、本申请的主要目的在于提供一种众测产品的缺陷判定方法、装置、设备及存储介质,旨在解决众测产品的缺陷判定效率的技术问题。
2、为实现上述目的,本申请提供一种众测产品的缺陷判定方法,所述众测产品的缺陷判定方法包括以下步骤:
3、获取针对众测产品的多个缺陷描述文本;
4、确定各所述缺陷描述文本的核心词集;
5、对所述核心词集进行文本聚类处理,得到所述多个缺陷描述文本的类型,以供管理人员基于所述多个缺陷描述文本的类型判定众测产品的缺陷。
6、可选地,所述确定各所述缺陷描述文本的核心词集的步骤,包括:
7、对各所述缺陷描述文本进行分词处理,得到分词处理结果;
8、基于所述分词处理结果,确定各所述缺陷描述文本的主题特征词以及高频词;
9、基于各所述缺陷描述文本对应的主题特征词以及高频词,确定各所述缺陷描述文本的核心词集。
10、可选地,
11、确定所述核心词集中对应核心词与对应分词处理结果中的分词词汇之间的相似度;
12、将相似度大于预设相似度阈值的分词词汇作为拓展词;
13、将所述拓展词添加至对应核心词集。
14、可选地,所述基于所述分词处理结果,确定各所述缺陷描述文本的主题特征词以及高频词的步骤,包括:
15、基于所述分词处理结果,通过lda模型,确定各所述缺陷描述文本的主题特征词;
16、计算各所述分词处理结果中的分词词汇对应在各所述缺陷描述文本中的出现频率;
17、将出现频率大于预设频率阈值的词汇作为所述高频词。
18、可选地,所述基于所述分词处理结果,确定各所述缺陷描述文本的主题特征词以及高频词的步骤之前,所述方法还包括:
19、对所述分词处理结果中的分词词汇进行清洗处理,得到清洗后的分词处理结果;
20、对清洗后的分词处理结果进行词性过滤处理,得到过滤后的分词处理结果,以基于过滤后的分词处理结果,确定各所述缺陷描述文本的主题特征词以及高频词,其中,所述词性过滤处理包括保留名词、动词和形容词。
21、可选地,所述对所述核心词集进行文本聚类处理,得到文本聚类结果的步骤之前,所述方法还包括:
22、计算所述核心词集中的核心词之间的互信息以及左右信息熵;
23、基于所述互信息以及左右信息熵,筛选复合词语;
24、基于所述复合词语以及未组合为复合词语的核心词,确定新的核心词集合。
25、可选地,所述对所述核心词集进行文本聚类处理,得到所述多个缺陷描述文本的类型的步骤之后,所述方法还包括以下至少一项:
26、确定每类缺陷描述文本对应的缺陷描述文本集合,基于各所述缺陷描述文本集合中缺陷描述文本的数量,以及所述多个缺陷描述文本的总数量,确定各类缺陷描述文本的占比,基于所述各类缺陷描述文本的占比,确定众测产品的严重缺陷;
27、获取所述缺陷描述文本集合中各缺陷描述文本的上传时间,基于所述上传时间,判定在预设时段内各所述缺陷描述文本集合中缺陷描述文本的提出频率,基于所述提出频率,确定是否向管理人员发出预警。
28、此外,为实现上述目的,本申请还提供一种众测产品的缺陷判定装置,所述众测产品的缺陷判定装置包括:
29、文本获取模块,用于获取针对众测产品的多个缺陷描述文本;
30、核心词集确定模块,用于确定各所述缺陷描述文本的核心词集;
31、文本聚类模块,用于对所述核心词集进行文本聚类处理,得到所述多个缺陷描述文本的类型,以供管理人员基于所述多个缺陷描述文本的类型确定众测产品的缺陷。
32、此外,为实现上述目的,本申请还提供一种设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的众测产品的缺陷判定程序,所述众测产品的缺陷判定程序配置为实现如上所述的众测产品的缺陷判定方法的步骤。
33、此外,为实现上述目的,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有众测产品的缺陷判定程序,所述众测产品的缺陷判定程序被处理器执行时实现如上所述的众测产品的缺陷判定方法的步骤。
34、本申请获取针对众测产品的多个缺陷描述文本,通过确定各所述缺陷描述文本的核心词集,对所述核心词集进行文本聚类处理,能够得到所述多个缺陷描述文本的类型,即,缺陷描述文本的类型与众测产品的缺陷,管理人员无需对杂乱的缺陷描述文本进行一一排查,而是基于经过聚类处理得到的所述多个缺陷描述文本的类型进行众测产品的缺陷汇总,能够提升众测产品的缺陷判定效率。
本文档来自技高网...【技术保护点】
1.一种众测产品的缺陷判定方法,其特征在于,所述众测产品的缺陷判定方法包括以下步骤:
2.如权利要求1所述的众测产品的缺陷判定方法,其特征在于,所述确定各所述缺陷描述文本的核心词集的步骤,包括:
3.如权利要求2所述的众测产品的缺陷判定方法,其特征在于,所述基于各所述缺陷描述文本对应的主题特征词以及高频词,确定所述多个缺陷描述文本的核心词集的步骤之后,所述方法还包括:
4.如权利要求2所述的众测产品的缺陷判定方法,其特征在于,所述基于所述分词处理结果,确定各所述缺陷描述文本的主题特征词以及高频词的步骤,包括:
5.如权利要求2所述的众测产品的缺陷判定方法,其特征在于,所述基于所述分词处理结果,确定各所述缺陷描述文本的主题特征词以及高频词的步骤之前,所述方法还包括:
6.如权利要求1所述的众测产品的缺陷判定方法,其特征在于,所述对所述核心词集进行文本聚类处理,得到文本聚类结果的步骤之前,所述方法还包括:
7.如权利要求1所述的众测产品的缺陷判定方法,其特征在于,所述对所述核心词集进行文本聚类处理,得到所述多个缺
8.一种众测产品的缺陷判定装置,其特征在于,所述众测产品的缺陷判定装置包括:
9.一种设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的众测产品的缺陷判定程序,所述众测产品的缺陷判定程序配置为实现如权利要求1至7中任一项所述的众测产品的缺陷判定方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有众测产品的缺陷判定程序,所述众测产品的缺陷判定程序被处理器执行时实现如权利要求1至7中任一项所述的众测产品的缺陷判定方法的步骤。
...【技术特征摘要】
1.一种众测产品的缺陷判定方法,其特征在于,所述众测产品的缺陷判定方法包括以下步骤:
2.如权利要求1所述的众测产品的缺陷判定方法,其特征在于,所述确定各所述缺陷描述文本的核心词集的步骤,包括:
3.如权利要求2所述的众测产品的缺陷判定方法,其特征在于,所述基于各所述缺陷描述文本对应的主题特征词以及高频词,确定所述多个缺陷描述文本的核心词集的步骤之后,所述方法还包括:
4.如权利要求2所述的众测产品的缺陷判定方法,其特征在于,所述基于所述分词处理结果,确定各所述缺陷描述文本的主题特征词以及高频词的步骤,包括:
5.如权利要求2所述的众测产品的缺陷判定方法,其特征在于,所述基于所述分词处理结果,确定各所述缺陷描述文本的主题特征词以及高频词的步骤之前,所述方法还包括:
6.如权利要求1所述的众测产品的缺陷判定方法,其特征在于,所...
【专利技术属性】
技术研发人员:王笑笑,
申请(专利权)人:招商银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。