【技术实现步骤摘要】
异常问题聚类的方法及装置
本公开涉及通信及计算机处理领域,尤其涉及异常问题聚类的方法及装置。
技术介绍
相关技术中,移动终端系统每天可能发生大量的异常问题。这些异常问题的相关信息会存储在专门的栈中,这些栈称为异常栈。对异常栈进行聚类处理,以便对异常问题进行归类,有助于对异常问题进行后续的分析等处理。所以,如何进行更有效的聚类处理,是业内一直在研究的问题。
技术实现思路
为克服相关技术中存在的问题,本公开提供一种异常问题聚类的方法及装置。根据本公开实施例的第一方面,提供一种异常问题聚类的方法,包括:从多个异常栈中分别提取出异常描述信息;计算异常栈与异常栈之间,异常描述信息的相似性,得到相似度;根据所述相似度对异常栈进行聚类处理,并确定类中心。本公开的实施例提供的技术方案可以包括以下有益效果:本实施例中根据异常栈中的异常描述信息对异常栈进行聚类处理,由于异常描述信息对异常问题描述更准确,所以聚类效果也更好。在一个实施例中,所述异常描述信息至少包括下列之一:异常语言描述信息、异常 ...
【技术保护点】
1.一种异常问题聚类的方法,其特征在于,包括:/n从多个异常栈中分别提取出异常描述信息;/n计算异常栈与异常栈之间,异常描述信息的相似性,得到相似度;/n根据所述相似度对异常栈进行聚类处理,并确定类中心。/n
【技术特征摘要】
1.一种异常问题聚类的方法,其特征在于,包括:
从多个异常栈中分别提取出异常描述信息;
计算异常栈与异常栈之间,异常描述信息的相似性,得到相似度;
根据所述相似度对异常栈进行聚类处理,并确定类中心。
2.根据权利要求1所述的异常问题聚类的方法,其特征在于,所述异常描述信息至少包括下列之一:异常语言描述信息、异常标记、异常数值、异常代码标识、与异常相关的函数的库信息和类信息。
3.根据权利要求2所述的异常问题聚类的方法,其特征在于,所述计算异常栈与异常之间,异常描述信息的相似性,得到相似度,包括:
采用编辑距离算法,对异常栈与异常之间的异常语言描述信息、与异常相关的函数的库信息和类信息分别计算相似性,得到相应的每项异常描述信息的子相似度;
采用精确匹配算法,对异常栈与异常之间的异常标记、异常数值、异常代码标识分别计算相似性,得到相应的每项异常描述信息的子相似度;
根据每项异常描述信息的子相似度,得到异常栈的相似度。
4.根据权利要求3所述的异常问题聚类的方法,其特征在于,所述采用编辑距离算法,对异常栈与异常之间的与异常相关的函数的库信息和类信息分别计算相似性,得到相应的每项异常描述信息的子相似度,包括:
针对所述库信息和类信息中的每一层,分别计算子相似度;
对同层级的多个子相似度求平均;
对多个层级的子相似度进行加权求和,其中,栈层级越低的子相似度对应的权重越大。
5.根据权利要求1所述的异常问题聚类的方法,其特征在于,计算异常栈与异常栈之间,异常描述信息的相似性,得到相似度之前,所述方法还包括:
对每个异常栈中的异常描述信息进行唯一性编码,得到唯一编码;
根据所述唯一编码,对异常栈进行去重处理。
6.根据权利要求1所述的异常问题聚类的方法,其特征在于,计算异常栈与异常栈之间,异常描述信息的相似性,得到相似度,包括:
对每个异常栈中的异常描述信息进行矢量编码,得到矢量编码结果;
计算异常栈与异常栈之间,矢量编码结果的相似性,得到相似度。
7.根据权利要求1所述的异常问题聚类的方法,其特征在于,所述根据所述相似度对异常栈进行聚类处理,并确定类中心,包括:
统计相同异常栈的个数;
按照个数由高到低的顺序,根据所述相似度对异常栈进行聚类处理,并确定类中心。
8.根据权利要求7所述的异常问题聚类的方法,其特征在于,所述按照个数由高到低的顺序,根据所述相似度对异常栈进行聚类处理,并确定类中心,包括:
将得到的所述相似度存储到预设的存储结构中;所述存储结构包括:两层哈希图或数组;
按照个数由高到低的顺序,对所述存储结构进行遍历,并进行聚类处理,以及确定类中心。
9.一种异常问题聚类的装置,其特征在于,包括:
提取模块,用于从多个异常栈中分别提取出异常描述信息;
计算模块...
【专利技术属性】
技术研发人员:孙佩霞,刘喜文,祁宏伟,
申请(专利权)人:北京小米智能科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。