异常记录的合并方法、装置及设备制造方法及图纸

技术编号:19263271 阅读:19 留言:0更新日期:2018-10-27 02:16
本申请实施例提供了一种异常记录的合并方法、装置及设备。该方法包括:获取目标对象的n条异常记录;对于n条异常记录中的第一异常记录和第二异常记录,根据第一异常记录中的字符和第二异常记录中的字符,获取第一异常记录和第二异常记录之间的相似度;若第一异常记录和第二异常记录之间的相似度大于第一阈值,则将第一异常记录和第二异常记录合并为同一类异常记录。本申请实施例提供的方案将相似的异常记录确定为同一类异常记录,能够避免相似的异常记录被分散统计,使得最终的分类结果更为集中,相似的异常记录所反映的问题不会被忽略。

Merging method, device and equipment for abnormal records

The application embodiment provides a merging method, device and device for abnormal records. The method includes: obtaining n abnormal records of the target object; obtaining the similarity between the first abnormal record and the second abnormal record according to the characters in the first abnormal record and the second abnormal record; if the first abnormal record and the second abnormal record are different; If the similarity between common records is greater than the first threshold, the first and second anomaly records are merged into the same category of anomaly records. The scheme provided by the embodiment of the present application identifies similar anomaly records as the same kind of anomaly records, avoiding the scattered statistics of similar anomaly records, making the final classification results more centralized, and the problems reflected by similar anomaly records can not be ignored.

【技术实现步骤摘要】
异常记录的合并方法、装置及设备
本申请实施例涉及数据统计
,特别涉及一种异常记录的合并方法、装置及设备。
技术介绍
应用程序在运行过程中会出现各种异常,通过采集相应的异常记录,对异常记录进行分析,能及时对应用程序进行优化。目前,应用程序的异常记录中记录有该应用程序出现异常时的堆栈信息。堆栈信息用于反映应用程序出现异常时的函数调用关系。相关技术中,异常记录分析平台在获取到某一应用程序的多条异常记录之后,将堆栈信息完全一致的异常记录合并为同一类异常记录,并统计出每一类异常记录中所包含的异常记录的数量。上述异常记录的合并方法,最终得到的类较多,异常记录会分布于上述多个类中,导致最终的分类结果较为分散,从而容易忽略掉一部分异常记录所反映的问题。
技术实现思路
本申请实施例提供了一种异常记录的合并方法、装置及设备,可用于解决相关技术提供的异常记录的合并方法,所存在的分类结果较为分散的问题。一方面,本申请实施例提供了一种异常记录的合并方法,所述方法包括:获取目标对象的n条异常记录,所述异常记录用于记录所述目标对象在运行时发生的异常状况,所述n为大于1的整数;对于所述n条异常记录中的第一异常记录和第二异常记录,根据所述第一异常记录和所述第二异常记录内的字符,获取所述第一异常记录和所述第二异常记录之间的相似度;其中,所述第一异常记录和所述第二异常记录中存在至少一个字符不相同;若所述第一异常记录和所述第二异常记录之间的相似度大于第一阈值,则将所述第一异常记录和所述第二异常记录合并为同一类异常记录。另一方面,本申请实施例提供了一种异常记录的合并装置,所述装置包括:记录获取模块,用于获取目标对象的n条异常记录,所述异常记录用于记录所述目标对象在运行时发生的异常状况,所述n为大于1的整数;相似度获取模块,用于对于所述n条异常记录中的第一异常记录和第二异常记录,根据所述第一异常记录和所述第二异常记录内的字符,获取所述第一异常记录和所述第二异常记录之间的相似度;其中,所述第一异常记录和所述第二异常记录中存在至少一个字符不相同;合并模块,用于若所述第一异常记录和所述第二异常记录之间的相似度大于第一阈值,则将所述第一异常记录和所述第二异常记录合并为同一类异常记录。再一方面,本申请实施例提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述方面所述的异常记录的合并方法。又一方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现上述方面所述的异常记录的合并方法。又一方面,提供了一种计算机程序产品,当该计算机程序产品被执行时,其用于执行上述方面所述的异常记录的合并方法。本申请实施例提供的技术方案带来的有益效果至少包括:通过计算两条异常记录之间的相似度,并在上述相似度大于第一阈值时,将上述两条异常记录合并为同一类异常记录;相较于将相同的异常记录确定为同一类异常记录,本申请实施例提供的方案将相似的异常记录确定为同一类异常记录,能够避免相似的异常记录被分散统计,使得最终的分类结果更为集中,相似的异常记录所反映的问题不会被忽略。附图说明图1示例性示出了一种异常记录的分类结果的示意图;图2示例性示出了两条异常记录的示意图;图3是本申请一个实施例提供的实施环境的示意图;图4是本申请一个实施例提供的异常记录的合并方法的流程图;图5示例性示出了两条异常记录的相似度的示意图;图6示例性示出了若干条异常记录的相似度的示意图;图7是本申请一个实施例提供的计算相似度的示意图;图8是本申请另一个实施例提供的计算相似度的示意图;图9是本申请另一个实施例提供的计算相似度的示意图;图10是本申请另一个实施例提供的异常记录的合并方法的流程图;图11是本申请另一个实施例提供的异常记录的合并方法的示意图;图12是本申请另一个实施例提供的异常记录的合并方法的框图;图13和图14是本申请一个实施例提供的分类结果的示意图;图15示例性示出了各个应用程序的异常记录影响面的示意图;图16是本申请一个实施例提供的异常记录的合并装置的框图;图17本申请一个实施例提供的电子设备的结构框图。具体实施方式为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。对本申请实施例进行描述之前,先对本申请实施例涉及的相关名词进行介绍。StackText:堆栈信息,Crash文件中保存的应用程序崩溃时的函数调用关系。Crash文件:应用程序崩溃后生成的记录有程序执行状态的文件。Crash影响面:单位时间内某个Crash的发生次数,与所有Crash的发生总次数之间的百分比。Crash优先级:其可以根据Crash影响面确定。Crash影响面越高,则Crash优先级越高;Crash影响面越低,则Crash优先级越低。其中,优先级高于一定影响面的Crash可以称之为高优先级Crash。异常记录分析平台:一种用于对Crash进行统计、分析的平台。例如,GameBaby平台。编辑距离(EditDistance)算法:一种用来计算两个字符串之间的编辑距离,量化评估两个字符串之间相似度的算法,也称Levenshtein距离。请参考图1,其示出了采用相关技术提供的异常记录合并方法,所得到的分类结果的示意图。如图1所示,将相同的异常记录合并为同一类,图1中每一个条目代表一条异常记录。以第一个条目11为例,其表示异常记录“GDPSSdk+0x37843”的日影响用户的数量为6138、该异常记录的日影响用户的数量占日影响用户的总数量的百分比为4.43%、发生次数为8862次,该异常记录的发生次数占总发生次数的百分比为4.4%。采用上述相关技术提供的异常记录的合并方法,由于分类粒度大,导致差异性较小的同类问题被分散统计,后续技术人员基于异常记录的影响面来对应用程序进行优化时,可能会忽略上述同类问题,进而导致优化效果不佳。以图2所示的两条异常记录为例,异常记录1的栈顶21与异常记录2的栈顶22不相同,而其它栈帧完全一致,这两条异常记录应当反映的是相同或类似的问题,但如图1所示,采用相关技术提供的异常记录的合并方法,这两条异常记录并不会被合并至同一类异常记录中。请参考图3,其示出了本申请一个实施例示出的实施环境的示意图。该实施环境包括至少一个终端31和服务器32。至少一个终端31中运行有目标对象,可选地,目标对象是应用程序、数据库、进程等。终端31可以是手机、平板电脑、电子书阅读器、多媒体播放设备、可穿戴设备、膝上型便携计算机等电子设备。服务器32具有对异常记录进行统计、分析的功能。可选地,服务器32是异常记录分析平台中的服务器。可选地,服务器32还具有异常记录采集功能。在上述至少一个终端31运行目标对象的过程中发生异常时,服务器32从上述至少一个终端31中获取异常记录。服务器32可以是一台服务器,也可以包括由多台服务器组成的服务器集群。至少一个终端31与第一服务器32之间建立有通信连接。上述本文档来自技高网...

【技术保护点】
1.一种异常记录的合并方法,其特征在于,所述方法包括:获取目标对象的n条异常记录,所述异常记录用于记录所述目标对象在运行时发生的异常状况,所述n为大于1的整数;对于所述n条异常记录中的第一异常记录和第二异常记录,根据所述第一异常记录和所述第二异常记录内的字符,获取所述第一异常记录和所述第二异常记录之间的相似度;其中,所述第一异常记录和所述第二异常记录中存在至少一个字符不相同;若所述第一异常记录和所述第二异常记录之间的相似度大于第一阈值,则将所述第一异常记录和所述第二异常记录合并为同一类异常记录。

【技术特征摘要】
1.一种异常记录的合并方法,其特征在于,所述方法包括:获取目标对象的n条异常记录,所述异常记录用于记录所述目标对象在运行时发生的异常状况,所述n为大于1的整数;对于所述n条异常记录中的第一异常记录和第二异常记录,根据所述第一异常记录和所述第二异常记录内的字符,获取所述第一异常记录和所述第二异常记录之间的相似度;其中,所述第一异常记录和所述第二异常记录中存在至少一个字符不相同;若所述第一异常记录和所述第二异常记录之间的相似度大于第一阈值,则将所述第一异常记录和所述第二异常记录合并为同一类异常记录。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一异常记录和所述第二异常记录内的字符,获取所述第一异常记录和所述第二异常记录之间的相似度,包括:将所述第一异常记录划分为m个第一字符串,以及将所述第二异常记录划分为m个第二字符串,所述m为大于1的整数;计算m组对应字符串的相似度,其中,所述m组对应字符串中的第i组对应字符串包括第i个第一字符串和第i个第二字符串,所述i为正整数;根据所述m组对应字符串的相似度,确定所述第一异常记录和所述第二异常记录之间的相似度。3.根据权利要求2所述的方法,其特征在于,所述根据所述m组对应字符串的相似度,确定所述第一异常记录和所述第二异常记录之间的相似度,包括:对于所述m组对应字符串中的第i组对应字符串,将所述第i组对应字符串的相似度与所述第i组对应字符串对应的权值相乘,得到所述第i组对应字符串的加权相似度;将所述m组对应字符串的加权相似度累加,得到所述第一异常记录和所述第二异常记录之间的相似度。4.根据权利要求2所述的方法,其特征在于,所述根据所述m组对应字符串的相似度,确定所述第一异常记录和所述第二异常记录之间的相似度,包括:将所述m组对应字符串的相似度的平均值,确定为所述第一异常记录和所述第二异常记录之间的相似度。5.根据权利要求2所述的方法,其特征在于,所述根据所述m组对应字符串的相似度,确定所述第一异常记录和所述第二异常记录之间的相似度,包括:将所述m组对应字符串的相似度中的最小值,确定为所述第一异常记录和所述第二异常记录之间的相似度。6.根据权利要求1所述的方法,其特征在于,所述根据所述第一异常记录和所述第二异常记录内的字符,获取所述第一异常记录和第二异常记录之间的相似度,包括:获取所述第一异常记录和所述第二异常记录之间的编辑距离;获取所述编辑距离与目标异常记录的字符串长度之间的比值,所述目标异常记录是所述第一异常记录或所述第二异常记录;根据所述编辑距离与所述目标异常记录的字符串长度之间的比值,确定所述第一异常记录和所述第二异常记录之间的相似度。7.根据权利要求1所述的方法,其特征在于,所述根据所述第一异常记录和所述第二异常记录内的字符,获取所述第一异常记录和第二异常记录之间的相似度,包括:获取所述第一异常记录对应的第一向量,以及所述第二异常记录对应的第二向量;将所述第一向量与所述第二向量之间的余弦距离确定为所述第一异常记录和第二异常记录之间的相似度。8.根据权利要求1至7任一项所述的方法,其特征在于,所述获取目标对象的n条异常记录之后...

【专利技术属性】
技术研发人员:吴创
申请(专利权)人:深圳市腾讯网络信息技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1