【技术实现步骤摘要】
本专利技术涉及信息分析领域,更具体地,涉及一种基于共同序列模式的分析系统和方法。
技术介绍
随着计算机技术的不断发展,经常存在需要在多个系统中部署产品组件的情形。一旦出现错误(error),针对复杂产品组件的分析是耗时以及复杂的工作(即使对于简单的产品部署来说也是如此)。相关信息(例如应用日志、系统日志/事件)被放置在若干主机/组件、实例中。如何分析信息并找到错误的根源是极富挑战性的工作。现有的方法一般通过查看单个案例的单个日志文件来查找问题,这不能检测事件序列并获得有用信息。在复杂的多生产环境中,找到问题根源非常困难,尤其是在存在多个噪声信息时尤其如此。历史性日志不能用于未来的诊断和对严重问题的预防。之前的信息在分析之后不能以适当形式保存。可以看到,要从复杂的事件中获得问题的根源而不比较不同的日志信息是非常困难的。
技术实现思路
为了解决现有技术中存在的上述问题,本专利技术提出如下方案。根据本专利技术的第一方面,提供一种信息分析方
【技术保护点】
一种信息分析方法,包括:基于源信息集合生成元数据集合,所述元数据包括错误日志信息,所述错误日志信息在所述元数据集合中构成错误序列;以及为多个所述元数据集合生成共同错误序列集合。
【技术特征摘要】
1.一种信息分析方法,包括:
基于源信息集合生成元数据集合,所述元数据包括错误日志信
息,所述错误日志信息在所述元数据集合中构成错误序列;以及
为多个所述元数据集合生成共同错误序列集合。
2.根据权利要求1所述的方法,其中所述元数据还包括时间信
息,并且所述方法进一步包括:
在所述第一集合中归一化所述时间信息。
3.根据权利要求1所述的方法,进一步包括:
在所述元数据集合中去除重复的错误日志信息。
4.根据权利要求3所述的方法,其中所述去除重复的错误日志
信息进一步包括去除以下中的一个或多个类型的消息:
完全相同的错误日志、仅非关键部分不同而其它部分完全相同的
错误日志、关键部分相同的错误日志、用户认定为重复的错误日志。
5.根据权利要求3所述的方法,其中所述去除重复的错误日志
信息进一步包括通过机器学习进行和/或由用户进行。
6.根据权利要求1-5之任一所述的方法,其中所提取的元数据
为设定时间段内的元数据和/或来自设定的源。
7.根据权利要求1-5之任一所述的方法,其中为多个所述元数
据集合生成共同错误序列集合进一步包括:
为多个所述元数据集合中的每两个所述元数据集合生成共同错
误序列集合;以及
将所生成的每两个所述元数据集合的共同错误序列集合合并为
所述多个元数据集合的共同错误序列集合。
8.根据权利要求7所述的方法,其中为多个所述元数据集合中
的每两个所述元数据集合生成共同错误序列集合为并行进行。
9.根据权利要求7所述的方法,其中将所生成的每两个所述元
数据集合的共同错误序列集合合并为所述多个元数据集合的共同错
误序列集合进一步包括:
统计每个共同错误序列出现的次数。
10.根据权利要求1-5之任一所述的方法,其中所述错误序列标
识所述错误日志信息之间的联系。
11.根据权利要求1-5之任一所述的方法,其中所述源信息包括
与以下中的一个或多个相关的信息:应用程序日志、系统事件、系统
日志、流程堆栈、线程堆栈、用户记录、应用程序记录;和/或
所述错误日志信息包括与以下中的一个或多个相关的信息:运行
时错误、警告、调试。
12.根据权利要求1-5之任一所述的方法,其中所述元数据进一
步包括日志等级和/或所述错误日志信息的出处。
13.根据权利要求1-5之任一所述的方法,其中所述共同错误序
列集合包括多个所述元数据集合中相同的错误日志信息构成的错误
序列的集合。
14.根据权利要求13所述的方法,其中相同的错误日志信息构
成的错误序列的长度大于设定阈值。
15.根据权利要求13所述的方法,其中所述相同的判断标准由
用户设定。
16.一种信息分析系统,包括:
预处理...
【专利技术属性】
技术研发人员:陈超,付宇,钟钱杰,刘晶晶,陈齐彦,
申请(专利权)人:伊姆西公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。