The invention relates to a method and device for root IT fault analysis method using a temporal correlation, the method includes: obtaining the system log; key field extracting the system log, the key field of statistics to get the system log time series data; relevant quantitative feature automatic extraction by hypothesis testing the time series data based on IT; when the fault occurs, tested by Grainger causal relationship between the features of the time series data of the time series data between the various related characteristics of the cause and effect relationship value as the evaluation for size causes the breakdown of IT basis. The beneficial effect of the invention is: through the method of machine learning automation fault root cause analysis process, to help users quickly find out the cause of the failure, reduce the time of fault diagnosis (Mean Time To Diagonise, MTTD), the system quickly returned to normal.
【技术实现步骤摘要】
利用时序相关性进行IT故障根因分析的方法及装置
本专利技术实施例涉及信息处理
,尤其涉及一种利用时序相关性进行IT故障根因分析的方法及装置。
技术介绍
日志数据是故障排除、监控、安全、合规、电子取证等许多企业应用的基础。同时,它们具有巨大的分析价值,随着大数据时代的来临,数据产生速度加快、数据体量巨大,单凭人力无法跟上机器产生数据的速度。日志数据中的大多数内容也并不能交由人工直接识别。随着日志容量和类型的增长,日志数据超出了人类的认知能力,对日志内容进行分析并追踪潜在的问题越来越困难,尤其是在多日志相关性分析出现之后,需要经验丰富的操作人员跟踪事件链、过滤噪音,并最终诊断出问题出现的根本原因。对于业务故障的根因分析,一直比较依赖于运维人员的经验和试错,只有最简单的硬件故障,才能通过简单的parent(起源,父级元素)设定做到一点告警收敛,目前还没有能够较好地解决上述问题的方法或装置出现。
技术实现思路
为了克服相关技术中存在的技术问题,本专利技术提供一种利用时序相关性进行IT故障根因分析的方法及装置,以实现在故障发生后能够及时地对故障原因进行分析并排除故障。第一方面,本专利技术实施例提供了一种利用时序相关性进行IT故障根因分析的方法,其可行的技术方案包括如下:一种利用时序相关性进行IT故障根因分析的方法,所述方法包括:获取系统日志;抽取所述系统日志的关键字段,对所述关键字段进行统计以得到系统日志的时间序列数据;基于量化假设检测自动提取所述时间序列数据的相关特征;当IT故障发生时,通过格兰杰因果关系对所述时间序列数据的相关特征进行检验,其中,所述时间序列数 ...
【技术保护点】
一种利用时序相关性进行IT故障根因分析的方法,其特征在于,所述方法包括:获取系统日志;抽取所述系统日志的关键字段,对所述关键字段进行统计以得到系统日志的时间序列数据;基于量化假设检测自动提取所述时间序列数据的相关特征;当IT故障发生时,通过格兰杰因果关系对所述时间序列数据的相关特征进行检验,其中,所述时间序列数据的各相关特征之间的因果关系量值的大小作为评价为所述IT故障的发生原因的依据。
【技术特征摘要】
1.一种利用时序相关性进行IT故障根因分析的方法,其特征在于,所述方法包括:获取系统日志;抽取所述系统日志的关键字段,对所述关键字段进行统计以得到系统日志的时间序列数据;基于量化假设检测自动提取所述时间序列数据的相关特征;当IT故障发生时,通过格兰杰因果关系对所述时间序列数据的相关特征进行检验,其中,所述时间序列数据的各相关特征之间的因果关系量值的大小作为评价为所述IT故障的发生原因的依据。2.根据权利要求1所述的方法,其特征在于,所述抽取所述系统日志的关键字段,对所述关键字段进行统计以得到系统日志的时间序列数据,包括:抽取所述系统日志的关键字段;对所述系统日志的关键指标参数进行统计得到所述系统日志的时间序列数据;其中,所述关键指标参数包括访问数量、权限更改、错误信息中的一种或两种以上的组合。3.根据权利要求1或2所述的方法,其特征在于,所述抽取所述系统日志的关键字段,对所述关键字段进行统计以得到系统日志的时间序列数据,还包括:对所述关键字段进行参数化设置;对所述系统日志得到的参数化后的关键字段建立参数作用关系图;所述通过格兰杰因果关系对所述时间序列数据的相关特征进行检验,包括:通过格兰杰因果关系对所述参数化后的关键字段进行检验。4.根据权利要求3所述的方法,其特征在于,所述时间序列数据的各相关特征之间的因果关系量值的大小作为评价为所述IT故障的发生原因的依据,包括:通过格兰杰因果关系对所述参数化后的关键字段进行检验,得出参数化后的关键字段的因果关系量值;根据所述因果关系量值建立所述IT故障的定量因果关系图。5.根据权利要求4所述的方法,其特征在于,所述时间序列数据的各相关特征之间的因果关系量值的大小作为评价为所述...
【专利技术属性】
技术研发人员:饶琛琳,梁玫娟,
申请(专利权)人:北京优特捷信息技术有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。