【技术实现步骤摘要】
本专利技术涉及日志分析领域,尤其涉及一种日志解析方法及装置。
技术介绍
随着海量日志分析挖掘技术的发展,如何解析设备或系统的日志备受业界重视。日志解析的目的,是将待解析日志(即原始日志)中的数据通过某种逻辑组织成格式化的数据交换格式,以便于提供给下游系统进行分析和挖掘。目前,字符串日志,具有体积小、易压缩、更便于网络传输的优势,但是在带来诸多优势的同事,也给日志解析带来很多不便。由于待解析日志的数据格式多种多样,现有的日志解析方法中,一般针对一种数据格式的待解析日志开发一套对应的日志解析应用程序。由此,现有技术存在以下缺陷:1)、一个日志解析应用程序只能解析对应的数据格式的待解析日志,而且每个解析应用程序都需要维护,导致维护工作量大。2)、当待解析日志的数据格式改变时,需要开发人员重新开发日志解析应用程序。3)、当出现新的数据格式的待解析日志时,需要开发新的日志解析应用程序。故此,现有的日志解析方法适用范围小,日志解析应用程序的开发效率低,周期长,维护工作量大。
技术实现思路
本专利技术实施例提供了一种日志解析方法及装置,用以解决目前存在的由于每种数据格式的待解析日志对应一种日志解析应用程序,使得无现有的日志解析方法适用范围小,日志解析应用程序的开发效率低,周期长,维护工作量大等的问题。本专利技术实施例提供了一种日志解析方法,包括:获取解析模板;其中,解析模板中包括解析后的预置数据交换格式以及从模板元素集合中选择的至少一个预置模板元素;每个预置模板元素中包括字段输出名、该字段输出名对应的至少一个字符串信息的各自的正则表达式信息、以及字符串信息的预置输出数据类 ...
【技术保护点】
一种日志解析方法,其特征在于,包括:获取解析模板;其中,解析模板中包括解析后的预置数据交换格式以及从模板元素集合中选择的至少一个预置模板元素;每个预置模板元素中包括字段输出名、该字段输出名对应的至少一个字符串信息的各自的正则表达式信息、以及字符串信息的预置输出数据类型;针对每个预置模板元素中的每个正则表达式信息,从待解析日志中提取与该正则表达式信息匹配的字符串信息;并将匹配的字符串信息配置为预置输出数据类型;按照预置数据交换格式,输出解析模板中的每个预置模板元素的字段输出名以及每个字段输出名对应的字符串信息。
【技术特征摘要】
1.一种日志解析方法,其特征在于,包括:获取解析模板;其中,解析模板中包括解析后的预置数据交换格式以及从模板元素集合中选择的至少一个预置模板元素;每个预置模板元素中包括字段输出名、该字段输出名对应的至少一个字符串信息的各自的正则表达式信息、以及字符串信息的预置输出数据类型;针对每个预置模板元素中的每个正则表达式信息,从待解析日志中提取与该正则表达式信息匹配的字符串信息;并将匹配的字符串信息配置为预置输出数据类型;按照预置数据交换格式,输出解析模板中的每个预置模板元素的字段输出名以及每个字段输出名对应的字符串信息。2.根据权利要求1所述的方法,其特征在于,所述正则表达式信息为字段模板名;针对任一预置模板元素,根据以下方法配置该预置模板元素:接收对字段模板集合中的至少一个字段模板名的选择指令;其中,每个字段模板名对应一个字段模板,每个字段模板均有对应的正则表达式;将选择的字段模板名对应的字段模板作为预置字段模板,并接收针对预置模板元素的字段输出名的命名指令;并,接收对输出数据类型的设定指令;根据命名指令中包括的字段输出名、设定指令中包括的预置输出数据类型以及预置字段模板,生成预置模板元素。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:接收对字段模板集合的编辑指令,所述编辑指令包括以下中的任一种:删除字段模板集合中第一指定字段模板的删除指令、向字段模板集合中添加字段模板的添加指令、修改字段模板集合中第二指定字段模板的修改指令。4.根据权利要求2所述的方法,其特征在于,所述获取解析模板之后,所述方法还包括:提取解析模板中的每个预置模板元素包括的字段输出名,生成字段输出名集合;并,提取每个预置模板元素包括的预置输出数据类型,生成预置输出数据类型集合;以及,提取解析模板中的每个预置模板元素包括的每个字段模板名,生成字段模板名集合;并建立字段模板名、预置输出数据类型以及字段输出名三者之间的三维对应关系。5.根据权利要求4所述的方法,其特征在于,所述针对每个预置模板元素中的每个正则表达式信息,从待解析日志中提取与该正则表达式信息匹配的字符串信息;并将匹配的字符串信息配置为预置输出数据类型,具体包括:遍历字段模板名集合中的每个字段模板,根据每个字段模板对应的正则表达式从待解析日志中提取与该正则表达式匹配的字符串信息;并,针对提取的每个字符串信息,根据三维对应关系,确定该字符串信息对应的字段模板对应的预置输出数据类型,并将该字符串信息的数据类型配置为确定的预置输出数据类型;所述按照预置数据交换格式,输出解析模板中的每个预置模板元素的字段输出名以及每个字段输出名对应的字符串信息之前,所述方法还包括:根据三维对应关系,确定字段输出名集合中的每个字段输出名对应的字符串信息。6.根据权利要求1-5中任一所述的方法,其特征在于,所述方法还包括:判断待解析日志与解析模板是否匹配;若匹配,则执行所述针对每个预置模板元素中的每个正则表达式信息,从待解析日志中提取与该正则表达式信息匹配的字符串信息的步骤。7.一种日志解析装置,其特征在于,包括:...
【专利技术属性】
技术研发人员:袁帅,
申请(专利权)人:北京神州绿盟信息安全科技股份有限公司,北京神州绿盟科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。