一种日志模板获取方法、电子设备和存储介质技术

技术编号:41513810 阅读:29 留言:0更新日期:2024-05-30 14:51
本发明专利技术涉及计算机技术应用领域,特别是涉及一种日志模板获取方法、电子设备和存储介质,包括:从原始日志数据集中获取多个初始关键日志,接着,对数据集中的词类型进行初步标识,并基于初始关键日志生成表征非数字变量的第一正则表达式和含数字常量的第二正则表达式,以及利用生成的表达式对初步标识的词类型进行修正,并基于修改后的词类型得到对应的日志模板,接着,判断当前的日志模板是否满足预设条件,如果满足,则将当前的日志模板作为目标日志模板,否则,对当前的表达式进行调整,并利用新表达式对当前数据集中的词类型进行调整,得到新的日志模板,并重复之前的判断步骤,直到满足预设条件。本发明专利技术能够提高日志模板的生成效率和准确性。

【技术实现步骤摘要】

本专利技术涉及计算机技术应用领域,特别是涉及一种日志模板获取方法、电子设备和存储介质


技术介绍

1、在现代软件的开发和维护中,日志提供有关系统和网络活动的关键信息,帮助开发者和运维工程师理解系统行为并追溯系统问题根源,检测和响应安全事件,进行故障排除和漏洞分析。在实践中,运维工程师通常采用基于规则的日志解析方法,通过人工编写并使用正则表达式匹配整个日志模板的方式进行日志解析,例如logstash采用的grok过滤器技术。grok 是一种将日志行与正则表达式匹配、将日志行的特定部分映射到专用字段并基于此映射执行操作的方法。这类方法的问题是,每项grok过滤器规则对应一类日志事件,这意味着对于包含大量异构日志事件类型、并且在持续更新的现代软件系统中,grok规则库难以维护和扩展。其次,每项新增的grok规则都会导致额外一次对整个日志行的正则匹配。现代软件系统的日志可能包含数以百千计的日志模板,人工给出匹配所有日志模板的正则表达式的代价难以接受,并且完全无法适应新日志模板的出现。另一类日志解析方法基于预定义的启发式规则,由研究者发现日志数据中固有的某类特征,算本文档来自技高网...

【技术保护点】

1.一种日志模板获取方法,其特征在于,所述方法包括如下步骤:

2.根据权利要求1所述的方法,其特征在于,S200具体包括:

3.根据权利要求2所述的方法,其特征在于,Suta满足如下条件:Suta=LPta-umax/Lta-umax,其中,LPta-umax为PCta与当前的关键日志集中的第u个日志之间的最长公共子序列的长度,Lta-umax=max(Lta,Lu),Lta为PCta的长度,Lu为当前的关键日志集中的第u个日志的长度,max()表示取最大值。

4.根据权利要求1所述的方法,其特征在于,在S800中,所述对当前的第一正则表达式进行调整,...

【技术特征摘要】

1.一种日志模板获取方法,其特征在于,所述方法包括如下步骤:

2.根据权利要求1所述的方法,其特征在于,s200具体包括:

3.根据权利要求2所述的方法,其特征在于,suta满足如下条件:suta=lpta-umax/lta-umax,其中,lpta-umax为pcta与当前的关键日志集中的第u个日志之间的最长公共子序列的长度,lta-umax=max(lta,lu),lta为pcta的长度,lu为当前的关键日志集中的第u个日志的长度,max()表示取最大值。

4.根据权利要求1所述的方法,其特征在于,在s800中,所述对当前的第一正则表达式进行调整,并将调整后的第一正则表达式作为当前的第一正则表达式,具体包括:

5.根据权利要求4所述的方法,其特征在于,slbv满足如下条件:slbv=lpb...

【专利技术属性】
技术研发人员:顾兆军张智凯刘春波岳文龙
申请(专利权)人:中国民航大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1