日志模板获取方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:37406574 阅读:9 留言:0更新日期:2023-04-30 09:33
本申请提供日志模板获取方法、装置、计算机设备及存储介质,应用于计算机技术领域,该方法包括:获取当前日志数据,并进行预处理,得到待处理日志数据;对待处理日志数据中的每条当前日志进行分词处理,得到每条当前日志对应的当前日志分词组;获取预设的词频统计信息,并根据预设的词频统计信息和每条当前日志对应的当前日志分词组对每条当前日志进行分组,得到多个日志分组,实现对当前日志进行准确分组,有效避免在变长变量日志场景下由于日志事件的当前日志的长度不同,造成当前日志分类不准确的问题,然后根据预设的词频统计信息、每个日志分组和预设的日志模板数据库,获取目标日志模板,从而提高日志模板提取的准确率。从而提高日志模板提取的准确率。从而提高日志模板提取的准确率。

【技术实现步骤摘要】
日志模板获取方法、装置、计算机设备及存储介质


[0001]本申请属于计算机
,具体涉及一种日志模板获取方法、装置、计算机设备及存储介质。

技术介绍

[0002]计算机系统、云服务器以及智能手机、笔记本电脑等系统在运行时经常会出现故障和安全事件等异常情况,日志作为上述系统运行时的一部分,是人们获取上述异常情况的重要途径之一,而对日志模板进行提取是异常检测、故障诊断等运维工作不可或缺的重要手段。
[0003]目前,主要通过日志分词长度对日志进行分组聚合后,再对日志模板进行提取,而不同日志事件或者相同的日志事件产生的日志消息可能具有相同的日志消息长度,造成变长变量日志场景下日志模板的增加和重读,导致提取的日志模板准确率较低。
[0004]该
技术介绍
部分中包括的信息仅用于增强对本公开的一般背景的理解,并且不能被视为对该信息构成本领域技术人员已知的现有技术的承认或任何形式的暗示。

技术实现思路

[0005]本申请提供一种日志模板获取方法、装置、计算机设备及存储介质,以提高日志模板提取的准确率。
[0006]一种日志模板获取方法,所述方法包括:
[0007]获取当前日志数据,并进行预处理,得到待处理日志数据;
[0008]对所述待处理日志数据中的每条当前日志进行分词处理,得到每条所述当前日志对应的当前日志分词组;
[0009]获取预设的词频统计信息,并根据所述预设的词频统计信息和每条所述当前日志对应的当前日志分词组对每条所述当前日志进行分组,得到多个日志分组;
[0010]根据所述预设的词频统计信息、所述日志分组和预设的日志模板数据库,获取目标日志模板。
[0011]一种日志模板获取装置,所述装置包括:
[0012]第一预处理模块,用于获取当前日志数据,并进行预处理,得到待处理日志数据;
[0013]第一分词处理模块,用于对所述待处理日志数据中的每条当前日志进行分词处理,得到每条所述当前日志对应的当前日志分词组;
[0014]日志分组模块,用于获取预设的词频统计信息,并根据所述预设的词频统计信息和每条所述当前日志对应的当前日志分词组对每条所述当前日志进行分组,得到多个日志分组;
[0015]模板确定模块,用于根据所述预设的词频统计信息、所述日志分组和预设的日志模板数据库,获取目标日志模板。
[0016]一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理
器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述日志模板获取方法。
[0017]一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述日志模板获取方法。
[0018]上述日志模板获取方法、装置、计算机设备及存储介质,获取当前日志数据,并进行预处理,得到待处理日志数据;对待处理日志数据中的每条当前日志进行分词处理,得到每条当前日志对应的当前日志分词组;获取预设的词频统计信息,并根据预设的词频统计信息和每条当前日志对应的当前日志分词组对每条当前日志进行分组,得到多个日志分组;通过预设的词频统计信息和当前日志的当前日志分词组对当前日志进行准确分组,有效避免在变长变量日志场景下由于日志事件的当前日志的长度不同,造成当前日志分类不准确的问题,然后根据预设的词频统计信息、每个日志分组和预设的日志模板数据库,获取目标日志模板,从而提高日志模板提取的准确率。
附图说明
[0019]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0020]图1示意性地示出了本申请一实施例提供的日志模板获取方法的应用环境示意图。
[0021]图2示出了本申请一实施例提供的日志模板获取方法的流程示意图;
[0022]图3示出了本申请一实施例提供的日志模板获取方法中得到预设的词频统计信息的流程示意图;
[0023]图4示出了本申请一实施例提供的日志模板获取方法中对当前日志进行分组的流程示意图;
[0024]图5示出了本申请一实施例提供的日志模板获取方法中获取目标日志模板的流程示意图;
[0025]图6示出了本申请又一实施例提供的日志模板获取方法中获取目标日志模板的流程示意图;
[0026]图7示出了本申请一实施例提供的日志模板获取方法中计算相似度值的流程示意图;
[0027]图8示出了本申请又一实施例提供的日志模板获取方法中获取目标日志模板的流程示意图;
[0028]图9示出了本申请一实施例提供的日志模板获取装置的结构示意图;
[0029]图10示出了本申请一实施例中计算机设备的结构示意图。
具体实施方式
[0030]现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本申请将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
[0031]此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本申请的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。
[0032]附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
[0033]附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
[0034]应当注意,尽管在附图中以特定顺序描述了本申请中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
[0035]本申请实施例提供的日志模板获取方法,可应用在如图1所示的应用环境中,如图1所示,系统框架100可以包括终端设备101、102、103、网络104、服务器和105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。服务器105可以用独立的服务本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种日志模板获取方法,其特征在于,所述方法包括:获取当前日志数据,并进行预处理,得到待处理日志数据;对所述待处理日志数据中的每条当前日志进行分词处理,得到每条所述当前日志对应的当前日志分词组;获取预设的词频统计信息,并根据所述预设的词频统计信息和每条所述当前日志对应的当前日志分词组对每条所述当前日志进行分组,得到多个日志分组;根据所述预设的词频统计信息、所述日志分组和预设的日志模板数据库,获取目标日志模板。2.根据权利要求1所述的日志模板获取方法,其特征在于,所述获取预设的词频统计信息之前,所述方法还包括:获取历史日志数据,并进行预处理,得到待处理历史日志数据;对所述待处理历史日志数据进行分词处理,得到历史日志分词;对所述历史日志分词进行词频统计,得到所述预设的词频统计信息。3.根据权利要求1所述的日志模板获取方法,其特征在于,所述根据所述预设的词频统计信息和每条所述当前日志对应的当前日志分词组对每条所述当前日志进行分组,得到多个日志分组,包括:获取第一预设参数,并根据所述第一预设参数确定每条所述当前日志对应的当前日志分词组中的待比较分词信息;根据所述预设的词频统计信息和每条所述当前日志对应的待比较分词信息,确定每条所述当前日志对应的分组分词信息;根据每条所述当前日志对应的分组分词信息对每条所述当前日志进行分组,得到多个所述日志分组。4.根据权利要求1所述日志模板获取方法,其特征在于,所述预设的日志模板数据库包括多个索引信息和每个所述索引信息关联的日志模板;所述根据所述预设的词频统计信息、所述日志分组和预设的日志模板数据库,获取目标日志模板,包括:根据所述日志分组包含的每条所述当前日志对应的当前日志分词组和所述索引信息,确定所述预设的日志模板数据库中的目标索引信息;根据所述目标索引信息,从所述预设的日志模板数据库中获取所述目标索引信息关联的日志模板,作为待比较日志模板;根据所述日志分组包含的每条所述当前日志对应的当前日志分词组、所述预设的词频统计信息和所述待比较日志模板,获取所述目标日志模板。5.根据权利要求4所述的日志模板获取方法,其特征在于,所述根据所述日志分组包含的每条所述当前日志对应的当前日志分词组、所述预设的词频统计信息和所述待比较日志模板,获取所述目标日志模板,包括:根据所述日志分组包含的每条所述当前日志对应的当前日志分词组、所述预设的词频统计信息和所述待比较日志模板确定所述日志分组与所述待比较日志模板的相似度值;根据所述相似度值、所述待比较日志模板和所述日志分组包含的每条所述...

【专利技术属性】
技术研发人员:隋毅赵硕王宇范潇李翔肖莉
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1