日志故障分类模型训练方法、装置、设备及存储介质制造方法及图纸

技术编号:37807460 阅读:30 留言:0更新日期:2023-06-09 09:37
本发明专利技术公开了一种日志故障分类模型训练方法、装置、设备及存储介质。该方法包括:获取系统应用日志;根据系统应用日志的日志生成时间,确定系统应用日志的前序应用日志和后序应用日志;确定系统应用日志对应的当前日志模板、前序应用日志对应的前序日志模板以及后序应用日志对应的后序日志模板;根据当前日志模板、前序日志模板和后序日志模板,构建系统应用日志的特征向量;根据所述日志生成时间,确定系统应用日志的故障类别;根据系统应用日志的故障类别和特征向量,构建样本训练集;采用样本训练集对预设故障分类模型进行训练,得到目标故障分类模型,用于进行日志故障分类。本发明专利技术实施例实现了对故障系统日志的故障类型的准确确定。的准确确定。的准确确定。

【技术实现步骤摘要】
日志故障分类模型训练方法、装置、设备及存储介质


[0001]本专利技术涉及数据处理领域,尤其涉及一种日志故障分类模型训练方法、装置、设备及存储介质。

技术介绍

[0002]在应用系统运行过程中,开发人员通过日志记录系统运行的情况,系统故障往往直接体现在系统日志中,基于应用系统日志识别故障类别有助于判断故障产生原因从而更快恢复故障。
[0003]现有技术在进行日志故障定位的过程中,通常基于系统日志的故障根因定位,通过日志异常检测算法感知日志异常从而定位故障发生位置,但无法识别到故障日志的故障类型。

技术实现思路

[0004]本专利技术提供了一种工作站性能测试方法、装置、设备及存储介质,以实现对故障系统日志的故障类型的准确确定。
[0005]根据本专利技术的一方面,提供了一种日志故障分类模型训练方法,所述方法包括:
[0006]获取系统应用日志;所述系统应用日志包括日志生成时间;
[0007]根据所述日志生成时间,确定所述系统应用日志的前序应用日志和后序应用日志;
[0008]确定所述系统应用本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种日志故障分类模型训练方法,其特征在于,包括:获取系统应用日志;所述系统应用日志包括日志生成时间;根据所述日志生成时间,确定所述系统应用日志的前序应用日志和后序应用日志;确定所述系统应用日志对应的当前日志模板、所述前序应用日志对应的前序日志模板以及后序应用日志对应的后序日志模板;根据所述当前日志模板、所述前序日志模板和所述后序日志模板,构建所述系统应用日志的特征向量;根据所述日志生成时间,确定所述系统应用日志的故障类别;根据所述系统应用日志的故障类别和特征向量,构建样本训练集;采用所述样本训练集对预设故障分类模型进行训练,得到目标故障分类模型,用于进行日志故障分类。2.根据权利要求1所述的方法,其特征在于,所述根据所述当前日志模板、所述前序日志模板和所述后序日志模板,构建所述系统应用日志的特征向量,包括:确定所述当前日志模板的当前模板异常分值、所述前序日志模板的前序模板异常分值以及所述后序日志模板的后序模板异常分值;对所述当前日志模板进行文本向量化处理,得到所述当前日志模板的当前文本向量,并对所述前序日志模板进行文本向量化处理,得到所述前序日志模板的前序文本向量,且对后序日志模板进行文本向量化处理,得到所述后序日志模板的后序文本向量;根据所述当前日志模板的当前模板异常分值和当前文本向量、所述前序日志模板的前序模板异常分值和前序文本向量以及后序日志模板的后序模板异常分值和后序文本向量,构建所述系统应用日志的特征向量。3.根据权利要求2所述的方法,其特征在于,所述确定所述当前日志模板的当前模板异常分值,包括:获取预设时间段内的至少一条参考应用日志;从各所述参考应用日志中选取与所述当前日志模板相同的候选应用日志;所述候选应用日志包括候选日志生成时间;根据历史故障数据,确定故障时间范围;从所述候选应用日志中选取所述候选日志生成时间属于所述故障时间范围内的目标应用日志;分别确定所述候选应用日志的第一日志数量和所述目标应用日志的第二日志数量;根据所述第一日志数量和所述第二日志数量,确定所述当前日志模板的模板异常分值。4.根据权利要求2所述的方法,其特征在于,所述方法还包括:根据所述日志生成时间,构建当前时间区间、前序时间区间和后序时间区间;确定在所述当前时间区间内获取到的第一参考应用日志、在所述前序时间区间内获取到的第二参考应用日志以及在所述后序时间区间内获取到的第三参考应用日志;根据所述第一参考应用日志对应的模板类型,确定所述当前日志模板的当前模板类型在所述当前时间区间内出现的第一次数,并根据所述第二参考应用日志对应的模板类型,确定所述前序日志模板的前序模板类型在所述前序时间区间内出现的第二次数,且根据所
述第三参考应用日志对应的模板类型,确定所述后序日志模板的后序模板类型在所述后序时间区间内出现的第三次数;根据所述第一参考应用日志对应的模板类型,确定所述当前时间区间内所产生的模板类型的第一类型数量,并根据所述第二参考应用日志对应的模板类型,确定所述前序时间区间内所产生的模板类型的第二类型数量,且根据所述第三参考应用日志对应的模板类型,确定所述后序时间区间内所产生的模板类型的第三类型数量;确定所述当前时间区间内的所述第一参考应用日志的第一日志数量,且确定所述前序时间区间内的所述第二参考应用日志的第二日志数量,并确定所述后序时间区间内的第三参考应用日志的第三日志数量。5.根据权利要求4所述的方法,其特征在于,所述根据所述当前日志模板的当前模板异常分值和当前文本向量、所述前序日志模板的前序模板异常分值和前序文本向量以及后序日志模板的后序模板异常分值和后序文本向量,构建...

【专利技术属性】
技术研发人员:穆琼贾磊耿鹏
申请(专利权)人:中国农业银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1