日志模板的识别方法、装置、电子设备和可读介质制造方法及图纸

技术编号:36039089 阅读:17 留言:0更新日期:2022-12-21 10:44
本公开提供一种日志模板的识别方法、装置、电子设备和可读介质,其中,日志模板的识别方法包括:在待识别的日志模板对应的识别模型的损失函数中增加近义词条件约束和反义词条件约束;基于增加条件约束后的损失函数和日志模板的数据样本集对识别模型进行训练。通过本公开实施例,增强了识别模型的约束条件,减少了数据样本集的数据量,降低了数据样本集和识别模型的维护难度,提高了日志模板识别的可靠性和效率。性和效率。性和效率。

【技术实现步骤摘要】
日志模板的识别方法、装置、电子设备和可读介质


[0001]本公开涉及机器学习
,具体而言,涉及一种日志模板的识别方法、装置、电子设备和可读介质。

技术介绍

[0002]目前,日志信息是运维过程中最广泛使用的数据之一。一条日志一般由两部分:“模板”和“参数”组成,生成日志时往往遵循一个确定的模板,往其中填入符合系统运行情况的不同“参数”。例如日志:“PacketResponder 0 for block blk_4003 terminating”中下划线部分所示的两项参数“0”和“blk_4003”。
[0003]在相关技术中,日志是由程序开发者自行构建,在满足特定条件时发送的文本信息,因此具有很强的主观性和随意性。对系统运维人员来说,一般关注其中的“模板”部分,特定模板的出现就代表了系统当前运行状态可能存在异常。
[0004]但是,在现代系统模块逐渐增多,底层架构也逐渐复杂化的情况下,运维人员难以学习、掌握这些模块中的所有日志模板,因此,难以对大量的日志进行有效分析。另外,由于需要大量的数据样本集对识别模型进行训练,不仅导本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种日志模板的识别方法,其特征在于,包括:在待识别的日志模板对应的识别模型的损失函数中增加近义词条件约束和反义词条件约束;基于增加条件约束后的损失函数和所述日志模板的数据样本集对所述识别模型进行训练。2.如权利要求1所述的日志模板的识别方法,其特征在于,还包括:将所述待识别的日志模板输入至训练后的识别模型,以确定所述识别模型输出的可识别词条对应的第一类向量;和/或,将所述识别模型输出的不可识别词条输入至神经网络模型进行回归计算;根据所述神经网络模型的回归计算结果确定所述不可识别词条对应的第二类向量;根据所述第一类向量和/或所述第二类向量确定所述待识别的日志模板对应的向量,其中,所述神经网络模型的识别结果的维数与已经过所述识别模型计算的词条的维数相同。3.如权利要求2所述的日志模板的识别方法,其特征在于,还包括:对所述日志模板对应的向量进行加权平均;根据所述加权平均的计算结果确定所述日志模板的向量表示;基于所述向量表示和预设的向量空间确定所述日志模板的分类类型。4.如权利要求3所述的日志模板的识别方法,其特征在于,还包括:将人工标注的日志模板输入至已训练的识别模型,并根据所述识别模型的输出结果生成所述向量空间,所述向量空间中包括所述人工标注的日志模板的分类类型和对应的向量表示。5.如权利要求1所述的日志模板的识别方法,其特征在于,在待识别的日志模板对应的识别模型的损失函数中增加近义词条件约束和反义词条件约束包括:确定所述近义词条件约束的表达式为:和/或确定所述近义词条件约束的表达式为:将所述近义词条件约束的表达式和所述反义词条件约束的表达式增加至所述损失函数中,所述w表征所述识别模型的数据样本集中的词条,所述S(w)表征所述w的近义词词库,所述u表征所述近义词词库中的近义词,所述A(w)表征所述w的反义词词库,所述v表征所述...

【专利技术属性】
技术研发人员:罗昊然陈康付华峥韦登荣郑永坤
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1