一种确定解析规则的方法、装置及电子设备制造方法及图纸

技术编号:37387358 阅读:24 留言:0更新日期:2023-04-27 07:26
本申请涉及计算机技术领域,具体涉及一种确定解析规则的方法、装置及电子设备,用于解决相关技术中人工确定解析规则导致的效率低及不准确的问题。该方法中,首先确定待接入日志的目标变量的个数,并将目标变量的个数作为待接入日志的目标长度,然后根据目标长度和待接入日志的接入类型,确定待接入日志对应的N种解析规则,再采用这N种解析规则分别对待接入日志进行解析,得到N个解析结果,最后在这N个解析结果中,将包含最多解析字段的解析结果对应的解析规则,作为待接入日志对应的目标解析规则。基于上述方法可以实现自动化确定解析规则,提高最终确定的解析规则的准确度及效率。率。率。

【技术实现步骤摘要】
一种确定解析规则的方法、装置及电子设备


[0001]本申请涉及计算机
,尤其涉及一种确定解析规则的方法、装置及电子设备。

技术介绍

[0002]在日志传输给日志接入组件或第三方系统时,需要采用相应的解析规则对日志进行解析,当前一般是基于人工的方式确定相应的解析规则来解析日志,即人工根据个人经验确定日志对应的解析规则,然后建立日志与对应的解析规则之间的关联。
[0003]但在实际应用场景中,确定待接入日志对应的解析规则对人工的专业能力要求较高,这将增加相应的学习成本和人力成本,此外在人工参与的过程中还因个人经验差异而存在确定的解析规则不准确的问题。

技术实现思路

[0004]本申请提供一种确定解析规则的方法、装置及电子设备,用以降低人工依赖,提高确定解析规则的效率和准确率。
[0005]第一方面,本申请提供了一种确定解析规则的方法,所述方法包括:
[0006]确定待接入日志的目标变量的个数,并将所述目标变量的个数作为所述待接入日志的目标长度;其中,所述目标变量表征所述待接入日志中的字段类型;
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种确定解析规则的方法,其特征在于,所述方法包括:确定待接入日志的目标变量的个数,并将所述目标变量的个数作为所述待接入日志的目标长度;其中,所述目标变量表征所述待接入日志中的字段类型;根据所述目标长度和所述待接入日志的接入类型,确定所述待接入日志对应的N种解析规则;其中,N为大于等于1的正整数;采用所述N种解析规则,分别对所述待接入日志进行解析,得到N个解析结果;其中,一个解析结果包括多个解析字段;在所述N个解析结果中,将包含最多解析字段的解析结果对应的解析规则,作为所述待接入日志对应的目标解析规则。2.如权利要求1所述的方法,其特征在于,所述根据所述目标长度和所述待接入日志的接入类型,确定所述待接入日志对应的N种解析规则,包括:根据所述目标长度和所述待接入日志的接入类型,确定所述待接入日志对应的第一日志集合;其中,所述第一日志集合包含至少一个样本日志;计算所述目标变量与所述第一日志集合中各个样本日志的参考变量之间的相似度;选取所有大于预设阈值的相似度对应的样本日志作为目标样本日志;将所有目标样本日志对应的N个解析规则,作为所述待接入日志对应的N个解析规则。3.如权利要求2所述的方法,其特征在于,所述根据所述目标长度和所述待接入日志的接入类型,确定所述待接入日志对应的第一日志集合,包括:基于所述目标长度,确定第二日志集合;其中,所述第二日志集合中的样本日志的参考长度与所述目标长度相同;在所述第二日志集合中,将与所述待接入日志的接入类型相同的样本日志作为第一日志集合。4.如权利要求2所述的方法,其特征在于,所述计算所述目标变量与所述第一日志集合中各个样本日志的参考变量之间的相似度,包括:基于所述目标变量在所述待接入日志中的排列次序,确定由所述待接入日志的目标变量序列;在所述第一日志集合中,基于各个样本日志的参考变量在所述各个样本日志中的排列次序,确定所述各个样本日志的参考变量序列;将所述目标变量序列与所述各个样本日志的参考变量序列之间的相似度,作为所述目标变量与所述各个样本日志的参考变量之间的相似度。5.如权利要求4所述的方法,其特征在于,所述将所述目标变量序列与所述各个样本日志的参考变量序列之间的相似度,作为所述目标变量与所述各个样本日志的参考变量之间的相似度,包括:分别计算所述目标变量序列与所...

【专利技术属性】
技术研发人员:郭斌黄俊孙杨杰刘睿郑维刘华兵
申请(专利权)人:北京神州绿盟科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1