【技术实现步骤摘要】
日志处理方法、装置、设备和存储介质
本公开涉及数据处理
,尤其涉及一种日志处理方法、装置、设备和存储介质。
技术介绍
系统日志通常是无结构的文本数据,在使用数据挖掘算法对系统日志建立模型训练之前,需要使用日志解析算法将原始的日志数据结构化。日志解析技术是日志挖掘的关键一环。传统的日志解析算法包括正则表达式匹配方式、基于源代码的方式、或者基于规则式的方式,这些方法对专家经验知识依赖性强,当新的日志格式出现时,解析规则容易变得不适用。因此,分析服务器日志变化并及时预警已经成为系统管理员评估系统运行状况的重要手段之一。针对海量日志实时更新场景下,现有方案在日志预警处理过程中存在较长的时间延迟,不能满足日志预警的处理需求。
技术实现思路
为了解决上述技术问题或者至少部分地解决上述技术问题,本公开实施例提供了一种日志处理方法、装置、设备和存储介质。第一方面,本公开实施例提供了一种日志处理方法,包括:获取待处理日志,并对所述待处理日志进行聚类处理,得到第一预设数量的候选日志分类集合;计算每个候选日志分类集合中各日志的熵值;其中,所述熵值用于表征日志的信息量;根据所述熵值,从每个候选日志分类集合中筛选第二预设数量的日志,得到所述第一预设数量的目标日志分类集合;计算所述第一预设数量的目标日志分类集合对应的日志分布稳定度;如果所述日志分布稳定度大于稳定度阈值,则对所述待处理日志重新进行所述聚类处理,确定重新聚类得到的集合数量;如果所述重新聚类得到 ...
【技术保护点】
1.一种日志处理方法,其特征在于,包括:/n获取待处理日志,并对所述待处理日志进行聚类处理,得到第一预设数量的候选日志分类集合;/n计算每个候选日志分类集合中各日志的熵值;其中,所述熵值用于表征日志的信息量;/n根据所述熵值,从每个候选日志分类集合中筛选第二预设数量的日志,得到所述第一预设数量的目标日志分类集合;/n计算所述第一预设数量的目标日志分类集合对应的日志分布稳定度;/n如果所述日志分布稳定度大于稳定度阈值,则对所述待处理日志重新进行所述聚类处理,确定重新聚类得到的集合数量;/n如果所述重新聚类得到的集合数量大于所述第一预设数量,则进行日志预警处理。/n
【技术特征摘要】
1.一种日志处理方法,其特征在于,包括:
获取待处理日志,并对所述待处理日志进行聚类处理,得到第一预设数量的候选日志分类集合;
计算每个候选日志分类集合中各日志的熵值;其中,所述熵值用于表征日志的信息量;
根据所述熵值,从每个候选日志分类集合中筛选第二预设数量的日志,得到所述第一预设数量的目标日志分类集合;
计算所述第一预设数量的目标日志分类集合对应的日志分布稳定度;
如果所述日志分布稳定度大于稳定度阈值,则对所述待处理日志重新进行所述聚类处理,确定重新聚类得到的集合数量;
如果所述重新聚类得到的集合数量大于所述第一预设数量,则进行日志预警处理。
2.根据权利要求1所述的方法,其特征在于,所述计算所述第一预设数量的目标日志分类集合对应的日志分布稳定度,包括:
按照日志向量维度,将所述第一预设数量的目标日志分类集合中的日志划分至第三预设数量的日志区间;
计算每个日志向量维度下每个日志区间对应的当前日志占比;
获取每个日志向量维度下每个日志区间对应的历史日志占比;其中,所述历史日志占比是将所述第一预设数量的历史日志分类集合按照所述日志向量维度划分至所述第三预设数量的日志区间后得到;
根据所述当前日志占比和所述历史日志占比,计算每个日志向量维度下的日志分布稳定度;
计算各个日志向量维度下的日志分布稳定度的均值,作为所述第一预设数量的目标日志分类集合对应的日志分布稳定度。
3.根据权利要求1所述的方法,其特征在于,所述对所述待处理日志进行聚类处理,得到第一预设数量的候选日志分类集合,包括:
按照预设日志解析规则,确定所述待处理日志中各日志所属的勿连约束集合;
基于所述勿连约束集合,对所述待处理日志进行聚类处理,得到所述第一预设数量的候选日志分类集合;其中,属于不同勿连约束集合中的日志聚类至不同的候选日志分类集合中。
4.根据权利要求1所述的方法,其特征在于,所述根据所述熵值,从每个候选日志分类集合中筛选第二预设数量的日志,得到所述第一预设数量的目标日志分类集合,包括:
对每个候选日志分类集合中的日志按照熵值递减顺序进行排序;
基于每个候选日志分类集合中排序在前的所述第二预设数量的日志,得到所述第一预设数量的目标日志分类集合;或者,
从每个候选日志分类集合中确定所述熵值超过熵值阈值的所述第二预设数量的日志,得到所述第一预设数量的目标日志分类集合。
5.根据权利要求3所述的方法,其特征在...
【专利技术属性】
技术研发人员:赵旭,王卓,周晓阳,
申请(专利权)人:北京天融信网络安全技术有限公司,北京天融信科技有限公司,北京天融信软件有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。