【技术实现步骤摘要】
模型训练及故障检测方法、装置、电子设备和存储介质
[0001]本申请属于网络日志处理技术,特别涉及一种模型训练及故障检测方法、装置、电子设备和存储介质。
技术介绍
[0002]网络日志中存储了极为丰富的系统状态和运行信息,在系统维护中发挥着重要作用。在相关技术中,可以基于日志序列中的日志事件的在各个日志序列中的整体出现频率,对日志序列进行聚类,从而根据聚类结果进行故障诊断;然而,仅仅基于日志事件的在各个日志序列中的整体出现频率,无法准确地反映日志事件在单个日志序列中的集中程度或分散程度,导致聚类结果中日志序列的类型与实际情况不相符,降低了后续根据聚类结果进行故障诊断的准确性。
技术实现思路
[0003]本申请实施例提供一种模型训练及故障检测方法、装置、电子设备和存储介质。
[0004]本申请实施例提供的模型训练方法包括:
[0005]根据持久化存储的至少两个日志序列中每个日志事件的权重,对至少两个日志序列进行聚类,得到第一聚类结果;
[0006]获取第一权重信息,所述第一权重信息表示针对所述至少两个日志序列中每个日志事件重新分配的权重,所述第一权重信息是根据第一参考信息和第二参考信息中的至少一项确定的,所述第一参考信息表示第一聚类结果中出现日志事件的分组数量,所述第二参考信息表示日志事件在所述第一聚类结果的每个分组中出现的次数;
[0007]根据所述第一权重信息,对所述第一聚类结果中的每组日志序列进行聚类,得到第二聚类结果;
[0008]根据所述第二聚类结果,得 ...
【技术保护点】
【技术特征摘要】
1.一种模型训练方法,其特征在于,所述方法包括:根据持久化存储的至少两个日志序列中每个日志事件的权重,对至少两个日志序列进行聚类,得到第一聚类结果;获取第一权重信息,所述第一权重信息表示针对所述至少两个日志序列中每个日志事件重新分配的权重,所述第一权重信息是根据第一参考信息和第二参考信息中的至少一项确定的,所述第一参考信息表示第一聚类结果中出现日志事件的分组数量,所述第二参考信息表示日志事件在所述第一聚类结果的每个分组中出现的次数;根据所述第一权重信息,对所述第一聚类结果中的每组日志序列进行聚类,得到第二聚类结果;根据所述第二聚类结果,得到训练完成的日志分组模型,所述日志分组模型用于记录日志序列所在的分组。2.根据权利要求1所述的方法,其特征在于,在得到训练完成的日志分组模型后,所述方法还包括:每隔设定时间段,加载最近一个设定时间段内累积的日志序列;并返回根据持久化存储的至少两个日志序列中每个日志事件的权重,对至少两个日志序列进行聚类,得到第一聚类结果的步骤,以得到重新训练完成的日志分组模型。3.根据权利要求1或2所述的方法,其特征在于,在获取持久化存储的至少两个日志序列之后,且在根据持久化存储的至少两个日志序列中每个日志事件的权重,对至少两个日志序列进行聚类之前,所述方法还包括:获取持久化存储文件,所述持久化存储文件包括按照第一顺序排列的各个日志事件;根据所述第一顺序读取所述持久化存储文件的各个日志事件;所述根据持久化存储的至少两个日志序列中每个日志事件的权重,对至少两个日志序列进行聚类,得到第一聚类结果,包括:根据读取到的所述各个日志事件的权重,对所述至少两个日志序列进行聚类,得到第一聚类结果;所述根据所述第一权重信息,对所述第一聚类结果中的每组日志序列进行聚类,得到第二聚类结果,包括:根据读取到的所述各个日志事件和所述第一权重信息,对所述至少两个日志序列进行聚类,得到第二聚类结果;所述方法还包括:在所述最近一个设定时间段内累积的日志序列存在新日志事件的情况下,在按照所述第一顺序排列的各个日志事件的末端添加所述新日志事件,确定添加有所述新日志事件的各个日志事件的第一顺序;所述新日志事件表示所述持久化存储文件中不存在的日志事件。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:在所述第二聚类结果的至少一个目标分组中的日志序列数量大于或等于设定阈值时,将至少一个目标分组中的每个目标分组确定为封闭分组,所述封闭分组表示后续不更改内部日志序列的分组;所述目标分组表示所述第二聚类结果的任意一个分组。5.根据权利要求1所述的方法,其特征在于,在对所述至少两个日志序列进行持久化存
储之前,所述方法还包括:获取第一日志序列集合,将所述第一日志序列集合中满足设定条件的日志事件滤除,得到所述至少两个日志序列,所述设定条件表示:日志事件的权重小于设定权重。6.一种故障检测方法,其特征在于,所述方法包括:根据预先存储的至少两个待预测日志序列中每个日志事件的首次分配的权重,对至少两个待预测日志序列进行第一次聚类,得到第三聚类结果;获取第二权重信息,所述第二权重信息表示针对所述至少两个待预测日志序列中每个日志事件重新分配的权重,所述第二权重信息是根据第三参考信息和第四参考信息中的至少一项确定的,所述第三参考信息表示第三聚类结果中出现日志事件的分组数量,所述第四参考信息表示日志事件在所述第四聚类结果的每个分组中出现的次数;根据所述第二权重信息,对所述第三聚类结果中的每组日志序列进行第二次聚类,得到第四聚类结果;确定距离信息,所述距离信息表示所述第四聚类结果中每个分组的代表性日志序列与所述训练完成的日志分组模型中各个代表性日志序列的距离值;根据所述距离信息和所述日志分组模型中每个...
【专利技术属性】
技术研发人员:徐敬文,张攀翔,余立,杨晓,王喆,杨杰,温伟能,赵鹏,
申请(专利权)人:中国移动通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。