【技术实现步骤摘要】
一种服务器故障根因分析模型的构建方法及应用
[0001]本专利技术属于服务器故障分析
,更具体地,涉及一种服务器故障根因分析模型的构建方法及应用。
技术介绍
[0002]服务器运行日志是用于记录服务器硬件运行状态的记录数据,可用于获取服务器的运行状态或检查服务器系统问题,其重要性不可忽视。在集群与云计算平台中,服务器的节点数量逐渐增多,服务种类愈加复杂,长时间的运行,产生的日志规模也十分巨大。这些日志反应了服务器运行过程中各类部件的状态,能够在出现服务器故障时用来快速的定位出故障所在,这对于高效的修复故障、避免维修时间的浪费、降低服务器换件成本、提升系统可用性至关重要。
[0003]传统日志分析方法是通过逐行分析日志信息来定位系统故障或代码问题,而随着日志数据的结构多样化和存储分散化,运维人员在系统出现故障进行排查时,传统的日志分析方式无法满足故障检测的高效性和深入性要求,运维人员很难从海量复杂的日志中获取真正有价值的信息或快速确定故障位置。智能运维技术的出使海量日志分析与故障根因分析自动化成为可能,智能运维技 ...
【技术保护点】
【技术特征摘要】
1.一种服务器故障根因分析模型的构建方法,其特征在于,包括以下步骤:S1、获取多个服务器故障工单;对于每个故障工单,获取其故障时间窗口,并将故障时间窗口内的服务器运行日志合成一个日志消息后,与该故障工单的故障类型进行匹配形成一条故障样本数据;将各故障工单所对应的故障样本数据共同构成故障样本数据集;S2、将所述故障样本数据集按照故障类型划分成多个子集;针对数据量小于预设阈值的每一个子集,对其下的每一个故障样本数据的日志消息分别进行数据增强,并将增强后的日志消息与其原始故障类别进行匹配后作为一条新的故障样本数据,加入到故障样本数据集中;S3、为所述故障样本数据集中的各日志消息分别生成对应的特征词向量;分别将各日志消息的特征词向量与对应的故障类别进行匹配,得到词向量数据集;S4、将所述词向量数据集输入到机器学习模型中进行训练,得到服务器故障根因分析模型。2.根据权利要求1所述的服务器故障根因分析模型的构建方法,其特征在于,故障工单的故障时间窗口为[t
‑
t
th
,t+t
th
],其中,t为故障工单所对应的故障发生时间;t
th
为预设最优故障分析时间。3.根据权利要求2所述的服务器故障根因分析模型的构建方法,其特征在于,对日志消息进行数据增强的方法包括方式一、方式二、方式三和方式四中的一种或多种;所述方式一包括:在日志消息中随机选择n个单词,将n个单词替换为对应的同义词,得到增强后的日志消息;其中,1≤n≤L
msg
;L
msg
为日志消息中单词的总数量;所述方式二包括:A1、在日志消息中随机选择一个单词进行同义词替换;A2、将所述步骤A1重复执行n次,得到增强后的日志消息;其中,1≤n≤L
msg
;L
msg
为日志消息中单词的总数量;所述方式三包括:B1、在日志消息中随机选择2个单词进行位置交换;B2、将所述步骤B1重复执行n次,得到增强后的日志消息;其中,1≤n≤L
msg
;L
msg
为日志消息中单词的总数量;所述方式四包括:为日志消息中的每个单词随机分配其被删除的概率后,在日志消息中随机选择一个单词,并基于其被删除的概率p来判断是否对其进行删除操作,若p大于预设概率,则将其删除,否则,将其保留。4.根据权利要求3所述的服务器故障根因分析模型的构建方法,其特征在于,所述最优故障分析时间t
th
预设方法包括:预先设定多个候选故障分析时间,从中选取使所述服务器故障根因分析模型准确率最高的故障分析时间作为所述最优故障分析时间;对应地,n=t
th
L
msg
/(...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。