一种故障根因分析方法和分析设备技术

技术编号:13128313 阅读:72 留言:0更新日期:2016-04-06 14:03
本发明专利技术公开了一种故障根因分析方法和分析设备,涉及数据挖掘和网络管理领域,以解决现有故障根因分析过程中,需要采用大量的人力和时间来分析网络日志,导致的故障根因分析效率较低,不能及时排除网络故障的问题。方法包括:确定网络设备的故障时间点;获取网络设备在第一时间段内产生的第一日志信息集;第一日志信息集包含M类日志信息;根据预设分析策略对M类日志信息中每类日志信息进行分析,获取M类日志信息中的N类根因日志;根因日志为:网络设备发生故障时产生的日志信息,M≥N≥1,预设分析策略为:预先确定的所述网络设备故障发生时日志发生的规律;根据N类根因日志确定网络设备发生故障的原因。

【技术实现步骤摘要】

本专利技术涉及数据挖掘和网络管理领域,尤其涉及一种故障根因分析方法和分析设备
技术介绍
随着网络技术的发展,宽带路由器在网络中的应用变得越来越广泛,且在网络中占据重要地位。然后,宽带路由器在运行过程中难免会出现故障,当宽带路由器出现故障时,若不及时确定故障发生原因,排除故障,则会导致网络出现暂时性的中断,给企业带来诸多不便及损失,因此,及时确定网络故障发生原因并排除宽带路由器的故障是很有必要的。由于,宽带路由器产生的网络日志中包含了大部分和宽带路由器运行相关的信息,因此,现有技术人员可以通过分析网络日志来定位宽带路由器故障发生的原因(即故障根因)。但是,在实现本专利技术的过程中,技术人员发现:当前故障根因分析多采用人工分析日志的方式,在分析过程中人为参与的部分较多,投入了大量的人力和时间,同时,又需要结合大量的专业知识定位网络故障根因,故障根因分析效率较低,进而导致不能快速及时的排除网络故障。
技术实现思路
为解决上述问题,本专利技术实施例提供一种故障根因分析方法和分析设备,以解决现有故障根因分析过程中,需要采用大量的人力和时间来分析网络日志,导致的故障根因分析效率较低,不能及时排除网络故障的问题。为达到上述目可选的,本专利技术的实施例采用如下技术方案:第一方面,本专利技术实施例提供一种故障根因分析方法,由分析设备执行,所述方法可以包括:确定网络设备的故障时间点;获取所述网络设备在第一时间段内产生的第一日志信息集;所述第一日志信息集包含M类日志信息,所述M为大于或等于1的整数,所述第一时间段为:从所述故障时间点之前的第一时刻到所述故障时间点之后的第二时刻之间的时间段;根据预设分析策略对所述M类日志信息中每类日志信息进行分析,获取所述M类日志信息中的N类根因日志;所述N类根因日志为:所述网络设备发生故障时产生的日志信息,所述M≥N≥1,所述预设分析策略为:预先确定的所述网络设备故障发生时日志发生的规律;根据所述N类根因日志确定所述网络设备发生故障的原因。由于,网络设备在故障发生时可能会产生至少一类日志信息(即根因日志),且这些类日志信息在故障时间点附近的出现呈现比较明显的特征规律,为此,本专利技术技术人员结合大量的故障分析报告,预先对大量故障时间点附近产生的日志信息进行分析,挖掘出故障根因日志出现的特征规律:(1)故障发生时产生的至少一类日志信息通常会组合在一起在故障点附近重复且不间断的出现;(2)故障发生时产生的一类日志信息通常在比较长的一时间段内频繁出现,且在故障时间点处呈突然增多的趋势。因此,在第一方面的一种可实现方式中,所述根据预设分析策略对所述M类日志信息中每类日志信息进行分析,获取所述M类日志信息中的N类根因日志可以包括:将所述M类日志信息对应的M个日志类型分为i个不同的日志组合;每个日志组合包含所述M个日志类型中的至少一个日志类型,且所述每个日志组合包含的日志类型各不相同,所述i为大于或等于1的整数;遍历所述i个日志组合,确定所述i个日志组合中的至少一个根因日志组合;所述根因日志组合为:在所述第一时间段内频繁且持续出现的日志组合;对所述至少一个根因日志组合进行处理;将处理后的至少一个根因日志组合对应的至少一类日志信息确定为所述N类根因日志。可以选,对于任一日志组合,确定所述日志组合为根因日志组合可以包括:将所述第一时间段划分为至少一个时间窗,将所述至少一个时间窗中的每个时间窗划分为至少一个小时间窗;计算所述日志组合在任一时间窗内出现的第一频率;所述第一频率为:所述时间窗内出现所述日志组合的小时间窗的个数与所述时间窗包含的小时间窗的个数的比值;若所述第一频率大于第一预设阈值,则确定所述日志组合为所述时间窗内的频繁日志组合;计算所述频繁日志组合在所述第一时间段内出现的第二频率;所述第二频率为:所述第一时间段内出现所述频繁日志组合的时间窗的个数与所述第一时间段包含的时间窗的个数的比值;若所述第二频率大于第二预设阈值,则确定所述频繁日志组合为根因日志组合。可选的,对所述至少一个根因日志组合进行处理可以包括:若遍历所述i个日志组合确定出的至少一个根因日志组合中存在第一根因日志组合和第二根因日志组合,且所述第一根因日志组合包含在所述第二根因日志组合中;则所述对所述至少一个根因日志组合进行处理包括:当所述第一根因日志组合对应的第二频率大于所述第二根因日志组合对应的第二频率时,不剔除所述第一根因日志组合;当所述第一根因日志组合对应的第二频率小于所述第二根因日志组合对应的第二频率时,剔除所述第一根因日志组合。或者,若遍历所述i个日志组合确定出的至少一个根因日志组合中存在第三根因日志组合,且所述第三根因日志组合为所述故障时间点之前的根因日志组合,则所述对遍历所述i个日志组合确定出的至少一个根因日志组合进行处理包括:剔除所述第三根因日志组合。需要说明的是,在本专利技术实施例中,所述日志组合为包含至少一个日志类型的组合,所述时间窗为一个时间间隔,在对时间窗划分的过程中,每个时间窗的大小可以相等也可以不相等,每个小时间窗的大小可以相等也可以不相等,所述日志组合在时间窗出现可以指:所述日志组合包含的日志类型对应的日志信息发生在该时间窗对应的时间间隔内。第一预设阈值和第二预设阈值可以根据需要进行设置,本专利技术实施例对此不进行限定,若一日志组合对应的第一频率大于第一预设阈值,则表示该日志组合集中在某一时刻频繁出现,确定为频繁日志组合,若该日志组合对应的第一频率小于或等于第一预设阈值,可以认为该日志组合对应的日志信息为网络设备正常时产生的一些日志信息;若频繁日志组合的第二频率大于第二预设阈值,则表示在某一时刻频繁出现的日志在第一时间段内持续频繁出现,即该频繁日志组合为第一时间段内重复且不间断出现的日志,符合故障根因日志出现的规律,确定该频繁日志组合为根因日志组合,将该日志组合包含的日志类型对应的日志信息确定为网络设备发生故障时产生的日志信息,若频繁日志组合的第二频率小于或等于第二预设阈值,则表示在某一时刻频繁出现的日志在第一时间段内不会持续性出现,可以认为该日志组合对应的日志信息为网络设备正常时产生的一些日志信息。此外,通过对大量故障相关日志和正常日志分析发现,正常日志往往呈现周期性出现的规律,分布比较均匀,且在整个日志中出现的比较频繁。本文档来自技高网...

【技术保护点】
一种故障根因分析方法,其特征在于,包括:分析设备确定网络设备的故障时间点;所述分析设备获取所述网络设备在第一时间段内产生的第一日志信息集;所述第一日志信息集包含M类日志信息,所述M为大于或等于1的整数,所述第一时间段为:从所述故障时间点之前的第一时刻到所述故障时间点之后的第二时刻之间的时间段;所述分析设备根据预设分析策略对所述M类日志信息中每类日志信息进行分析,获取所述M类日志信息中的N类根因日志;所述N类根因日志为:所述网络设备发生故障时产生的日志信息,其中,M≥N≥1,所述预设分析策略为:预先确定的所述网络设备故障发生时日志发生的规律;根据所述N类根因日志确定所述网络设备发生故障的原因。

【技术特征摘要】
1.一种故障根因分析方法,其特征在于,包括:
分析设备确定网络设备的故障时间点;
所述分析设备获取所述网络设备在第一时间段内产生的第一日志信息
集;所述第一日志信息集包含M类日志信息,所述M为大于或等于1的整
数,所述第一时间段为:从所述故障时间点之前的第一时刻到所述故障时间
点之后的第二时刻之间的时间段;
所述分析设备根据预设分析策略对所述M类日志信息中每类日志信息
进行分析,获取所述M类日志信息中的N类根因日志;所述N类根因日志
为:所述网络设备发生故障时产生的日志信息,其中,M≥N≥1,所述预设
分析策略为:预先确定的所述网络设备故障发生时日志发生的规律;
根据所述N类根因日志确定所述网络设备发生故障的原因。
2.根据权利要求1所述的方法,其特征在于,所述根据预设分析策略
对所述M类日志信息中每类日志信息进行分析,获取所述M类日志信息中
的N类根因日志包括:
将所述M类日志信息对应的M个日志类型分为i个不同的日志组合;
每个日志组合包含所述M个日志类型中的至少一个日志类型,且所述每个
日志组合包含的日志类型各不相同,所述i为大于或等于1的整数;
遍历所述i个日志组合,确定所述i个日志组合中的至少一个根因日志
组合;所述根因日志组合为:在所述第一时间段内频繁且持续出现的日志组
合;
对所述至少一个根因日志组合进行处理;
将处理后的至少一个根因日志组合对应的至少一类日志信息确定为所
述N类根因日志。
3.根据权利要求2所述的方法,其特征在于,对于任一日志组合,确
定所述日志组合为根因日志组合包括:
将所述第一时间段划分为至少一个时间窗,将所述至少一个时间窗中的
每个时间窗划分为至少一个小时间窗;
计算所述日志组合在任一时间窗内出现的第一频率;所述第一频率为:
所述时间窗内出现所述日志组合的小时间窗的个数与所述时间窗包含的小
时间窗的个数的比值;
若所述第一频率大于第一预设阈值,则确定所述日志组合为所述时间窗
内的频繁日志组合;
计算所述频繁日志组合在所述第一时间段内出现的第二频率;所述第二
频率为:所述第一时间段内出现所述频繁日志组合的时间窗的个数与所述第
一时间段包含的时间窗的个数的比值;
若所述第二频率大于第二预设阈值,则确定所述频繁日志组合为根因日
志组合。
4.根据权利要求2或3所述的方法,其特征在于,若遍历所述i个日
志组合确定出的至少一个根因日志组合中存在第一根因日志组合和第二根
因日志组合,且所述第一根因日志组合包含在所述第二根因日志组合中;则
所述对所述至少一个根因日志组合进行处理包括:
当所述第一根因日志组合对应的第二频率大于所述第二根因日志组合
对应的第二频率时,不剔除所述第一根因日志组合;
当所述第一根因日志组合对应的第二频率小于所述第二根因日志组合
对应的第二频率时,剔除所述第一根因日志组合。
5.根据权利要求2-4任一项所述的方法,其特征在于,若遍历所述i
个日志组合确定出的至少一个根因日志组合中存在第三根因日志组合,且所
述第三根因日志组合为所述故障时间点之前的根因日志组合,则所述对遍历
所述i个日志组合确定出的至少一个根因日志组合进行处理包括:
剔除所述第三根因日志组合。
6.根据权利要求1所述的方法,其特征在于,所述根据预设分析策略
对所述M类日志信息中每类日志信息进行分析,获取所述M类日志信息中
的N类根因日志包括:
确定与所述M类日志信息一一对应的M个异常值;所述异常值用于表
示:一类日志信息在第二时间段内发生的频繁程度和突变程度,所述第二时
间段包含所述第一时间段;
从所述M个异常值中获取前N个最大异常值,将所述第一日志信息集
中与所述前N个最大异常值对应的N类日志信息确定为所述N类根因日志。
7.根据权利要求6所述的方法,其特征在于,在确定与所述M类日志
信息一一对应的M个异常值之前,所述方法还包括:
获取所述网络设备在所述第二时间段内产生的第二日志信息集;所述第

\t二日志信息集包含至少一个日志信息,每个日志信息对应一个时间点;
对所述第二日志信息集进行预处理,获取第一日志行为矩阵;所述第一
日志行为矩阵包含:Q组日志行为向量,每个日志行为向量占用一个时间间
隔,每组日志行为向量包含R个元素,所述R为所述第二日志信息集对应
的日志类型的个数,所述R≥所述M;所述日志行为向量中的第j个元素表
示:在所述日志行为向量的时间间隔内第j类日志信息的个数;
根据公式IDFJMP(j)=log(Qqj)×log(maxk∈Q|ck+1,j-ck,j|)]]>分别计算所述R类日志信息
的异常值,得到与所述R类日志信息一一对应的R个异常值;
所述确定与所述M类日志信息一一对应的M个异常值包括:
从所述R个异常值中获取与所述M类日志信息一一对应的M个异常值;
其中,所述表示所述R类日志信息中第j类日志信息在所述第二日
志信息集中出现的频繁程度,所述表示所述R类日志信息
中第j类日志信息在所述第二日志信息集中的突变程度,所述qj为包含第j类
日志信息的日志行为向量的组数,所述ck+1,j表示第k+1个时间间隔内第j类日
志信息的总数量,所述ck,j表示第k个时间间隔内第j类日志信息的总数量。
8.根据权利要求7所述的方法,其特征在于,所述对所述第二日志信
息集进行预处理,获取第一日志行为矩阵包括:
将所述第二日志信息集中的每条日志信息的内容格式转换为预设的日
志格式;
对格式转换后的日志信息进行归类,并用日志信息所属的类别标识代替
所述日志信息,形成一个由类别标识组成的时间序列;
按照预设时间间隔对所述时间序列进行划分;
对于每个时间间隔,将所述时间间隔内相同的类别标识进行计数统计,
并将统计个数排列成一个R维日志行为向量;
将所有日志行为向量按照时间...

【专利技术属性】
技术研发人员:宋跃忠林程勇张星辰谭屯子高随祥
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1