分布式系统中设备故障巡检方法、装置、设备和介质制造方法及图纸

技术编号:37705761 阅读:8 留言:0更新日期:2023-06-01 23:54
本申请提供一种分布式系统中设备故障巡检方法、装置、设备和介质,涉及金融科技领域或其他相关领域,该方法包括:从日志中心获取分布式系统中每个设备产生的日志;获取关键词并确定每个关键词的检索顺序,关键词包括加载缓存失败、异常、重启失败中的至少一种,不同的关键词的检索顺序不相同;根据每个关键词的检索顺序,从日志中检索出与关键词匹配的目标日志;根据目标日志,确定分布式系统中的设备是否存在故障。该技术方案通过关键词来从海量的日志文件中检索出与关键词匹配的目标日志,然后对目标日志进行分析即可精准的定位到所有报错信息,并确定出产生该日志文件的设备是否存在故障,提高巡检的效率和准确性。提高巡检的效率和准确性。提高巡检的效率和准确性。

【技术实现步骤摘要】
分布式系统中设备故障巡检方法、装置、设备和介质


[0001]本申请涉及金融科技领域或其他相关领域,尤其涉及一种分布式系统中设备故障巡检方法、装置、设备和介质。

技术介绍

[0002]在分布式场景下,设备的数量较多而且通常都处于不同的空间地域,为此设备的巡检通常都是基于日志进行的,而由于设备的数量较多,产生的日志数量也很大,需要从海量的日志文件中巡检出异常设备较为困难。
[0003]现有技术中,在对设备进行巡检时,一般采用的是人工巡检的方式,即人工取出所有设备的日志文件,然后对日志文件进行排查以确定是否有异常现象对应的故障。但是,这种人工巡检的方式成本高,效率低。

技术实现思路

[0004]本申请提供一种分布式系统中设备故障巡检方法、装置、设备和介质,用于解决现有人工对设备巡检效率低,成本高的问题。
[0005]第一方面,本申请提供一种分布式系统中设备故障巡检方法,包括:
[0006]从日志中心获取分布式系统中每个设备产生的日志,不同的设备产生的日志存储在所述日志中心的不同目录下;
[0007]获取关键词并确定每个关键词的检索顺序,所述关键词包括加载缓存失败、异常、重启失败中的至少一种,不同的关键词的检索顺序不相同;
[0008]根据每个关键词的检索顺序,从所述日志中检索出与所述关键词匹配的目标日志;
[0009]根据所述目标日志,确定所述分布式系统中的设备是否存在故障。
[0010]在第一方面的一种可能设计中,所述获取关键词并确定每个关键词的检索顺序,包括:
[0011]获取关键词并确定每个关键词的重要程度;
[0012]根据每个关键词的重要程度,确定每个关键词的检索顺序;
[0013]对应的,所述根据每个关键词的检索顺序,从所述日志中检索出与所述关键词匹配的目标日志,包括:
[0014]从所述日志中检索确定是否存在与检索顺序靠前的关键词匹配的第一日志;
[0015]若从所述日志中检索得到与检索顺序靠前的关键词匹配的第一日志,则直接将所述第一日志作为所述目标日志;
[0016]若从所述日志中检索不到与检索顺序靠前的关键词匹配的第一日志,则继续从所述日志中检索出与检索顺序靠后的关键词匹配的第二日志,并将所述第二日志作为所述目标日志。
[0017]在第一方面的另一种可能设计中,所述根据所述目标日志,确定所述分布式系统
中的设备是否存在故障,包括:
[0018]确定产生所述目标日志的设备的类别、所述关键词在所述目标日志中出现的次数,所述设备至少分为核心设备和非核心设备两种类别;
[0019]若所述设备为核心设备且所述关键词在所述目标日志中出现的次数大于或等于1,则根据所述核心设备产生的目标日志,确定所述核心设备是否存在故障。
[0020]在第一方面的再一种可能设计中,所述根据所述目标日志,确定所述分布式系统中的设备是否存在故障,包括:
[0021]当所述设备为非核心设备且所述关键词在所述目标日志中出现的次数大于1时,继续确定所述关键词在所述目标日志中出现的次数是否大于或等于预设阈值,
[0022]若所述关键词在所述目标日志中出现的次数大于或等于预设阈值,则根据所述非核心设备产生的目标日志,确定所述非核心设备是否存在故障。
[0023]在第一方面的又一种可能设计中,所述方法还包括:
[0024]根据各个设备所属的类别,对各个设备产生的日志进行分类,所述设备至少分为核心设备和非核心设备两种类别;
[0025]将不同类别的日志分别存储至所述日志中心的不同目录下。
[0026]在第一方面的又一种可能设计中,所述根据每个关键词的检索顺序,从所述日志中检索出与所述关键词匹配的目标日志,包括:
[0027]获取存储在第一目录下的日志和存储在第二目录下的日志,所述第一目录下存储的日志为所述核心设备产生的,所述第二目录下存储的日志为所述非核心设备产生的;
[0028]根据每个关键词的检索顺序,从所述第一目录下存储的日志中检索确定是否存在与所述关键词匹配的日志;
[0029]若所述第一目录下存在与所述关键词匹配的日志,则将该日志作为目标日志;
[0030]若所述第一目录下不存在与所述关键词匹配的日志,则从所述第二目录下的日志中检索出与所述关键词匹配的日志,作为目标日志。
[0031]在第一方面的又一种可能设计中,所述根据所述目标日志,确定所述分布式系统中的设备是否存在故障,包括:
[0032]获取在所述目标日志中出现所述关键词时,产生该目标日志的设备的巡检指标,所述巡检指标至少包括CPU占用数据、内存使用数据、磁盘读写数据繁忙度中的至少一种;
[0033]根据所述巡检指标,确定所述设备是否存在故障。
[0034]在第一方面的又一种可能设计中,所述方法还包括:若所述设备存在故障,则输出报警信息。
[0035]第二方面,本申请提供一种分布式系统中设备故障巡检装置,包括:
[0036]日志获取模块,用于从日志中心获取分布式系统中每个设备产生的日志,不同的设备产生的日志存储在所述日志中心的不同目录下;
[0037]顺序确定模块,用于获取关键词并确定每个关键词的检索顺序,所述关键词包括加载缓存失败、异常、重启失败中的至少一种,不同的关键词的检索顺序不相同;
[0038]日志检索模块,用于根据每个关键词的检索顺序,从所述日志中检索出与所述关键词匹配的目标日志;
[0039]故障判定模块,用于根据所述目标日志,确定所述分布式系统中的设备是否存在
故障。
[0040]第三方面,本申请实施例提供一种计算机设备,包括:处理器,以及与所述处理器通信连接的存储器;所述存储器存储计算机执行指令;所述处理器执行所述存储器存储的计算机执行指令,以实现如上述的方法。
[0041]第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机指令,所述计算机指令被处理器执行时用于实现如上述的方法。
[0042]第五方面,本申请实施例提供一种计算机程序产品,包括计算机指令,该计算机指令被处理器执行时实现上述的方法。
[0043]本申请实施例提供的分布式系统中设备故障巡检方法、装置、设备和介质,通过关键词来从海量的日志文件中检索出与关键词匹配的目标日志,然后对目标日志进行分析即可精准的定位到所有报错信息,并确定出产生该日志文件的设备是否存在故障,提高巡检的效率和准确性。
附图说明
[0044]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理;
[0045]图1为本申请实施例提供的设备故障巡检系统的示意图;
[0046]图2为本申请实施例提供的分布式系统中设备故障巡检方法流程示意图;
[0047]图3为本申请另一实施例提供的分布式系统中设备故障巡本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种分布式系统中设备故障巡检方法,其特征在于,包括:从日志中心获取分布式系统中每个设备产生的日志,不同的设备产生的日志存储在所述日志中心的不同目录下;获取关键词并确定每个关键词的检索顺序,所述关键词包括加载缓存失败、异常、重启失败中的至少一种,不同的关键词的检索顺序不相同;根据每个关键词的检索顺序,从所述日志中检索出与所述关键词匹配的目标日志;根据所述目标日志,确定所述分布式系统中的设备是否存在故障。2.根据权利要求1所述的方法,其特征在于,所述获取关键词并确定每个关键词的检索顺序,包括:获取关键词并确定每个关键词的重要程度;根据每个关键词的重要程度,确定每个关键词的检索顺序;对应的,所述根据每个关键词的检索顺序,从所述日志中检索出与所述关键词匹配的目标日志,包括:从所述日志中检索确定是否存在与检索顺序靠前的关键词匹配的第一日志;若从所述日志中检索得到与检索顺序靠前的关键词匹配的第一日志,则直接将所述第一日志作为所述目标日志;若从所述日志中检索不到与检索顺序靠前的关键词匹配的第一日志,则继续从所述日志中检索出与检索顺序靠后的关键词匹配的第二日志,并将所述第二日志作为所述目标日志。3.根据权利要求1所述的方法,其特征在于,所述根据所述目标日志,确定所述分布式系统中的设备是否存在故障,包括:确定产生所述目标日志的设备的类别、所述关键词在所述目标日志中出现的次数,所述设备至少分为核心设备和非核心设备两种类别;若所述设备为核心设备且所述关键词在所述目标日志中出现的次数大于或等于1,则根据所述核心设备产生的目标日志,确定所述核心设备是否存在故障。4.根据权利要求3所述的方法,其特征在于,所述根据所述目标日志,确定所述分布式系统中的设备是否存在故障,包括:当所述设备为非核心设备且所述关键词在所述目标日志中出现的次数大于1时,继续确定所述关键词在所述目标日志中出现的次数是否大于或等于预设阈值,若所述关键词在所述目标日志中出现的次数大于或等于预设阈值,则根据所述非核心设备产生的目标日志,确定所述非核心设备是否存在故障。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据各个设备所属的类别,对各个设备产生的日志进行分类,所述设备至少分为核心设备和非核心设备两种类别;将不同类别的日志分别存储至所述日志中心的不同目录下。6.根据权利要求5所述的方法,其特征在于,所述根据每...

【专利技术属性】
技术研发人员:桑银邦魏鑫成诺高楚皓
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1