故障排查方法及装置制造方法及图纸

技术编号:25708433 阅读:37 留言:0更新日期:2020-09-23 02:55
本公开涉及一种故障排查方法及装置,包括获取第一用户输入的第一检索关键字;根据所述第一检索关键字,确定第一故障类别;将与所述第一故障类别对应的预设故障排查链路,确定为候选故障排查链路,所述预设故障排查链路用于指示故障排查的顺序;基于所述第一用户的级别信息,从所述候选故障排查链路中选取最优的故障排查链路,其中,所述级别信息用于表示用户解决故障的能力。通过为该用户提供与其解决故障的能力较为匹配的故障排查顺序,根据本公开实施例的故障排查方法及装置能够降低故障定位和问题排出的时间,提升故障排查的效率。

【技术实现步骤摘要】
故障排查方法及装置
本公开涉及大数据
,尤其涉及一种故障排查方法及装置。
技术介绍
在现代运维体系中,规模化的应用系统需要自动化的监管系统进行管理。当应用系统发生故障时,需要分析系统日志,定位问题。在大规模分布式架构或者集群构架中,每天都会产生海量的系统日志,造成日志的分析和故障排查的效率较低。
技术实现思路
有鉴于此,本公开提出了一种故障排查方法及装置,能够提升故障排查的效率。根据本公开的第一方面,提供了一种故障排查方法,所述方法包括:获取第一用户输入的第一检索关键字;根据所述第一检索关键字,确定第一故障类别;将与所述第一故障类别对应的预设故障排查链路,确定为候选故障排查链路,所述预设故障排查链路用于指示故障排查的顺序;基于所述第一用户的级别信息,从所述候选故障排查链路中选取最优的故障排查链路,其中,所述级别信息用于表示用户解决故障的能力。根据本公开的第二方面,提供了一种故障排查装置,所述装置包括:第一获取模块,用于获取第一用户输入的第一检索关键字;第一确定模块,用于根据所述第一检索关键字,确定第一故障类别;第二确定模块,用于将与所述第一故障类别对应的预设故障排查链路,确定为候选故障排查链路,所述预设故障排查链路用于指示故障排查的顺序;选取模块,用于基于所述第一用户的级别信息,从所述候选故障排查链路中选取最优的故障排查链路,其中,所述级别信息用于表示用户解决故障的能力。根据本公开的第三方面,提供了一种故障排查装置,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为执行上述故障排查方法。根据本公开的第四方面,提供了一种非易失性计算机可读存储介质,其上存储有计算机程序指令,其中,所述计算机程序指令被处理器执行时实现上述故障排查方法。在本公开实施例中,根据用户输入的检索关键字,确定故障类别,并基于该用户的级别信息,从与该故障类别对应的预设排查链路中选取最优的故障排查链路,通过为该用户提供与其解决故障的能力较为匹配的故障排查顺序,能够降低故障定位和问题排出的时间,提升故障排查的效率。根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。附图说明包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本公开的示例性实施例、特征和方面,并且用于解释本公开的原理。图1示出根据本公开一实施例的故障排查方法的流程图。图2示出本公开实施例的客户端的界面的一个示例性示意图。图3示出本公开实施例的故障排查树的一个示例性示意图。图4示出图3所示的故障排查树的评分结果的一个示例性示意图。图5示出根据本公开一实施例的故障排查装置的框图。具体实施方式以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。另外,为了更好的说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。图1示出根据本公开一实施例的故障排查方法的流程图。所述方法可以应用于服务器。如图1所示,该方法可以包括:步骤S11,获取第一用户输入的第一检索关键字。步骤S12,根据所述第一检索关键字,确定第一故障类别。步骤S13,将与所述第一故障类别对应的预设故障排查链路,确定为候选故障排查链路,所述预设故障排查链路用于指示故障排查的顺序。步骤S14,基于所述第一用户的级别信息,从所述候选故障排查链路中选取最优的故障排查链路,其中,所述级别信息用于表示用户解决故障的能力。在本公开实施例中,根据用户输入的检索关键字,确定故障类别,并基于该用户的级别信息,从与该故障类别对应的预设排查链路中选取最优的故障排查链路,通过为该用户提供与其解决故障的能力较为匹配的故障排查顺序,能够降低故障定位和问题排出的时间,提升故障排查的效率。在步骤S11中,第一用户可以表示进行故障排查操作的用户。第一检索关键字可以表示第一用户输入的检索关键字。其中,检索关键字可以用于定位日志的内容。用户认为应用系统出现故障的原因可能是A部分出现故障时,可以客户端中输入与A部分对应的检索关键字。之后,用户可以根据与检索关键字相关联的日志内容,确定A部分是否出现故障。在一种可能的实现方式中,客户端的界面可以包括关键字输入区域、结果展示区域和检索控件。用户可以在客户端的关键字输入区域中输入检索关键字,并触发检索控件。客户端检测到检索控件被触发时,可以将从关键字输入区域中获取的检索关键字作为第一检索关键字;生成携带有该第一关键字的关键字检索请求,并将该关键字请求发送至服务器。服务器接收到该关键字检索请求时,可以从该关键字检索请求中获取第一用户输入的第一检索关键字。服务器可以将第一检索关键字相关联的日志内容返回给客户端。客户端可以在结果展示区域展示服务器返回的日志内容。用户可以根据结果展示区域中展示的日志内容,确定第一检索关键字相关的部分是否出现故障。客户端可以安装为手机、平板、笔记本电脑或者计算机等电子设备中的应用程序,客户端也可以为网页。本公开对此不做限制。图2示出本公开实施例的客户端的界面的一个示例性示意图。如图2所示,客户端的界面可以包括输入框(对应于关键字输入区域)、结果展示框(对应于结果展示区域)和检索按钮(对应于检索控件)。在步骤S12中,第一故障类别可以表示第一检索关键字代表的故障类别。服务器可以预先设置故障关键字和故障类别的关联关系,查找与第一检索关键字匹配的故障关键字,将查找到的故障关键字关联的故障类别确定为第一故障类别。在一种可能的实现方式,步骤S12可以包括:针对每个预设故障类别,获取代表该预设故障类别的故障关键字;根据所述第一检索关键字与各故障关键字的语义相似度,确定出与所述第一检索关键字匹配的故障关键字;将与所述第一检索关键字匹配的故障关键字代表的预设故障类别,确定为所述第一故障类别。预设故障类别可以表示预先设置的故障类别。例如,预设故障类别可以为系统默认的故障类别,或者用户初始设置的故障类别,对此本公开不做限制。在一种可能的实现方式,可以获取多个日志;基于预设故障类别,对所述多个日志进行聚类分析,得到代表每个预设故障类别的故障关键字。在一个示例中,可以基于文本聚类分析、LDA分析或者序列分析中的一者或多者的组合对多个日志进行聚类分析。以LDA分析为例进行说明,LDA分析以多个日志组成的日志集合作为输入,基于预设故障类别可以输出每个日志对应到不同预设故障类别的概率,以及对各预设故障类别具有代表性的分词本文档来自技高网...

【技术保护点】
1.一种故障排查方法,其特征在于,所述方法包括:/n获取第一用户输入的第一检索关键字;/n根据所述第一检索关键字,确定第一故障类别;/n将与所述第一故障类别对应的预设故障排查链路,确定为候选故障排查链路,所述预设故障排查链路用于指示故障排查的顺序;/n基于所述第一用户的级别信息,从所述候选故障排查链路中选取最优的故障排查链路,其中,所述级别信息用于表示用户解决故障的能力。/n

【技术特征摘要】
1.一种故障排查方法,其特征在于,所述方法包括:
获取第一用户输入的第一检索关键字;
根据所述第一检索关键字,确定第一故障类别;
将与所述第一故障类别对应的预设故障排查链路,确定为候选故障排查链路,所述预设故障排查链路用于指示故障排查的顺序;
基于所述第一用户的级别信息,从所述候选故障排查链路中选取最优的故障排查链路,其中,所述级别信息用于表示用户解决故障的能力。


2.根据权利要求1所述的方法,其特征在于,根据所述第一检索关键字,确定第一故障类别,包括:
针对每个预设故障类别,获取代表该预设故障类别的故障关键字;
根据所述第一检索关键字与各故障关键字的语义相似度,确定出与所述第一检索关键字匹配的故障关键字;
将与所述第一检索关键字匹配的故障关键字代表的预设故障类别,确定为所述第一故障类别。


3.根据权利要求2所述的方法,其特征在于,针对每个预设故障类别,获取代表该预设故障类别的故障关键字,包括:
获取多个日志;
基于预设故障类别,对所述多个日志进行聚类分析,得到代表每个预设故障类别的故障关键字。


4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
获取多个用户的检索记录;
针对所述多个用户中的每个用户,根据该用户的检索记录,获取该用户检索次数最多的检索关键字,作为第二检索关键字,并将与所述第二检索关键字匹配的故障关键字代表的预设故障类别,确定为该用户的类别;
根据所述多个用户中,类别为第一故障类别的用户的检索记录,生成与所述第一故障类别对应的预设故障排查链路。


5.根据权利要求1所述的方法,其特征在于,基于所述第一用户的级别信息,从所述候选故障排查链路中选取最优的故障排查链路,包括:
针对每个候选故障排查链路:
根据所述第一用户的级别信息,确定该候选故障排查链路中各故障关键字的第一用户级别,故障关键字的第一用户级别用于表示第一用户解决该故障关键字对应故障的能力;
根据该候选故障排查链路中各故障关键字的第一用户级别和第一用户的检索记录,对该候选故障排查链路中各故障关键字进行评分;
根据各候选故障排查链路包括的故障关键字个数,以及每个故障关键字的评分,选出最优故障排查链路。


6.根据权利要求1至5任意一项所述的方法,其特征在于,所述方法还包括:
根据所述第一用户的检索记录,对第一用户的预设级别信息进行调整,得到所述第一用户的级别信息。


7.根据权利要求1至5任意一项所述的方法,其特征在于,所述方法还包括:
根据所述最优故障排查链路,确定后续检索时使用的检索关键字。


8.一种故障排查装置,其特征在于,所述装置包括:
第一获取模块,用于获取第一用户输入的第一检索关键字;
第一确定模块,用于根据所述第一检索关键字,确定第一故障类别;
第二确定模块,用于将与所述第一...

【专利技术属性】
技术研发人员:陈爽
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1