训练故障分析模型的方法、电子设备和计算机程序产品技术

技术编号:37413246 阅读:15 留言:0更新日期:2023-04-30 09:37
本公开的实施例涉及训练故障分析模型的方法、电子设备和计算机程序产品。在本公开的实施例所提供的训练故障分析模型的方法中,获取包括多个预处理日志文件的至少一组日志文件,至少一组日志文件包括存储系统的经标注的故障原因,并且多个预处理日志文件中的预处理日志文件包括存储系统的一个或多个潜在故障原因以及与潜在故障原因相关联的得分;基于多个预处理日志文件中的潜在故障原因以及得分,根据故障分析模型,来预测存储系统的故障原因;以及基于所预测的故障原因是经标注的故障原因的概率,更新故障分析模型的参数。以此方式,能够针对日志包而不是日志文件来分析故障原因,提高故障分析效率。提高故障分析效率。提高故障分析效率。

【技术实现步骤摘要】
训练故障分析模型的方法、电子设备和计算机程序产品


[0001]本公开的实施例涉及信息处理领域,并且更具体地,涉及训练故障分析模型的方法、电子设备和计算机程序产品。

技术介绍

[0002]随着信息技术的发展,提供信息服务的公司日益增长。尤其是对于提供大规模和复杂信息服务的公司,用户在使用这种公司所提供的信息服务时容易遇到各种问题。这些问题可能是由软件缺陷、硬件或网络问题或操作错误引起的。为此,技术支持工程师团队需要处理有关问题报告的大量服务请求。

技术实现思路

[0003]在本公开的第一方面中,提供了一种训练故障分析模型的方法,故障分析模型用于确定存储系统故障的原因。该方法包括获取包括多个预处理日志文件的至少一组日志文件,至少一组日志文件包括存储系统的经标注的故障原因,并且多个预处理日志文件中的预处理日志文件包括存储系统的一个或多个潜在故障原因以及与潜在故障原因相关联的得分。该方法还包括基于多个预处理日志文件中的潜在故障原因以及得分,根据故障分析模型,来预测存储系统的故障原因。该方法还包括基于所预测的故障原因是经标注的故障原因的概率,更新故障分析模型的参数。
[0004]在本公开的第二方面中,提供了一种电子设备。该电子设备包括处理器以及与处理器耦合的存储器,存储器具有存储于其中的指令,指令在被处理器执行时使设备执行动作。动作包括获取包括多个预处理日志文件的至少一组日志文件,至少一组日志文件包括存储系统的经标注的故障原因,并且多个预处理日志文件中的预处理日志文件包括存储系统的一个或多个潜在故障原因以及与潜在故障原因相关联的得分。动作还包括基于多个预处理日志文件中的潜在故障原因以及得分,根据故障分析模型,来预测存储系统的故障原因。动作还包括基于所预测的故障原因是经标注的故障原因的概率,更新故障分析模型的参数。
[0005]在本公开的第三方面中,提供了一种计算机程序产品,计算机程序产品被有形地存储在计算机可读介质上并且包括机器可执行指令,机器可执行指令在被执行时使机器执行根据第一方面的方法。
[0006]提供
技术实现思路
部分是为了简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。
技术实现思路
部分无意标识本公开的关键特征或主要特征,也无意限制本公开的范围。
附图说明
[0007]通过结合附图对本公开示例性实施例进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施例中,相同的参考标号通常
代表相同部件。在附图中:
[0008]图1示出了本公开的实施例可以在其中被实现的示例环境的示意图;
[0009]图2示出了根据本公开的实施例的训练故障分析模型的示例方法的流程图;
[0010]图3示出了用于本公开的一些实施例的预处理文件的示意图;
[0011]图4示出了根据本公开的一些实施例的故障特征的示意图,故障特征是对图3的预处理文件中的得分进行聚合而生成的;以及
[0012]图5示出了可以用来实施本公开的实施例的示例设备的框图。
具体实施方式
[0013]下面将参考附图中示出的若干示例实施例来描述本公开的原理。虽然附图中显示了本公开的优选实施例,但应当理解,描述这些实施例仅是为了使本领域技术人员能够更好地理解进而实现本公开,而并非以任何方式限制本公开的范围。
[0014]在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
[0015]对于大型复杂的存储服务,技术支持工程师总是会处理大量的客户服务请求,包括软件缺陷、硬件或网络问题或操作错误引起的问题报告。如何从日志包(由几个相关的日志文件组成,每个日志文件由一定时间间隔内的连续日志行组成)推断系统故障的根本原因是服务请求分类过程的一项有益任务,因为客户端通常被要求上传日志包(由最近的日志文件组成)以进一步对故障原因进行分类。大多数从日志分析故障的方法是针对“日志文件”而不是“日志包”开发的。
[0016]本公开的实施例提出了一种训练故障分析模型的方案,该故障分析模型用于确定存储系统故障的原因。在模型的训练过程中,获取包括多个预处理日志文件的至少一组日志文件,预处理日志文件包括存储系统的一个或多个潜在故障原因以及与潜在故障原因相关联的得分。然后基于潜在故障原因和得分,根据故障分析模型,来预测存储系统的故障原因。基于所预测的故障原因是该至少一组日志文件中所包括的经标注的故障原因的概率,来更新故障分析模型的参数。
[0017]根据在此描述的实施例,利用训练好的故障分析模型,能够针对客户端上传的“日志包”分析故障的原因。在提高故障分析效率的同时,能够达到辅助经验不足的工程师处理客户服务请求的目的。
[0018]以下将参考附图来说明本公开的基本原理和若干示例实现方式。应当理解,给出这些示例性实施例仅是为了使本领域技术人员能够更好地理解进而实现本公开的实施例,而并非以任何方式限制本公开的范围。
[0019]图1示出了本公开的实施例可以在其中被实现的示例环境100的示意图。如图1所示,环境100包括云服务器110和客户端120。当客户端120发生故障时,会产生日志包130。日志包130包括多个日志文件。为了分析客户端120发生故障的原因,会要求客户端120上传日志包130至云服务器110。客户端120可以是用户设备或工作站。客户端120的示例可以包括
但不限于蜂窝移动电话、平板设备、膝上型计算机等。
[0020]云服务器110可以对客户端120上传的日志包130中的日志文件进行预处理。然后将经过预处理的日志包130输入到经训练的故障分析模型150中,用于分析得出客户端120的系统故障的原因。该故障分析模型150的训练方法将在后文结合图2进行详细描述。
[0021]应当理解,仅出于示例性的目的描述环境100的结构和功能,而不暗示对于本公开的范围的任何限制。例如,本公开的实施例还可以被应用到与环境100不同的环境中。另外,虽然图1中仅示出了一个日志包,但并不限于此,也可以存在更多或者更少的日志包。
[0022]图2示出了根据本公开的实施例的训练故障分析模型的示例方法200的流程图。方法200例如可以由如图1所示的云服务器110执行。应当理解,方法200还可以包括未示出的附加动作和/或可以省略所示出的动作,本公开的范围在此方面不受限制。以下结合图1来详细描述方法200。
[0023]在框210处,云服务器110获取包括多个预处理日志文件的至少一组日志文件。多个预处理日志文件是通过由云服务器110对客户端120上传的日志包130中的日志文件进行预处理而得到的。预处理是针对单个日志文件进行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种训练故障分析模型的方法,所述故障分析模型用于确定存储系统故障的原因,所述方法包括:获取包括多个预处理日志文件的至少一组日志文件,所述至少一组日志文件包括存储系统的经标注的故障原因,并且所述多个预处理日志文件中的预处理日志文件包括所述存储系统的一个或多个潜在故障原因以及与所述潜在故障原因相关联的得分;基于所述多个预处理日志文件中的所述潜在故障原因以及所述得分,根据所述故障分析模型,来预测所述存储系统的故障原因;以及基于所预测的所述故障原因是所述经标注的故障原因的概率,更新所述故障分析模型的参数。2.根据权利要求1所述的方法,其中预测所述存储系统的故障原因包括:基于所述潜在故障原因的故障类型,聚合所述多个预处理日志文件中的所述得分,以生成故障特征,所述故障特征至少指示故障类型以及针对相应故障类型的经聚合的所述得分;以及基于所述故障特征,根据所述故障分析模型,来预测所述存储系统的故障原因。3.根据权利要求2所述的方法,其中聚合所述多个预处理日志文件中的所述得分包括:基于所述潜在故障原因的故障类型、以及所述多个预处理日志文件中的预处理日志文件中包括的与所述潜在故障原因相关联的日志文件类型,聚合所述得分。4.根据权利要求3所述的方法,其中聚合所述多个预处理日志文件中的所述得分还包括:基于所述潜在故障原因的故障类型、所述日志文件类型、以及所述多个预处理日志文件中的预处理日志文件中包括的与所述日志文件类型相关联的存储节点标识符,聚合所述得分。5.根据权利要求1所述的方法,所述方法还包括:基于所述概率小于阈值,利用所述参数更新所述故障分析模型。6.根据权利要求1所述的方法,其中获取至少一组日志文件还包括:以多个时间窗口划分所述多个预处理日志文件;以及获取所述多个时间窗口中的时间窗口内的经划分的所述多个预处理日志文件,作为所述至少一组日志文件。7.一种电子设备,包括:处理器;以及与所述处理器耦合的存储器,所述存储器具有存储于其中的指令,所述指令在被所述处理器执行时使所述设备执行...

【专利技术属性】
技术研发人员:倪嘉呈龚旻周广州王子嘉贾真
申请(专利权)人:伊姆西IP控股有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1