通过日志文件的关键区域的基于机器学习的识别进行服务请求补救制造技术

技术编号:35090908 阅读:29 留言:0更新日期:2022-10-01 16:48
一种设备包括处理装置,所述处理装置被配置为:接收与给定资产相关联的服务请求;获得与所述给定资产相关联的日志文件;将所述日志文件分为日志段;生成所述日志段的日志模式标识符集;以及使用机器学习模型确定所述日志段的风险评分,所述机器学习模型将所述日志模式标识符集作为输入,并提供表征所述日志段的风险的信息作为输出。所述处理装置还被配置为至少部分地基于所确定的风险评分来识别所述日志文件的关键区域,给定关键区域包括具有高于指定风险评分阈值的所确定风险评分的日志段序列。所述处理装置还被配置为分析所识别的关键区域,以确定将用于解决所述服务请求的补救动作。动作。动作。

【技术实现步骤摘要】
通过日志文件的关键区域的基于机器学习的识别进行服务请求补救


[0001]本领域总体上涉及信息处理,并且更具体地,涉及信息处理系统中的装置管理。

技术介绍

[0002]监视和分析平台可用于为信息技术基础设施的资产提供各种服务。此类服务可能包括例如对此类资产遇到的问题进行故障排除和补救。这可能包括监视和分析平台的支持工程师从与资产相关联的最终用户接收服务请求,并且支持工程师确定资产上遇到的问题的根本原因。为此,支持工程师可查看由资产生成或与资产相关联的日志文件。

技术实现思路

[0003]本公开的说明性实施方案提供用于通过日志文件的关键区域的基于机器学习的识别进行服务请求补救的技术。
[0004]在一个实施方案中,一种设备包括至少一个处理装置,所述处理装置包括耦合至存储器的处理器。所述至少一个处理装置被配置为执行以下步骤:接收与信息技术基础设施的给定资产相关联的服务请求;获得与所述给定资产相关联的至少一个日志文件;将所述至少一个日志文件分成多个日志段;针对所述多个日志段中的每一个生成日志模式标识符集;以及使用机器学习模型针对所述多个日志段中的每一个确定风险评分,所述机器学习模型将所述日志模式标识符集作为输入,并提供表征所述多个日志段中的相应日志段的风险的信息作为输出。所述至少一个处理装置还被配置为执行以下步骤:至少部分地基于所确定的风险评分来识别所述至少一个日志文件的一个或多个关键区域,所述一个或多个关键区域中的给定关键区域包括:至少一个日志文件的多个日志段中的两个或更多个的序列,所述序列具有高于指定风险评分阈值的所确定风险评分。所述至少一个处理装置还被配置为执行以下步骤:分析所识别的一个或多个关键区域,以确定要应用于给定资产以解决服务请求的一个或多个补救动作。
[0005]这些和其他说明性实施方案包括但不限于方法、设备、网络、系统和处理器可读存储介质。
附图说明
[0006]图1是在说明性实施方案中的信息处理系统的框图,所述信息处理系统被配置为通过日志文件的关键区域的基于机器学习的识别进行服务请求补救。
[0007]图2是在说明性实施方案中用于通过日志文件的关键区域的基于机器学习的识别进行服务请求补救的示例性过程的流程图。
[0008]图3是在说明性实施方案中用于对服务请求进行分类的示例性过程的流程图。
[0009]图4示出在说明性实施方案中的日志模式标识符的生成。
[0010]图5示出在说明性实施方案中的基于Transformer的双向编码器表示(BERT)机器
学习模型的示例架构。
[0011]图6示出在说明性实施方案中的BERT机器学习模型的操作。
[0012]图7示出在说明性实施方案中用于预训练BERT机器学习模型的掩蔽语言模型的使用。
[0013]图8示出在说明性实施方案中的用于BERT机器学习模型的下一句预测预训练。
[0014]图9示出在说明性实施方案中的原始日志行到日志模式和相关联的日志模式标识符的转换。
[0015]图10示出说明在说明性实施方案中用于对服务请求进行分类的机器学习模型的准确性的图。
[0016]图11示出在说明性实施方案中的针对日志段序列的风险评分确定的示例。
[0017]图12示出在说明性实施方案中的日志段序列的随时间变化的风险评分的图。
[0018]图13示出在说明性实施方案中的可选择以应用于机器学习模型以对服务请求进行分类的日志文件表。
[0019]图14示出在说明性实施方案中将用于对服务请求进行分类的机器学习模型应用于给定日志文件的输出结果的表。
[0020]图15A至图15C示出在说明性实施方案中用于显示将用于对服务请求进行分类的机器学习模型应用于日志文件的结果的界面视图。
[0021]图16和图17示出在说明性实施方案中的可用于实现信息处理系统的至少一部分的处理平台的示例。
具体实施方式
[0022]本文将参考示例性信息处理系统以及相关联计算机、服务器、存储装置和其他处理装置来描述说明性实施方案。然而,应了解,实施方案不限于与所示的特定说明性系统和装置配置一起使用。因此,如本文所用的术语“信息处理系统”意图广泛地解释,以便涵盖例如包括云计算和存储系统的处理系统,以及包括物理和虚拟处理资源的各种组合的其他类型的处理系统。因此,信息处理系统可包括例如至少一个数据中心或其他类型的基于云的系统,其包括托管访问云资源的租户的一个或多个云。
[0023]图1示出根据说明性实施方案配置的信息处理系统100,所述信息处理系统用于提供通过日志文件的关键区域的基于机器学习的识别进行服务请求补救的功能。信息处理系统100包括通过网络104与一个或多个存储阵列106

1、106

2、......106

M(统称为存储阵列106)通信的一个或多个主机装置102

1、102

2、......102

N(统称为主机装置102)。网络104可包括存储区域网络(SAN)。
[0024]如图1中所示,存储阵列106

1包括多个存储装置108,每个存储装置存储由在主机装置102上运行的一个或多个应用程序利用的数据。存储装置108说明性地布置在一个或多个存储池中。存储阵列106

1还包括一个或多个存储控制器110,所述一个或多个存储控制器促进对存储装置108的IO处理。存储阵列106

1及其相关联存储装置108是在本文中更一般地称为“存储系统”的事物的实例。本实施方案中的此存储系统由主机装置102共享,并且因此在本文中也称为“共享存储系统”。在仅存在单个主机装置102的实施方案中,主机装置102可被配置来独占使用存储系统。
[0025]主机装置102说明性地包括能够通过网络104与存储阵列106通信的相应计算机、服务器或其他类型的处理装置。例如,主机装置102的至少一个子集可被实现为计算服务平台或其他类型的处理平台的相应虚拟机。这种布置中的主机装置102说明性地提供计算服务,诸如代表与主机装置102中的相应主机装置相关联的一个或多个用户中的每个用户执行一个或多个应用程序。
[0026]本文中的术语“用户”意图广泛地解释,以便涵盖人、硬件、软件或固件实体以及此类实体的组合的众多布置。
[0027]可在平台即服务(PaaS)模型、基础设施即服务(IaaS)模型和/或功能即服务(FaaS)模型下为用户提供计算和/或存储服务,但应了解,可使用众多其他云基础设施布置。而且,说明性实施方案可在云基础设施背景之外实现,如就在给定企业内实现的独立式计算和存储系统而言。
[0028]存储阵列106

1的存储装置108可实现被配置来存储与主机装置102相关联的用户的对象的逻辑单元(LUN)。这些对象可包括文件、块或其他类型的对象。主本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种设备,所述设备包括:至少一个处理装置,所述至少一个处理装置包括耦合至存储器的处理器;所述至少一个处理装置被配置为执行以下步骤:接收与信息技术基础设施的给定资产相关联的服务请求;获得与所述给定资产相关联的至少一个日志文件;将所述至少一个日志文件分成多个日志段;针对所述多个日志段中的每一个生成日志模式标识符集;使用机器学习模型来确定所述多个日志段中的每一个的风险评分,所述机器学习模型将所述日志模式标识符集作为输入,并提供表征所述多个日志段中的相应日志段的风险的信息作为输出;至少部分地基于所确定的风险评分来识别所述至少一个日志文件的一个或多个关键区域,所述一个或多个关键区域中的给定关键区域包括所述至少一个日志文件的所述多个日志段中的两个或更多个的序列,所述序列具有高于指定风险评分阈值的所确定风险评分;以及分析所识别的一个或多个关键区域以确定要应用于所述给定资产以解决所述服务请求的一个或多个补救动作。2.如权利要求1所述的设备,其中所述给定资产包括所述信息技术基础设施中的物理计算资源和虚拟计算资源中的至少一个。3.如权利要求1所述的设备,其中将所述至少一个日志文件分为所述多个日志段包括将所述至少一个日志文件分为日志段,每个日志段包括所述至少一个日志文件的指定数量的日志行,并且其中所述日志模式标识符中的每一个表示所述日志行中的一个。4.如权利要求3所述的设备,其中生成所述日志模式标识符集包括将所述日志行聚类以制定日志模式集;以及向所述日志行中的每一个分配与所述日志模式集中的一个相关联的标识符。5.如权利要求4所述的设备,其中将所述日志行聚类以制定所述日志模式集包括利用一个或多个相似性度量来测量所述日志行之间的相似性。6.如权利要求1所述的设备,其中针对所述多个日志段中的每个日志段确定风险评分至少部分地基于分析表征所述多个日志段中的相应日志段的所述风险的所述输出信息的熵。7.如权利要求6所述的设备,其中所述机器学习模型包括基于Transformer的双向编码器表示(BERT)模型。8.如权利要求7所述的设备,其中所述BERT模型利用掩蔽语言模型(MLM)进行预训练。9.如权利要求7所述的设备,其中所述BERT模型利用下一句预测(NSP)进行预训练。10.如权利要求7所述的设备,其中针对所述多个日志段中的给定日志段,所述BERT模型被配置为:将所述给定日志段的所述日志模式标识符集嵌入到输入向量集中;处理两个或更多个堆叠编码器的集中的所述输入向量集;以及输出输出向量的序列,每个输出向量对应于所述给定日志段的所述日志模式标识符集中的一个。
11.如权利要求1所述的设备,其中识别所述至少一个日志文件的所述给定关键区域包括将滑动窗口过滤器应用于与所述至少一个日志文件的所述多个日志段的连续序列相关联的风险评分。12.如权利要求11所述的设备,其中应用所述滑动窗滤波器包括:设置包括至少两个日志段的窗口大小;设置一个或多个阈值匹配标准;当所述滑动窗口过滤器的窗口中的所述至少两个日志段满足所述一个或多个阈值匹配标准时,识别所述至少一个日志文件的所述给定关键区域的开始;以及当所述滑动窗口过滤器的所述窗口中的所述至少两个日志段不满足所述一个或多个阈值匹配标准时,识别所述至少一个日志文件的所述给定关键区域的结束。13.如权利要求12所述的设备,其中所述滑动窗口过滤器包括滑动窗口平均过滤器,并且其中所述一个或多个阈值匹配标准包括所述滑动窗口平均过滤器的所述窗口中的至少两段的指定平均风险评分。14.如权利要求1所述的设备,其中分析所述所识别的一个或多个关键区域包括:从问题知识库中识别一个或多个问题,这些问题具有影响所述...

【专利技术属性】
技术研发人员:倪嘉呈龚旻周广州王子嘉贾真
申请(专利权)人:戴尔产品有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1