资源健康检查方法和资源健康检查装置制造方法及图纸

技术编号:21999875 阅读:47 留言:0更新日期:2019-08-31 05:18
本公开提供了一种资源健康检查方法,包括响应于检查指令,读取与所述检查指令对应的检查作业集合以及允许的并行数量,获得所述检查作业集合中的各个检查作业的预计执行时长和多个检查作业之间的依赖关系,基于所述各个检查作业的预计执行时长、允许的并行数量和多个检查作业之间的依赖关系,将所述多个检查作业分为多个作业组,每个作业组包括一个或多个检查作业,使得并行执行所述多个作业组的检查的总耗费时长满足特定条件,并行执行所述多个作业组中的检查作业,检查资源的健康状况,得到检查结果,以及输出所述检查结果。本公开还提供了一种资源健康检查装置。

Resource Health Examination Method and Resource Health Examination Device

【技术实现步骤摘要】
资源健康检查方法和资源健康检查装置
本公开涉及一种资源健康检查方法和资源健康检查装置。
技术介绍
在基础设施运维中,需要对系统发生异常情况进行检查。这样的检查过程可能会跨越多种不同的资源逐层展开。例如,当发现运行在云平台虚拟机中的数据库性能变差,会分别从应用性能,应用与数据库网络性能,计算资源性能,宿主机资源竞争情况,存储资源性能等方面分别进行性能检查。这样的检查定位往往按照一定的工作流程一步步推进诊断定位,例如按照应用层到物理层的多个层级逐层进行检查,每一个层次的内容检查完成之后检查下一层次内容,直到按照流程定位到问题位置已告结束。该工作流程具有较强的逻辑顺序,能够有效地排查问题,能够有效展开检查工作。然而,本专利技术人发现,在复杂的问题定位过程中,上述方法存在问题诊断效率不足的问题。
技术实现思路
本公开的一个方面提供了一种资源健康检查的方法,包括响应于检查指令,读取与所述检查指令对应的检查作业集合以及允许的并行数量,获得所述检查作业集合中的各个检查作业的预计执行时长和多个检查作业之间的依赖关系,基于所述各个检查作业的预计执行时长、允许的并行数量和多个检查作业之间的依赖关系,将所述多个检查作业分为多个作业组,每个作业组包括一个或多个检查作业,使得并行执行所述多个作业组的检查的总耗费时长满足特定条件,并行执行所述多个作业组中的检查作业,检查资源的健康状况,得到检查结果,以及输出所述检查结果。可选地,作业组时长相近的作业组被分配到并行任务中来处理,其中,作业组时长是执行作业组中的全部检查作业所需要的时长。可选地,所述特定条件包括所述多个作业组中的两个作业组的作业组时长的差值在第一范围内。可选地,所述特定条件包括所述多个作业组中的两个作业组的作业组时长的比值在第二范围内。可选地,所述特定条件包括并行执行所述多个作业组中的检查作业所耗费的总时长达到最小。可选地,所述获得所述检查作业集合中的各个检查作业的预计执行时长包括获得历史记录,基于所述历史记录,确定所述检查作业集合中的各个检查作业的预计执行时长,所述方法还包括在一个检查作业执行完成之后,将该检查作业的实际执行时长写入所述历史记录。可选地,所述读取与所述检查指令对应的检查作业集合包括,基于所述检查指令,确定多个检查操作,确定所述检查操作的判断标准,以及将每个检查操作和相应的判断标准封装为一个检查作业,得到与所述检查指令对应的检查作业集合。本公开的另一个方面提供了一种资源健康检查的装置,包括读取模块、获得模块、处理模块、执行模块以及输出模块。读取模块,用于响应于检查指令,读取与所述检查指令对应的检查作业集合以及允许的并行数量。获得模块,用于获得所述检查作业集合中的各个检查作业的预计执行时长和多个检查作业之间的依赖关系。处理模块,用于基于所述各个检查作业的预计执行时长、允许的并行数量和多个检查作业之间的依赖关系,将所述多个检查作业分为多个作业组,每个作业组包括一个或多个检查作业,使得在并行执行所述多个作业组时中的检查作业所耗费的总时长满足特定条件。执行模块,用于并行执行所述多个作业组中的检查作业,检查资源的健康状况,得到检查结果。输出模块,用于输出所述检查结果。可选地,作业组时长相近的作业组被分配到并行任务中来处理,其中,作业组时长是执行作业组中的全部检查作业所需要的时长。可选地,所述特定条件包括所述多个作业组中的两个作业组的作业组时长的差值在第一范围内。可选地,所述特定条件包括所述多个作业组中的两个作业组的作业组时长的比值在第二范围内。可选地,所述特定条件包括并行执行所述多个作业组中的检查作业所耗费的总时长达到最小。可选地,所述获得模块包括获得子模块和第一确定子模块。获得子模块,用于获得历史记录。第一确定子模块,用于基于所述历史记录,确定所述检查作业集合中的多个检查作业的预计执行时长。所述装置还包括记录模块,用于在一个检查作业执行完成之后,将该检查作业的实际执行时长写入所述历史记录。可选地,所述读取模块包括第二确定子模块、第三确定子模块以及封装子模块。第二确定子模块,用于基于所述检查指令,确定多个检查操作。第三确定子模块,用于确定所述检查操作的判断标准。封装子模块,用于将每个检查操作和相应的判断标准封装为一个检查作业,得到与所述检查指令对应的检查作业集合。本公开的另一个方面提供了一种电子设备,包括,至少一个处理器以及至少一个存储器,用于存储一个或多个计算机可读指令,其中,当所述一个或多个计算机可读指令被所述至少一个处理器执行时,使得所述处理器执行如上所述的方法。本公开的另一方面提供了一种非易失性存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。附图说明为了更完整地理解本公开及其优势,现在将参考结合附图的以下描述,其中:图1A和图1B示意性示出了根据本公开的实施例的资源健康检查的示例性场景;图2示意性示出了根据本公开实施例的资源健康检查方法的流程图;图3示意性示出了根据本公开实施例的读取与所述检查指令对应的检查作业集合的流程图;图4示意性示出了根据本公开实施例的资源健康检查装置的框图;图5示意性示出了根据本公开另一实施例的资源健康检查装置的框图;图6示意性示出了根据本公开实施例的读取模块的框图;以及图7示意性示出了根据本公开实施例的计算机系统的框图。具体实施方式以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器本文档来自技高网...

【技术保护点】
1.一种资源健康检查方法,包括:响应于检查指令,读取与所述检查指令对应的检查作业集合以及允许的并行数量;获得所述检查作业集合中的各个检查作业的预计执行时长和多个检查作业之间的依赖关系;基于所述各个检查作业的预计执行时长、允许的并行数量和多个检查作业之间的依赖关系,将所述多个检查作业分为多个作业组,每个作业组包括一个或多个检查作业,使得并行执行所述多个作业组的检查的总耗费时长满足特定条件;并行执行所述多个作业组中的检查作业,检查资源的健康状况,得到检查结果;以及输出所述检查结果。

【技术特征摘要】
1.一种资源健康检查方法,包括:响应于检查指令,读取与所述检查指令对应的检查作业集合以及允许的并行数量;获得所述检查作业集合中的各个检查作业的预计执行时长和多个检查作业之间的依赖关系;基于所述各个检查作业的预计执行时长、允许的并行数量和多个检查作业之间的依赖关系,将所述多个检查作业分为多个作业组,每个作业组包括一个或多个检查作业,使得并行执行所述多个作业组的检查的总耗费时长满足特定条件;并行执行所述多个作业组中的检查作业,检查资源的健康状况,得到检查结果;以及输出所述检查结果。2.根据权利要求1所述的方法,其中,作业组时长相近的作业组被分配到并行任务中来处理,其中,作业组时长是执行作业组中的全部检查作业所需要的时长。3.根据权利要求2所述的方法,其中,所述特定条件包括:所述多个作业组中的两个作业组的作业组时长的差值在第一范围内;并且/或者所述多个作业组中的两个作业组的作业组时长的比值在第二范围内。4.根据权利要求1所述的方法,其中,所述特定条件包括:并行执行所述多个作业组中的检查作业所耗费的总时长达到最小。5.根据权利要求1所述的方法,其中,所述获得所述检查作业集合中的各个检查作业的预计执行时长包括:获得历史记录;基于所述历史记录,确定所述检查作业集合中的各个检查作业的预计执行时长,所述方法还包括在一个检查作业执行完成之后,将该检查作业的实际执行时长写入所述历史记录。6.根据权利要求1所述的方法,其中,所述读取与所述检查指令对应的检查作业集合包括:基于所述检查指令,确定多个检查操作;确定所述检查操作的...

【专利技术属性】
技术研发人员:陆明王友焱李家辉
申请(专利权)人:联想北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1