系统故障检测方法技术方案

技术编号:41526320 阅读:21 留言:0更新日期:2024-06-03 23:00
本说明书实施例提供系统故障检测方法,其中所述系统故障检测方法包括:检测项目系统中至少一项目标资源的资源占用信息;在至少一项资源占用信息存在异常的情况下,基于异常的资源占用信息生成资源占用异常日志;基于所述资源占用异常日志,确定项目系统的系统故障检测结果。通过检测各个目标资源的资源占用信息,并基于异常的资源占用信息生成资源占用异常日志,可以记录系统运行的过程中资源占用异常的信息,由于造成系统运行的过程中资源占用异常的进程并不一定会发生阻塞,所以基于上述包括系统运行的过程中资源占用异常的信息的日志确定系统故障检测结果可以在系统发生故障时可以考虑到未被阻塞的进程,进而提高了系统故障检测结果的准确性。

【技术实现步骤摘要】

本说明书实施例涉及计算机,特别涉及一种系统故障检测方法、一种应用于云侧设备的系统故障检测方法、一种计算设备、一种计算机可读存储介质及一种计算机程序产品。


技术介绍

1、随着计算机操作系统在大规模线上生产环境中的广泛应用,宕机行为变得比较常见,宕机行为可能由锁机制、i/o(input/output,输入/输出)操作或内存管理等多种原因触发。

2、当前,虽然计算机操作系统提供了一定程度上的问题诊断能力,在宕机行为出现时,内核会自动收集所有cpu(central processing unit,中央处理器)的调用栈信息,使得开发者和运维人员能够借助这些信息结合代码定位问题所在,但这些方法存在明显的局限性。主要问题在于,这些输出的信息通常只涵盖了被阻塞的进程,而缺少了触发宕机的根本原因的信息。因此,为了解决上述问题,迫切需要一种系统故障检测方法。


技术实现思路

1、有鉴于此,本说明书实施例提供了一种系统故障检测方法。本说明书一个或者多个实施例同时涉及一种应用于云侧设备的系统故障检测方法,一种计算设备,一种本文档来自技高网...

【技术保护点】

1.一种系统故障检测方法,包括:

2.如权利要求1所述的方法,在检测项目系统中至少一项目标资源的资源占用信息之后,所述方法还包括:

3.如权利要求2所述的方法,在所述待处理资源占用信息中确定资源占用第一时间点和资源占用第二时间点,包括:

4.如权利要求2所述的方法,根据所述资源占用第一时间点和所述资源占用第二时间点判断所述待处理资源占用信息是否存在异常,包括:

5.如权利要求1所述的方法,基于异常的资源占用信息生成资源占用异常日志,包括:

6.如权利要求5所述的方法,基于各资源异常进程对应的异常进程资源占用信息,确定各资源异常进...

【技术特征摘要】

1.一种系统故障检测方法,包括:

2.如权利要求1所述的方法,在检测项目系统中至少一项目标资源的资源占用信息之后,所述方法还包括:

3.如权利要求2所述的方法,在所述待处理资源占用信息中确定资源占用第一时间点和资源占用第二时间点,包括:

4.如权利要求2所述的方法,根据所述资源占用第一时间点和所述资源占用第二时间点判断所述待处理资源占用信息是否存在异常,包括:

5.如权利要求1所述的方法,基于异常的资源占用信息生成资源占用异常日志,包括:

6.如权利要求5所述的方法,基于各资源异常进程对应的异常进程资源占用信息,确定各资源异常进程对应的进程调用栈信息,包括:

7.如权利要求6所述的方法,获取各资源占用进程对应的资源占用进程调用栈信息,包括:

8.如权利要求7所述的方法,在所述待处理资源占用进程占用时间信息中确定进程资源占用第一时间点和进程资源占用第二时间点,包括:

9.如权利要求6所述的方法,在从各资源异常进程中确定至少一个资源占用进程之后,所述方法还包括:

10.如权利要求9所述的方法...

【专利技术属性】
技术研发人员:李光水毛文安
申请(专利权)人:阿里云计算有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1