故障监控方法、装置、设备、存储介质和程序产品制造方法及图纸

技术编号:42340276 阅读:25 留言:0更新日期:2024-08-14 16:17
本申请涉及一种故障监控方法、装置、设备、存储介质和程序产品。所述方法包括:通过获取计算机设备中目标硬件的运行信息,其中,运行信息包括各个监控指标对应的运行数据,根据各运行数据,可以获取目标硬件对应的初始故障监控结果,并对初始故障监控结果进行准确性验证,得到验证结果,根据验证结果和初始故障监控结果,可以确定目标硬件对应的目标故障监控结果。采用本方法能够提高故障监控的准确性。

【技术实现步骤摘要】

本申请涉及计算机,特别是涉及一种故障监控方法、装置、设备、存储介质和程序产品


技术介绍

1、在机器学习技术的普及、大数据以及云计算的盛行、区块链技术的广泛应用等背景下,gpu(graphics processing unit,图形处理器)的需求越来越多,gpu的故障带来的问题也越来越多,因此,需要对gpu进行故障监控。

2、传统的故障监控方法,通常是实时监控gpu是否正常运行,当gpu运行出现异常时则会通知gpu故障。

3、但是,传统的故障监控的方法存在故障监控准确性低的问题。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种能够提高故障监控准确性的故障监控方法、装置、设备、存储介质和程序产品。

2、第一方面,本申请提供了一种故障监控方法,包括:

3、获取计算机设备中目标硬件的运行信息,运行信息包括各个监控指标对应的运行数据;

4、根据各运行数据,获取目标硬件对应的初始故障监控结果,并对初始故障监控结果进行准确性验证,得到验证结果;...

【技术保护点】

1.一种故障监控方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述获取目标硬件的运行信息,包括:

3.根据权利要求2所述的方法,其特征在于,所述按照带内管理的方式获取所述运行信息,得到获取结果,包括:

4.根据权利要求1所述的方法,其特征在于,所述对所述初始故障监控结果进行准确性验证,得到验证结果,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述压力测试结果,对所述初始故障监控结果进行准确性验证,得到所述验证结果,包括:

6.根据权利要求5所述的方法,其特征在于,所述初始故障监控结果中...

【技术特征摘要】

1.一种故障监控方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述获取目标硬件的运行信息,包括:

3.根据权利要求2所述的方法,其特征在于,所述按照带内管理的方式获取所述运行信息,得到获取结果,包括:

4.根据权利要求1所述的方法,其特征在于,所述对所述初始故障监控结果进行准确性验证,得到验证结果,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述压力测试结果,对所述初始故障监控结果进行准确性验证,得到所述验证结果,包括:

6.根据权利要求5所述的方法,其特征在于,所述初始故障监控结果中包括至少一个异常监控指标对应...

【专利技术属性】
技术研发人员:孙建旭秦晓宁陈颖
申请(专利权)人:宁畅信息技术杭州有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1