System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 服务器运行状态的监控方法及装置制造方法及图纸_技高网

服务器运行状态的监控方法及装置制造方法及图纸

技术编号:40191347 阅读:6 留言:0更新日期:2024-01-26 23:53
本申请实施例提供了一种服务器运行状态的监控方法及装置,其中,该方法包括:在目标监控周期的起始时刻,获取目标服务器集群中的第一服务器在参考监控周期的服务器信息;根据服务器信息从目标服务器集群中筛选出多个目标服务器;在目标监控周期内,控制每个目标服务器对参考服务器的运行状态进行监控,得到目标监控结果,其中,参考服务器为目标服务器集群中除目标服务器以外的服务器;根据目标监控结果确定参考服务器在目标监控周期内的目标运行状态。通过本申请,可以解决相关技术中对服务器运行状态进行监控的监控效率较低的问题,达到提高对服务器运行状态进行监控的监控效率的效果。

【技术实现步骤摘要】

本申请实施例涉及计算机领域,具体而言,涉及一种服务器运行状态的监控方法及装置


技术介绍

1、在现代企业中,服务器集群已成为支持核心业务和提供高可用性的关键基础设施。随着企业规模的不断扩大和业务需求的增长,服务器集群的需求也越来越重要。服务器集群中存在许多相互连接的服务器,从而使用该服务器集群为企业的也提供支持。由于服务器集群中存在大量服务器,在服务器的运行过程中,难免会发生意外导致服务器故障。如何及时发现服务器的运行故障从而避免对业务的影响是当前领域内技术人员急需解决的问题。相关技术中,通过为服务器集群设置专属监控服务器,该监控服务器与服务器集群中的各个服务器连接,从而对服务器进行监控,这种方式虽然能够实现对服务器集群运行状态的监控,但是却存在诸多问题,一方面需要额外增加专属监控服务器,增加设备消耗,另一方面,如果专属监控服务器故障,此时监测出的结果也将不会准确,从而造成对服务器集群运行状态的误判。


技术实现思路

1、本申请实施例提供了一种服务器运行状态的监控方法及装置,以至少解决相关技术中对服务器运行状态进行监控的监控效率较低的问题。

2、根据本申请的一个实施例,提供了一种服务器运行状态的监控方法,包括:在目标监控周期的起始时刻,获取目标服务器集群中的第一服务器在参考监控周期的服务器信息,其中,所述服务器信息用于表征所述第一服务器在所述参考监控周期对其他服务器的运行状态进行监控的监控情况,所述其他服务器为所述目标服务器集群所包括的除所述第一服务器之外的服务器,所述参考监控周期在所述目标监控周期之前;

3、根据所述服务器信息从所述目标服务器集群中筛选出多个目标服务器;

4、在所述目标监控周期内,控制每个所述目标服务器对参考服务器的运行状态进行监控,得到目标监控结果,其中,所述参考服务器为所述目标服务器集群中除所述目标服务器以外的服务器;

5、根据所述目标监控结果确定所述参考服务器在所述目标监控周期内的目标运行状态。

6、可选的,所述根据所述服务器信息从所述目标服务器集群中筛选出多个目标服务器,包括:

7、根据目标监控次数确定每个所述第一服务器的服务器参数,其中,所述目标监控次数为所述第一服务器在所述参考监控周期被配置为监控所述其他服务器运行状态的服务器的次数,所述服务器信息包括所述目标监控次数,所述目标监控次数和所述第一服务器参数具有负相关关系;

8、根据所述服务器参数从所述目标服务器集群中筛选出所述多个目标服务器。

9、可选的,所述根据目标监控次数确定每个所述第一服务器的服务器参数,包括:

10、获取所述目标监控次数对应的目标权重值,其中,所述目标监控次数和所述目标权重值之间具有负相关关系;

11、计算所述目标权重值和所述目标监控次数的乘积,得到所述服务器参数。

12、可选的,所述根据所述服务器参数从所述目标服务器集群中筛选出所述多个目标服务器,包括:

13、获取每个所述第一服务器在所述参考监控周期内的参考运行状态;

14、从所述目标服务器中筛选出所述参考运行状态为正常状态的第二服务器;

15、从所述第二服务器中筛选出目标数量个所述服务器参数大于或者等于目标分值的所述目标服务器,其中,所述目标数量为大于或者等于3的奇数。

16、可选的,所述在所述目标监控周期控制每个所述目标服务器对参考服务器的运行状态进行监控,得到目标监控结果,包括:

17、控制所述目标服务器对所述参考服务器执行握手操作;

18、在所述握手操作执行失败的情况下,按照目标时间间隔重复执行所述握手操作;

19、在所述握手操作重复执行次数大于或者等于目标次数的情况下,确定所述参考服务器处于故障状态。

20、可选的,所述根据所述目标监控结果确定所述参考服务器在所述目标监控周期内的目标运行状态,包括:

21、确定所述目标监控结果中指示所述参考服务器处于故障状态的监控结果的目标数量;

22、在所述目标数量大于或者等于目标阈值的情况下,确定所述目标运行状态为故障状态。

23、可选的,在所述根据所述目标监控结果确定所述参考服务器在所述目标监控周期内的目标运行状态之后,所述方法还包括:

24、在所述目标运行状态为故障状态的情况下,确定所述参考服务器中处于故障状态的故障位置;

25、在所述故障位置为所述参考服务器的服务器操作系统的情况下,对所述服务器操作系统执行掉电处理,其中,所述服务器操作系统用于控制所述参考服务器的运行状态;

26、在完成对所述服务器操作系统的掉电处理的情况下,监控所述服务器操作系统的第一运行状态;

27、在所述第一运行状态用于指示所述服务器操作系统处于故障状态的情况下,通过带外访问的方式获取基板管理控制器系统上存储的第一日志,其中,所述基板管理控制器系统用于监测所述服务器操作系统的运行状态,所述第一日志为用于记录所述服务器操作系统运行状态的日志;

28、将所述第一日志中记录的用于表征所述服务器操作系统故障原因的第一字段发送至目标账号,其中,所述目标账号为用于对所述参考服务器的运行状态进行维护的账号。

29、可选的,在所述确定所述参考服务器中处于故障状态的故障位置之后,所述方法还包括:

30、在所述故障位置为所述参考服务器的基板管理控制器系统的情况下,对所述基板管理控制器系统执行掉电处理,其中,所述基板管理控制器系统用于监测所述参考服务器的服务器操作系统的运行状态,所述服务器操作系统用于控制所述参考服务器的运行状态;

31、在完成对所述服务器操作系统的掉电处理的情况下,监控所述基板管理控制器系统的第二运行状态;

32、在所述第二运行状态用于指示所述基板管理控制器系统处于故障状态的情况下,通过控制所述服务器操作系统通过带内访问的方式获取所述基板管理控制器系统上存储的第二日志,其中,所述基板管理控制器系统用于监测所述服务器操作系统的运行状态,所述第二日志为用于记录所述基板管理控制器系统运行状态的日志;

33、将所述第二日志中记录的用于表征所述基板管理控制器系统故障原因的第二字段发送至目标账号,其中,所述目标账号为用于对所述参考服务器的运行状态进行维护的账号。

34、根据本申请的另一个实施例,提供了一种服务器运行状态的监控装置,包括:第一获取模块,用于在目标监控周期的起始时刻,获取目标服务器集群中的第一服务器在参考监控周期的服务器信息,其中,所述服务器信息用于表征所述第一服务器在所述参考监控周期对其他服务器的运行状态进行监控的监控情况,其中,所述其他服务器为所述目标服务器集群所包括的除所述第一服务器之外的服务器,所述参考监控周期在所述目标监控周期之前;

35、筛选模块,用于根据所述服务器信息从所述目标服务器集群中筛选出多个目标服务器;

<本文档来自技高网...

【技术保护点】

1.一种服务器运行状态的监控方法,其特征在于,

2.根据权利要求1所述的方法,其特征在于,

3.根据权利要求2所述的方法,其特征在于,

4.根据权利要求2所述的方法,其特征在于,

5.根据权利要求1所述的方法,其特征在于,

6.根据权利要求1所述的方法,其特征在于,

7.根据权利要求1所述的方法,其特征在于,

8.根据权利要求7所述的方法,其特征在于,

9.一种服务器运行状态的监控装置,其特征在于,

10.一种计算机可读存储介质,其特征在于,

11.一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,

【技术特征摘要】

1.一种服务器运行状态的监控方法,其特征在于,

2.根据权利要求1所述的方法,其特征在于,

3.根据权利要求2所述的方法,其特征在于,

4.根据权利要求2所述的方法,其特征在于,

5.根据权利要求1所述的方法,其特征在于,

6.根据权利要求1所述的方法,其特征在于,

【专利技术属性】
技术研发人员:张格非
申请(专利权)人:苏州元脑智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1