服务器的状态监控方法及装置制造方法及图纸

技术编号:38197691 阅读:9 留言:0更新日期:2023-07-21 16:35
本申请实施例提供了一种服务器的状态监控方法及装置,服务器包括多个组件类,一个组件类包括相同类别的多个组件,该方法包括:配置步骤,配置一个传感器对应监控服务器的一类组件;获取步骤,获取服务器中目标组件的当前状态信息,当前状态信息包括当前运行数据以及标识信息;第一确定步骤,确定当前状态信息是否存在异常;第二确定步骤,在当前状态信息存在异常的情况下,确定异常信息并至少根据异常信息以及标识信息生成日志信息。通过本申请,解决了BMC的传感器数据较多,造成状态监控代码复杂、可维护性差的问题。可维护性差的问题。可维护性差的问题。

【技术实现步骤摘要】
服务器的状态监控方法及装置


[0001]本申请实施例涉及服务器领域,具体而言,涉及一种服务器的状态监控方法、装置、计算机可读存储介质、处理器、BMC以及服务器平台。

技术介绍

[0002]随着服务器行业的发展壮大,各种复杂形态的服务器应运而生。服务器作为网络系统和计算平台的核心,许多重要的数据都保存在服务器上。BMC(Baseboard Management Controller,基板管理控制器)作为服务器的管家,利用传感器来监视计算机、网络服务器,或者是其他硬件驱动设备的状态。然而随着服务器使用场景的复杂性,需要的传感器数量往往很繁多,对后台监控代码研发人员来说,大量的传感器会造成状态监控代码比较复杂,代码可维护性较差。

技术实现思路

[0003]本申请实施例提供了一种服务器的状态监控方法、装置、计算机可读存储介质、处理器、BMC以及服务器平台,以至少解决相关技术中BMC的传感器数据较多,造成状态监控代码复杂、可维护性差的问题。
[0004]根据本申请的一个实施例,提供了一种服务器的状态监控方法,所述服务器包括多个组件类,一个所述组件类包括相同类别的多个组件,所述方法包括:配置步骤,配置一个传感器对应监控所述服务器的一类所述组件;获取步骤,获取服务器中目标组件的当前状态信息,所述当前状态信息包括当前运行数据以及标识信息;第一确定步骤,确定所述当前状态信息是否存在异常;第二确定步骤,在所述当前状态信息存在异常的情况下,确定异常信息并至少根据所述异常信息以及所述标识信息生成日志信息。
[0005]在一个示例性实施例中,确定所述当前状态信息是否存在异常,包括:根据所述标识信息,确定所述目标组件的历史运行数据;根据所述当前运行数据以及所述历史运行数据,确定所述当前状态信息是否存在异常,在所述当前运行数据与所述历史运行数据不同的情况下,确定所述当前状态信息存在异常。
[0006]在一个示例性实施例中,确定异常信息,包括:比较所述当前运行数据以及所述历史运行数据,确定所述当前运行数据中,与所述历史运行数据不同的数据为所述异常信息。
[0007]在一个示例性实施例中,根据所述标识信息,确定所述目标组件的历史运行数据,包括:根据所述标识信息,从BMC的存储空间中调用所述标识信息对应的多个历史状态信息,所述历史状态信息包括历史数据以及历史时刻,所述历史数据表征所述服务器历史的运行数据,所述历史时刻为所述历史数据生成的时刻;确定目标历史时刻对应的所述历史数据为所述历史运行数据,所述目标历史时刻为与当前时刻的时间间隔最短的所述历史时刻,所述当前时刻为所述当前运行数据生成的时刻。
[0008]在一个示例性实施例中,根据所述标识信息,确定所述目标组件的历史运行数据,包括:根据所述标识信息,从BMC的存储空间中调用所述标识信息对应的多个历史数据,所
述历史数据表征所述服务器历史的运行数据,多个所述历史数据构成所述历史运行数据。
[0009]在一个示例性实施例中,根据所述当前运行数据以及所述历史运行数据,确定所述当前状态信息是否存在异常,包括:从所述当前运行数据中提取运行参数以及第一数据,所述第一数据为所述运行参数的当前参数值;从所述历史运行数据中提取运行参数以及第二数据,所述第二数据为所述运行参数对应的历史参数值;比较相同的所述运行参数对应的所述第一数据和所述第二数据是否相同;在相同的所述运行参数对应的所述第一数据和所述第二数据不相同的情况下,确定所述当前状态信息存在异常。
[0010]在一个示例性实施例中,获取服务器中目标组件的当前状态信息,包括:接收告警设备发送的目标组件数据,所述目标组件数据为所述告警设备在检测到目标背板的数据更新时,获取的所述目标背板的数据,所述目标组件安装在所述目标背板上;每隔预定时长解析所述目标组件数据,得到所述当前运行数据、所述标识信息以及当前时刻,所述当前时刻为所述当前运行数据生成的时刻,所述当前运行数据、所述标识信息以及当前时刻构成所述当前状态信息。
[0011]在一个示例性实施例中,至少根据所述异常信息以及所述标识信息生成日志信息,包括:根据所述当前时刻,生成时间戳信息;根据所述异常信息、所述标识信息以及所述时间戳信息,生成所述日志信息;至少上报所述日志信息。
[0012]在一个示例性实施例中,在根据所述异常信息、所述标识信息以及所述时间戳信息,生成所述日志信息之后,在至少上报所述日志信息之前,所述方法还包括:从所述日志信息中提取所述目标组件的关键指标数据;获取所述关键指标数据对应的预设阈值范围;根据所述关键指标数据以及所述预设阈值范围,确定所述目标组件是否出现故障,在所述关键指标数据未位于所述预设阈值范围内的情况下,确定所述目标组件出现故障;在所述目标组件出现故障的情况下,根据故障的所述关键指标数据,生成故障警报信息。
[0013]在一个示例性实施例中,至少上报所述日志信息,包括:上报所述日志信息以及所述故障警报信息。
[0014]在一个示例性实施例中,所述告警设备包括复杂可编程逻辑器件。
[0015]在一个示例性实施例中,获取服务器中目标组件的当前状态信息,包括:接收告警设备发送的目标组件数据,所述目标组件数据为所述告警设备实时检测的同类型的所述组件的运行数据;每隔预定时长解析所述目标组件数据,得到所述当前运行数据以及所述标识信息。
[0016]在一个示例性实施例中,所述标识信息包括表征各所述组件的排列顺序的组件序号。
[0017]在一个示例性实施例中,所述目标组件包括硬盘、风扇以及开关电源中至少之一。
[0018]在一个示例性实施例中,所述方法还包括:在所述服务器未掉电的情况下,循环执行所述配置步骤,配置一个传感器对应监控所述服务器的一类所述组件;获取步骤、所述第一确定步骤以及所述第二确定步骤至少一次,直到所述服务器掉电。
[0019]根据本申请的另一个实施例,提供了一种服务器的状态监控装置,所述服务器包括多个组件类,一个所述组件类包括相同类别的多个组件,所述装置包括:配置单元,用于配置步骤,配置一个传感器对应监控所述服务器的一类所述组件;第一获取单元,用于获取步骤,获取服务器中目标组件的当前状态信息,所述当前状态信息包括当前运行数据以及
标识信息;第一确定单元,用于第一确定步骤,确定所述当前状态信息是否存在异常;第二确定单元,用于第二确定步骤,在所述当前状态信息存在异常的情况下,确定异常信息并至少根据所述异常信息以及所述标识信息生成日志信息。
[0020]根据本申请的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
[0021]根据本申请的又一个实施例,还提供了一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一项方法实施例中的步骤。
[0022]根据本申请的又一个本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种服务器的状态监控方法,所述服务器包括多个组件类,一个所述组件类包括相同类别的多个组件,其特征在于,所述方法包括:配置步骤,配置一个传感器对应监控所述服务器的一类所述组件;获取步骤,获取服务器中目标组件的当前状态信息,所述当前状态信息包括当前运行数据以及标识信息;第一确定步骤,确定所述当前状态信息是否存在异常;第二确定步骤,在所述当前状态信息存在异常的情况下,确定异常信息并至少根据所述异常信息以及所述标识信息生成日志信息。2.根据权利要求1所述的方法,其特征在于,确定所述当前状态信息是否存在异常,包括:根据所述标识信息,确定所述目标组件的历史运行数据;根据所述当前运行数据以及所述历史运行数据,确定所述当前状态信息是否存在异常,在所述当前运行数据与所述历史运行数据不同的情况下,确定所述当前状态信息存在异常。3.根据权利要求2所述的方法,其特征在于,确定异常信息,包括:比较所述当前运行数据以及所述历史运行数据,确定所述当前运行数据中,与所述历史运行数据不同的数据为所述异常信息。4.根据权利要求2所述的方法,其特征在于,根据所述标识信息,确定所述目标组件的历史运行数据,包括:根据所述标识信息,从BMC的存储空间中调用所述标识信息对应的多个历史状态信息,所述历史状态信息包括历史数据以及历史时刻,所述历史数据表征所述服务器历史的运行数据,所述历史时刻为所述历史数据生成的时刻;确定目标历史时刻对应的所述历史数据为所述历史运行数据,所述目标历史时刻为与当前时刻的时间间隔最短的所述历史时刻,所述当前时刻为所述当前运行数据生成的时刻。5.根据权利要求2所述的方法,其特征在于,根据所述标识信息,确定所述目标组件的历史运行数据,包括:根据所述标识信息,从BMC的存储空间中调用所述标识信息对应的多个历史数据,所述历史数据表征所述服务器历史的运行数据,多个所述历史数据构成所述历史运行数据。6.根据权利要求2所述的方法,其特征在于,根据所述当前运行数据以及所述历史运行数据,确定所述当前状态信息是否存在异常,包括:从所述当前运行数据中提取运行参数以及第一数据,所述第一数据为所述运行参数的当前参数值;从所述历史运行数据中提取运行参数以及第二数据,所述第二数据为所述运行参数对应的历史参数值;比较相同的所述运行参数对应的所述第一数据和所述第二数据是否相同;在相同的所述运行参数对应的所述第一数据和所述第二数据不相同的情况下,确定所述当前状态信息存在异常。7.根据权利要求1至6中任一项所述的方法,其特征在于,获取服务器中目标组件的当
前状态信息,包括:接收告警设备发送的目标组件数据,所述目标组件数据为所述告警设备在检测到目标背板的数据更新时,获取的所述目标背板的数据,所述目标组件安装在所述目标背板上;每隔预定时长解析所述目标组件数据,得到所述当前运行数据、所述标识信息以及当前时刻,所述当前时刻为所述当前运行数据生成的时刻,所述当前运行数据、所述标识信息以及当前时刻构成所述当前状态信息。8.根据权利要求7所述的方法,其特征在于,至少根据所述异常信息以及所述标识信息生成日志信息,包括:根据所述当前时刻,生...

【专利技术属性】
技术研发人员:张晓庆
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1