一种基于硬件WDT进行监测的方法、设备及可读介质技术

技术编号:22501873 阅读:16 留言:0更新日期:2019-11-09 02:30
本发明专利技术公开了一种基于硬件WDT进行监测的方法,包括以下步骤:监测程序基于硬件WDT读取所需监测的服务或进程的配置信息;监测程序基于配置信息调用服务或进程;判断监测程序调用服务或进程是否超时;响应于监测程序调用服务或进程超时,重启服务或进程。本发明专利技术还公开了一种计算机设备和可读存储介质。本发明专利技术提出的基于硬件WDT进行监测的方法及装置可以将软件服务或进程的监测与硬件WDT之间建立关联,用硬件WDT的稳定性,来保证软件监测程序的稳定安全运行。

A method, equipment and readable medium for monitoring based on hardware WDT

The invention discloses a method for monitoring based on hardware WDT, which comprises the following steps: the monitoring program reads the configuration information of the service or process to be monitored based on hardware WDT; the monitoring program calls the service or process based on the configuration information; judges whether the monitoring program calls the service or process for timeout; restarts the service or process in response to the monitoring program calls the service or process for timeout. The invention also discloses a computer device and a readable storage medium. The method and device for monitoring based on the hardware WDT proposed by the invention can establish the association between the monitoring of software service or process and the hardware WDT, and ensure the stable and safe operation of the software monitoring program by the stability of the hardware WDT.

【技术实现步骤摘要】
一种基于硬件WDT进行监测的方法、设备及可读介质
本专利技术涉及监测领域,更具体地,特别是指一种基于硬件WDT进行监测的方法、设备及可读介质。
技术介绍
软件服务的监控重启操作,一般通过systemd进行管理。可实现对某项服务dead后,进行重启操作。但是systemd只能对服务dead或者failed之后做出响应,而很多时候,服务的状态是正常的,但是却无法对外提供响应,需要手动干预重启才能解决问题。而这种场景下,systemd无法检测到服务的异常。
技术实现思路
有鉴于此,本专利技术实施例的目的在于提出一种基于硬件WDT进行监测的方法及装置,主要是将软件服务或进程的监测与硬件WDT之间建立关联,用硬件WDT的稳定性,来保证监测程序的稳定安全运行。基于上述目的,本专利技术实施例的一方面提供了一种基于硬件WDT进行监测的方法,包括如下步骤:监测程序基于硬件WDT读取所需监测的服务或进程的配置信息;监测程序基于配置信息调用服务或进程;判断监测程序调用服务或进程是否超时;响应于监测程序调用服务或进程超时,重启服务或进程。在一些实施方式中,还包括:监测程序定时向硬件WDT发送清零信号。在一些实施方式中,进一步包括:判断监测程序发送清零信号是否超时;以及响应于监测程序超时,中断CPU。在一些实施方式中,监测程序基于硬件WDT读取所需监测的服务或进程的配置信息包括:判断监测程序读取所需监测的服务或进程的配置信息是否超时;响应于监测程序读取所需监测的服务或进程的配置信息超时,执行监测程序内置的配置信息。在一些实施方式中,方法还包括:判断重启服务或进程的次数是否大于预定数值;响应于重启服务或进程的次数大于预定数值,重启系统。本专利技术实施例的另一方面,还提供了一种计算机设备,包括:至少一个处理器;以及存储器,存储器存储有可在处理器上运行的计算机指令,指令由处理器执行以实现如下步骤:监测程序基于硬件WDT读取所需监测的服务或进程的配置信息;监测程序基于配置信息调用服务或进程;判断监测程序调用服务或进程是否超时;响应于监测程序调用服务或进程超时,重启服务或进程。在一些实施方式中,步骤还包括:监测程序定时向硬件WDT发送清零信号。在一些实施方式中,步骤还包括:判断监测程序发送清零信号是否超时;以及响应于监测程序超时,中断CPU。在一些实施方式中,监测程序基于硬件WDT读取所需监测的服务或进程的配置信息包括:判断监测程序读取所需监测的服务或进程的配置信息是否超时;响应于监测程序读取所需监测的服务或进程的配置信息超时,执行监测程序内置的配置信息。本专利技术实施例的再一方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有被处理器执行时执行如上方法的计算机程序。本专利技术具有以下有益技术效果:将软件服务或进程的监测与硬件WDT之间建立关联,用硬件WDT的稳定性,来保证软件监测程序的稳定安全运行,同时利用软件的兼容性和可扩充性来对多个重点服务或进程进行监测,间接形成一个硬件WDT对多个软件系统的服务或进程进行监控的场景。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。图1为本专利技术提供的基于硬件WDT进行监测的方法的实施例的示意图;图2为本专利技术提供的基于硬件WDT进行监测的方法的实施例的流程图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本专利技术实施例进一步详细说明。需要说明的是,本专利技术实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本专利技术实施例的限定,后续实施例对此不再一一说明。基于上述目的,本专利技术实施例的第一个方面,提出了一种基于硬件WDT进行监测的方法的实施例。图1示出的是本专利技术提供的基于硬件WDT进行监测的方法的实施例的示意图。如图1所示,本专利技术实施例包括如下步骤:S1、监测程序基于所述硬件WDT读取所需监测的服务或进程的配置信息;S2、所述监测程序基于所述配置信息调用所述服务或进程;S3、判断所述监测程序调用所述服务或进程是否超时;以及S4、响应于所述监测程序调用所述服务或进程超时,重启所述服务或进程。WDT(WatchDogtimer)实际上是一个计数器,而硬件WDT则是指BMC芯片内置的WDT。硬件WDT主要用来实现系统级及IPcore级的状态监控,以及WDT超时后的处理。本实施例中BMC可以是AST2500,但是这并不是对BMC的限制,其他实施例中也可以采用其他型号的BMC。AST2500芯片内包括三个硬件WDT,分别为WDT1、WDT2和WDT3,本实施例中采用WDT3进行说明,但是,采用其他两个WDT也能达到相同的技术效果。在BMC和OS(操作系统)启动阶段,将WDT3启用,并设置超时时间和超时后的操作,例如可以设置超时时间为5分钟,超时后中断CPU。在OS启动后,启动监测程序。监测程序定时向所述硬件WDT发送清零信号。本实施例中可以设置每隔1分钟向硬件WDT发送清零信号。在某些实施例中,进一步包括:判断所述监测程序发送清零信号是否超时;以及响应于所述监测程序超时,中断CPU。例如,本实施例中超时时间为5分钟,每隔1分钟发送一次清零信号,如果两次清零信号之间时长超过6分钟则说明监测程序发送清零信号超时,此时会中断CPU,并重启监测程序。监测程序基于所述硬件WDT读取所需监测的服务或进程的配置信息。配置信息包括是否开启、超时时间以及超时后动作配置等。在某些实施例中,所述监测程序基于所述硬件WDT读取所需监测的服务或进程的配置信息包括:判断所述监测程序读取所需监测的服务或进程的配置信息是否超时;响应于所述监测程序读取所需监测的服务或进程的配置信息超时,执行所述监测程序内置的配置信息。所述监测程序基于所述配置信息调用所述服务或进程。服务包括Web类服务、IPMI服务以及DBUS接口类。判断所述监测程序调用所述服务或进程是否超时;响应于所述监测程序调用所述服务或进程超时,重启所述服务或进程。例如,Web类服务和IPMI服务通过curl、ipmitool等方式调用不能正常响应时,超过所设定的超时时间,则重启该服务。在某些实施例中,方法还包括:判断重启所述服务或进程的次数是否大于预定数值;响应于重启所述服务或进程的次数大于预定数值,重启系统。例如,本实施例中预定数值为3,当DBUS接口等底层服务重启超过了3次就重启系统。图2示出的是本专利技术提供的基于硬件WDT进行监测的方法的实施例的流程图。如图2所示,从框101开始,接着前进到框102,监测程序定时向硬件WDT发送清零信号;接着前进到框103,判断监测程序向硬件WDT发送清零信号是否超时,如果超时,前进到框104,终端CPU、重启监测程序,然后再返回框102,如果不超时,前进到框105,监测程序基于硬件WDT读取所需监测的服务或进程的配置消息;接着前进到框106,判断监测程序读取所需监测的服务或进程的配置消息是否超时,如果超时,本文档来自技高网...

【技术保护点】
1.一种基于硬件WDT进行监测的方法,其特征在于,包括:监测程序基于所述硬件WDT读取所需监测的服务或进程的配置信息;所述监测程序基于所述配置信息调用所述服务或进程;判断所述监测程序调用所述服务或进程是否超时;响应于所述监测程序调用所述服务或进程超时,重启所述服务或进程。

【技术特征摘要】
1.一种基于硬件WDT进行监测的方法,其特征在于,包括:监测程序基于所述硬件WDT读取所需监测的服务或进程的配置信息;所述监测程序基于所述配置信息调用所述服务或进程;判断所述监测程序调用所述服务或进程是否超时;响应于所述监测程序调用所述服务或进程超时,重启所述服务或进程。2.根据权利要求1所述的方法,其特征在于,还包括:监测程序定时向所述硬件WDT发送清零信号。3.根据权利要求2所述的方法,其特征在于,还包括:判断所述监测程序发送清零信号是否超时;以及响应于所述监测程序超时,中断CPU。4.根据权利要求1所述的方法,其特征在于,所述监测程序基于所述硬件WDT读取所需监测的服务或进程的配置信息包括:判断所述监测程序读取所需监测的服务或进程的配置信息是否超时;响应于所述监测程序读取所需监测的服务或进程的配置信息超时,执行所述监测程序内置的配置信息。5.根据权利要求1所述的方法,其特征在于,方法还包括:判断重启所述服务或进程的次数是否大于预定数值;响应于重启所述服务或进程的次数大于预定数值,重启系统。6.一种计算机设备,其特征在于,包括:至少一个处理器;以及...

【专利技术属性】
技术研发人员:朱英澍
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1