分布式节点服务状态监测的方法、装置及系统制造方法及图纸

技术编号:12914096 阅读:66 留言:0更新日期:2016-02-24 19:18
本发明专利技术公开了一种分布式节点服务状态监测的方法,包括:接收计算节点按照预定时间间隔发送服务状态信息;根据所述服务状态信息,更新数据库中所述计算节点的所述服务状态信息的更新时间;将所述更新时间与当前系统时间作差,得到差值;若所述差值不大于所述阈值,则所述计算节点为正常计算节点;若所述差值大于所述阈值,则所述计算节点为故障计算节点;该方法能够可以快速定位出现问题的计算节点,从而快速的解决问题;本发明专利技术还公开了一种分布式节点服务状态监测的装置及系统。

【技术实现步骤摘要】

本专利技术涉及计算机领域,特别涉及一种分布式节点服务状态监测的方法、装置及系统
技术介绍
在云计算环境下,物理服务器的管理调度是至关重要的,但是云计算的规模一般都比较较大,当出现某些故障时,一台台节点的排查是非常耗费精力的,而且效率低下。如何快速对分布式节点服务状态进行有效的监测,是本领域技术人员需要解决的技术问题。
技术实现思路
本专利技术的目的是提供一种分布式节点服务状态监测的方法、装置及系统,可以快速定位出现问题的计算节点,从而快速的解决问题,保证计算节点的准确调度。为解决上述技术问题,本专利技术提供一种分布式节点服务状态监测的方法,包括:接收计算节点按照预定时间间隔发送服务状态信息;根据所述服务状态信息,更新数据库中所述计算节点的所述服务状态信息的更新时间;将所述更新时间与当前系统时间作差,得到差值;若所述差值不大于所述阈值,则所述计算节点为正常计算节点;若所述差值大于所述阈值,则所述计算节点为故障计算节点。其中,还包括:所述系统中的所有节点都通过NTP服务器进行时间同步。其中,将所述更新时间与当前系统时间作差,得到差值包括:遍历每个所述计算节点,依次计算每个所述计算节点更新时间与当前系统时间作差,得到差值。其中,若所述差值大于所述阈值,则所述计算节点为故障计算节点还包括:则设定所述计算节点的服务为不可用,并将所述计算节点的服务状态信息更新到所述数据库中。其中,还包括:若更新数据库中所述计算节点的所述服务状态信息的更新时间,则将所述数据库中所述计算节点中前一次的更新时间删除。本专利技术提供一种分布式节点服务状态监测的装置,包括:接收模块,用于接收计算节点按照预定时间间隔发送服务状态信息;更新模块,用于根据所述服务状态信息,更新数据库中所述计算节点的所述服务状态信息的更新时间;计算模块,用于将所述更新时间与当前系统时间作差,得到差值;判断模块,用于若所述差值不大于所述阈值,则判定所述计算节点为正常计算节点;若所述差值大于所述阈值,则判定所述计算节点为故障计算节点。其中,还包括:同步模块,用于所述装置与NTP服务器进行时间同步。其中,所述计算模块包括:遍历每个所述计算节点,依次计算每个所述计算节点更新时间与当前系统时间作差,得到差值。其中,还包括:警告模块,用于则设定所述计算节点的服务为不可用,并将所述计算节点的服务状态信息更新到所述数据库中。本专利技术提供一种分布式节点服务状态监测的系统,包括:如上述任一项所述的装置;NTP服务器,用于将系统中所有的节点进行时间同步;计算节点,用于按照预定时间间隔向所述装置发送服务状态信息。本专利技术所提供的分布式节点服务状态监测的方法及装置,包括:接收计算节点按照预定时间间隔发送服务状态信息;根据所述服务状态信息,更新数据库中所述计算节点的所述服务状态信息的更新时间;将所述更新时间与当前系统时间作差,得到差值;若所述差值不大于所述阈值,则所述计算节点为正常计算节点;若所述差值大于所述阈值,则所述计算节点为故障计算节点;该方法通过接收的计算节点的服务状态信息中的更新时间,与系统时间进行比较得到差值,并利用该差值与设定的阈值进行比较,并根据比较结果判定该计算节点是否异常;因此,该方法能够可以简单、快速定位出现问题的计算节点,从而快速的解决问题;保证计算节点的准确调度。【附图说明】为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本专利技术实施例所提供的分布式节点服务状态监测的方法的流程图;图2为本专利技术实施例所提供的分布式节点服务状态监测的装置的结构框图;图3为本专利技术实施例所提供的分布式节点服务状态监测的系统的结构框图。【具体实施方式】本专利技术的核心是提供一种分布式节点服务状态监测的方法、装置及系统,可以快速定位出现问题的计算节点,从而快速的解决问题,保证计算节点的准确调度。为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参考图1,图1为本专利技术实施例所提供的分布式节点服务状态监测的方法的流程图;该方法可以包括:slOO、接收计算节点按照预定时间间隔发送服务状态信息;其中,计算节点按照事先定义好的预定时间间隔即时间周期,循环发送其服务状态信息。计算节点的个数与系统的规模相对应,可以包括系统中全部的计算节点。即系统中所有的计算节点都要周期性循环往复的报告自身的服务状态,这个周期性可根据需要设置,但是设置的原则是一定要小于设定的允许的服务停止时间,假设服务停止时间是60S,那计算节点每隔70S才发送状态信息,那一定会被认定为服务不正常状态的,即设置的时间间隔必须小于60S。sllO、根据所述服务状态信息,更新数据库中所述计算节点的所述服务状态信息的更新时间;其中,根据接收的计算节点发来的服务状态信息,将该服务状态信息中的系统时间更新到数据库中作为该计算节点的所述服务状态信息的更新时间。sl20、将所述更新时间与当前系统时间作差,得到差值;其中,由于各个系统中的计算节点的个数不同,这里将更新时间与当前系统时间作差可以是通过遍历的方法进行,也可以是并行处理各个计算节点的更新时间,也可以是每当接收到一个计算节点发送的更新时间,就进行作差计算;可选的,将所述更新时间与当前系统时间作差,得到差值可以包括:遍历每个所述计算节点,依次计算每个所述计算节点更新时间与当前系统时间作差,得到差值。sl30、若所述差值不大于所述阈值,则所述计算节点为正常计算节点;sl40、若所述差值大于所述阈值,则所述计算节点为故障计算节点。其中,根据计算节点定时发送服务状态信息并更新其服务状态,当该计算节点最后一次更新时间与当前管理节点系统时间差大于规定的阈值时,即认为该计算节点出现故障,不能接受云计算平台的调度。即检验计算节点最后一次更新时间与当前的系统时间差是否大于系统定义的服务停止时间即阈值,如果是大于阈值,意味着某计算节点距离最近一次发送更新服务状态信息,已经很长时间没发送服务状态信息了,即认为该计算节点服务出现故障,在调度资源时避免调度该计算节点。例如,当阈值为60S,当计算节点的更新时间与系统时间差值是70S,即该计算节点隔了 70S发送的服务状态信息,则该计算节点为故障节点,在调度资源时避免调度该计算节点。基于上述技术方案,本专利技术实施例提供的分布式节点服务状态监测的方法,通过接收的计算节点的服务状态信息中的更新时间,与系统时间进行比较得到差值,并利用该差值与设定的阈值进行比较,并根据比较结果判定该计算节点是否异常;因此,该方法能够可以简单、快速定位出现问题的计算节点,从而快速的解决问题;保证计算节点的准确调度。基于上述技术方案,该方法还可以包括:所述系统中的所有节点都通过NTP服务器进行时间同步。其中,当在分布式部署的环境架构下,一台NT本文档来自技高网...

【技术保护点】
一种分布式节点服务状态监测的方法,其特征在于,包括:接收计算节点按照预定时间间隔发送服务状态信息;根据所述服务状态信息,更新数据库中所述计算节点的所述服务状态信息的更新时间;将所述更新时间与当前系统时间作差,得到差值;若所述差值不大于所述阈值,则所述计算节点为正常计算节点;若所述差值大于所述阈值,则所述计算节点为故障计算节点。

【技术特征摘要】

【专利技术属性】
技术研发人员:胡玉鹏李新虎刘俊朋于辉郭锋
申请(专利权)人:浪潮北京电子信息产业有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1