The application provides a state checking method, device and cluster system, in which the state checking method includes: creating a state checking thread after the main thread is started; and feedback of the message for state detection is provided by the state checking thread when the node executing the main thread receives the message for state detection. At least one embodiment of the present application can avoid the impact of the usability detection results on the business conditions.
【技术实现步骤摘要】
一种状态检查方法、装置及集群系统
本专利技术涉及计算机领域,尤其涉及一种状态检查方法、装置及集群系统。
技术介绍
计算机系统的可用性是通过系统的可靠性和可维护性来度量的。工程上通常用平均无故障时间来度量系统的可靠性,用平均维修时间来度量系统的可维护性。服务的高可用性目前通常是采用搭建高可用性(HighAvailablity,HA)集群的方式实现的。HA可以指程序、或服务、或系统无中断地执行其功能的能力。一个高可用集群(亦称HA集群)包含多个服务节点,一部分服务节点处于业务的激活状态(可以称之为主节点),一部分服务节点处于业务的备用状态(可以称之为备节点)。当主节点出现故障时,系统激活备节点自动接替主节点提供服务,并将原来的主节点降级成备节点或者重新搭建一个备节点。其中,对主节点的可用性探测是关键步骤之一。对主节点的可用性探测也可称为健康检查,即判断主节点的健康状态,比如判断主节点的程序、或服务、或系统当前是否处于故障状态,或是否处于正常工作状态。误判或者未及时判断出主节点的健康状态,都将大大降低服务的可用性。Redis是一个开源的高性能的Key-Value缓存数据库系统,包括多个服务节点;Redis集群中的服务节点当时收到心跳包时回复指定信息,比如收到“ping”命令时回复“pong”,收到info命令时会回复服务器配置参数和统计数据,比如服务器版本,操作系统,启动时间长度等。利用服务节点的上述特性,Redis集群中的运维系统可以进行Redis可用性探测,一般包括以下技术方案:心跳探测:通过定期向服务节点发送心跳包的方式探测服务节点的健康状态。如果多个心跳 ...
【技术保护点】
1.一种状态检查方法,包括:主线程启动后,创建状态检查线程;当执行所述主线程的节点收到用于进行状态探测的消息后,所述状态检查线程对所述用于进行状态探测的消息进行反馈。
【技术特征摘要】
1.一种状态检查方法,包括:主线程启动后,创建状态检查线程;当执行所述主线程的节点收到用于进行状态探测的消息后,所述状态检查线程对所述用于进行状态探测的消息进行反馈。2.如权利要求1所述的状态检查方法,其特征在于:执行所述主线程的节点为集群的主节点。3.如权利要求1所述的状态检查方法,其特征在于,所述创建状态检查线程后还包括:所述状态检查线程侦听执行所述主线程的节点的状态检查端口;其中,所述状态检查端口用于接收所述用于进行状态探测的消息。4.如权利要求1所述的状态检查方法,其特征在于,所述状态检查线程对所述用于进行状态探测的消息进行反馈包括:所述状态检查线程获取所述节点的状态信息;采用所获取的状态信息对所述用于进行状态探测的消息进行反馈。5.如权利要求1所述的状态检查方法,其特征在于,所述创建状态检查线程后还包括:所述状态检查线程周期性对所述节点的状态进行检查,根据检查结果生成所述节点的状态信息。6.如权利要求5所述的状态检查方法,其特征在于,所述状态检查线程周期性对所述节点的状态进行检查包括:所述状态检查线程进行以下一项或多项操作:每隔第一时间长度对所述节点进行一次磁盘读写;每隔第二时间长度查看所述节点的目录文件权限,大小,完整性是否正常;每隔第三时间长度查看所述节点中预定的辅助进程是否存在。7.如权利要求5所述的状态检查方法,其特征在于,所述状态检查线程所创建的事件包括:端口事件和定时器事件;所述端口事件设置成在所述...
【专利技术属性】
技术研发人员:鲁振华,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。