一种集群内的节点管理方法及节点设备技术

技术编号:16878429 阅读:85 留言:0更新日期:2017-12-23 15:12
本发明专利技术公开了一种集群内的节点管理方法及节点设备,所述方法包括:第一节点检测到节点间心跳连接异常时,依据第一管理策略确定所述第一节点为所在子群的预备管理节点;基于第二管理策略判断所述第一节点是否可以由预备管理节点转换成管理节点,确定所述第一节点可以由预备管理节点转换成管理节点时,作为管理节点对集群资源进行节点间的重配置及节点间任务调度。

A node management method and node device in a cluster

The invention discloses a method for node management within the cluster and node device, the method comprises: a first node detects abnormal heartbeat connection between nodes, on the basis of determining the first management strategy of the first node for the management node where the second subgroups; management strategy to determine whether the first node can be converted by the reserve management a node management node based on the determination of the first node can be converted by the reserve management node into the management node, as management node and node reconfiguration between nodes of cluster resource scheduling.

【技术实现步骤摘要】
一种集群内的节点管理方法及节点设备
本专利技术涉及通信
,尤其涉及一种集群内的节点管理方法及节点设备。
技术介绍
为了使集群的整体服务尽可能可用,当高可用性集群中的节点发生故障时,集群系统应该迅速做出反应,将该系统的任务分配到集群中其它正在工作的节点上执行,而故障节点的共享资源(比如IP、磁阵)也会被其他节点接管。一般的,高可用性集群中节点间使用心跳(heartbeat)检测节点的情况,然而在心跳失效的时候,可能会发生脑裂(split-brain)问题。脑裂会引起数据的不完整性,并且可能会对服务造成严重影响,一个高可用性集群,不可避免要面对脑裂问题,目前,针对脑裂问题有一些解决方案:1)添加冗余的心跳,然而这只能减少而不能避免脑裂;2)做好对裂脑的监控报警,如邮件以及手机短信等,在问题发生的时候能够人为的介入到仲裁,降低损失,然而这需要人工参与;3)启用磁盘锁,正在服务一方锁住共享磁盘,脑裂发生的时候,让对方完全抢不走共享的磁盘资源,然而如果占用共享磁盘的一方不主动解锁,另一方就永远得不到共享磁盘,如果占用共享磁盘的节点突然死机或者崩溃,另一方不可能执行解锁命令,后备节点也就接本文档来自技高网...
一种集群内的节点管理方法及节点设备

【技术保护点】
一种集群内的节点管理方法,其特征在于,所述方法应用于第一节点,所述方法包括:检测到节点间心跳连接异常时,依据第一管理策略确定所述第一节点为所在子群的预备管理节点;基于第二管理策略判断所述第一节点是否可以由预备管理节点转换成管理节点,确定所述第一节点可以由预备管理节点转换成管理节点时,作为管理节点对集群资源进行节点间的重配置及节点间任务调度。

【技术特征摘要】
1.一种集群内的节点管理方法,其特征在于,所述方法应用于第一节点,所述方法包括:检测到节点间心跳连接异常时,依据第一管理策略确定所述第一节点为所在子群的预备管理节点;基于第二管理策略判断所述第一节点是否可以由预备管理节点转换成管理节点,确定所述第一节点可以由预备管理节点转换成管理节点时,作为管理节点对集群资源进行节点间的重配置及节点间任务调度。2.根据权利要求1所述的方法,其特征在于,所述检测到节点间心跳连接异常之前,所述方法还包括:依据第三管理策略确定第二节点为管理节点,以使所述第二节点进行资源配置及任务调度。3.根据权利要求1或2所述的方法,其特征在于,所述基于第二管理策略判断所述第一节点是否可以由预备管理节点转换成管理节点,包括:基于预设的网络检测方式判断所述第一节点是否存在对外网络连接,判断为是时,确定所述第一节点可以转换成管理节点;判断为否时,确定所述第一节点不能转换成管理节点。4.根据权利要求1或2所述的方法,其特征在于,所述集群内的共享存储设备支持多节点共同访问;所述基于第二管理策略判断所述第一节点是否可以由预备管理节点转换成管理节点,包括:确定所述共享存储设备未被占用时,在所述共享存储设备上创建占位文件,并在一定时间后检测所述特定目录下是否存在其它预备管理节点创建的占位文件,若不存在,则确定所述第一节点可以转换成管理节点;否则,对所述第一节点所在子群的节点数及所述其它预备管理节点所在子群的节点数进行比较,并基于比较结果判定所述第一节点是否可以由预备管理节点转换成管理节点。5.根据权利要求4所述的方法,其特征在于,对所述第一节点所在子群的节点数及所述其它预备管理节点所在子群的节点数进行比较,并基于比较结果判定所述第一节点是否可以由预备管理节点转换成管理节点,包括:确定所述第一节点所在子群的节点数多于所述其它预备管理节点所在子群的节点数时,确定所述第一节点可以转换成管理节点;确定所述第一节点所在子群的节点数最多且存在与所述第一节点所在子群的节点数相同的子群时,判断所述第一节点的节点编号是否小于与所述第一节点所在子群的节点数相同的子群中的预备管理节点的节点编号,并在判断为是时确定所述第一节点可以转换成管理节点,判断为否时确定所述第一节点不可以转换成管理节点。6.根据权利要求1或2所述的方法,其特征在于,所述集群内的共享存储设备支持单节点独占访问;所述基于第二管理策略判断所述第一节点是否可以由预备管理节点转换成管理节点,包括:确定所述第一节点对所述共享存储设备的第一分区的访问时间,并在所述访问时间到达时挂载所述第一分区,且在确定所述第一分区内不存在占位文件时,确定所述第一节点可以转换成管理节点;在确定所述第一分区内存在占位文件时,确定所述第一节点不可以转换成管理节点。7.根据权利要求1或2所述的方法,其特征在于,所述依据第一管理策略确定...

【专利技术属性】
技术研发人员:骆旭剑
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1