【技术实现步骤摘要】
集群系统的容灾方法、装置和机器可读介质
本申请涉及计算机集群
,特别是涉及一种集群系统的容灾方法、装置和机器可读介质。
技术介绍
计算机集群可以利用多个集群节点并行计算从而获得较高的计算速度,也可以用多个集群节点做备份,从而使得任何一台设备故障后整个集群系统还能正常运行。集群系统的可靠性是指集群系统对不论在何种情况下对请求的响应能力,也即,当集群系统中任何一台设备或者任何一个集群节点发生故障时集群系统能够通过剩下的设备和集群节点继续运行,这对集群系统的容灾能力提出了较高的要求。现有方案通常利用心跳(Heartbeat)检测方法,检测集群系统中的集群节点是否宕机。传统的心跳检测方法,如果在指定时间段之内没有接收到被检测节点的心跳消息,则可认为被检测节点宕机。例如,集群系统中的主节点(Master)和备节点(Slave)可以维持心跳,当提供服务的主节点出现故障时,若备节点检测不到主节点的心跳,则备节点将自动升级为主节点并提供服务。现有方案中,当提供服务的主节点发生宕机时,若备节点检测不到主节点的心跳,则备节点将自动升级为主节点并提供服务。然而,当集群系统中存在至 ...
【技术保护点】
1.一种集群系统的容灾方法,其特征在于,所述集群系统包括:主节点和备节点,所述备节点对应有所述主节点授予的租约,所述方法包括:获取所述备节点的租约对应的租约时间;依据所述备节点的租约对应的租约时间,对主节点的分布式锁进行抢占;若作为备节点的本节点抢占得到所述主节点的分布式锁,则切换为主节点。
【技术特征摘要】
1.一种集群系统的容灾方法,其特征在于,所述集群系统包括:主节点和备节点,所述备节点对应有所述主节点授予的租约,所述方法包括:获取所述备节点的租约对应的租约时间;依据所述备节点的租约对应的租约时间,对主节点的分布式锁进行抢占;若作为备节点的本节点抢占得到所述主节点的分布式锁,则切换为主节点。2.根据权利要求1所述的方法,其特征在于,所述主节点对应有自身授予的租约,所述方法还包括:依据所述主节点和所述备节点的租约对应的租约时间,对主节点的分布式锁进行抢占;若作为备节点的本节点抢占得到所述主节点的分布式锁,则切换为主节点,或者,若作为主节点的本节点抢占得到所述主节点的分布式锁,则保持主节点角色。3.根据权利要求1或2所述的方法,其特征在于,所述对主节点的分布式锁进行抢占,包括:对所述备节点、或者所述主节点和所述备节点的租约对应的租约时间进行排序,得到排序结果;若本节点在所述排序结果中租约时间最晚,则获得主节点的分布式锁。4.根据权利要求1或2所述的方法,其特征在于,在所述对主节点的分布式锁进行抢占之前,所述方法还包括:判断本节点的租约是否有效;则所述对分布式锁进行抢占,包括:当所述本节点的租约有效时,依据所述备节点、或者所述主节点和所述备节点的租约对应的租约时间,对主节点的分布式锁进行抢占。5.根据权利要求1或2所述的方法,其特征在于,所述对主节点的分布式锁进行抢占,包括:从所述备节点中、或者所述主节点和所述备节点中获取租约有效的目标节点;依据所述目标节点的租约对应的租约时间,对主节点的分布式锁进行抢占。6.根据权利要求1或2所述的方法,其特征在于,所述对分布式锁进行抢占,包括:当符合预置条件时,依据所述备节点、或者所述主节点和所述备节点的租约对应的租约时间,对主节点的分布式锁进行抢占;其中,所述预置条件包括:主节点发生宕机,和/或,主节点的分布式锁到期。7.根据权利要求6所述的方法,其特征在于,所述方法还包括:判断主节点的租约是否有效,若否,则判定所述主节点发生宕机;或者若在预设时间段之内未接收到主节点的心跳消息,则判定所述主节点发生宕机。8.根据权利要求1或2所述的方法,其特征在于,所述获取所述备节点、或者所述主节点和所述备节点的租约对应的租约时间,包括:从本节点存储的租约数据中获取所述备节点、或者所述主节点和所述备节点的租约,并依据所述备节点、或者所述主节点和备节点的租约,获取所述备节点、或者所述主节点和所述备节点的租约对应的租约时间。9.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:在所述主节点的分布式锁到期之前,发送延期请求,以通过所述延期请求延长所述分布式锁的到期时间。10.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:在本节点的租约到期之前,发送续约请求,以通过所述续约请求延长所述本节点的租约的租约时间。11.一种集群系统的容灾方法,其特征在于,应用于集群系统中被检测节点,所述被检测节点对应有租约,所述方法包括:获取所述租约对应的...
【专利技术属性】
技术研发人员:安龙送,周博,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。