一种有状态集群恢复方法、装置、设备及可读存储介质制造方法及图纸

技术编号:20875643 阅读:47 留言:0更新日期:2019-04-17 11:25
本发明专利技术公开了一种有状态集群恢复方法,该方法包括以下步骤:目标节点重启后,获取分布式协调服务记录的身份标识文件;利用身份标识文件确定主节点身份标识,并判断主节点身份标识与本机标识是否相同;如果是,则获取分布式协调服务的分布式锁,并在本机网卡中设置有状态集群对外提供访问服务的VIP;如果否,则在主节点获取分布式锁后,以从节点身份加入有状态集群,并加入申请主身份队列。可在有状态集群运行时、集群重启时、或单节点重启时,保障有状态集群数据完整性。本发明专利技术还公开了一种有状态集群恢复装置、设备及可读存储介质,具有相应的技术效果。

【技术实现步骤摘要】
一种有状态集群恢复方法、装置、设备及可读存储介质
本专利技术涉及计算机应用
,特别是涉及一种有状态集群恢复方法、装置、设备及可读存储介质。
技术介绍
在云计算、大数据、人工智能等IT系统中,有很多关键的服务存储着业务的核心数据,它们的正常运行是系统稳定运行的前提,为了解决单点故障和数据丢失问题,一般使用多个节点冗余备份的方法组成一个集群,统一对外提供服务。这些存在可变数据的服务称为有状态服务。如作为数据库服务的Galera技术的mariadb集群、ovn-db的主备集群、mongo主备集群,如作为消息转发服务的rabbitmq-server主备集群。当提供服务的节点异常(如断电、网络异常)之后,其他节点的服务可以继续工作。多个节点形成有状态集群,每个节点都保存各自的数据,通过集群心跳和同步来保证各个节点的数据一致性。有些集群是多个节点同时提供读写能力,如Galera-Mariadb、rabbitmq-server;有些集群是分为master+slave角色,只有master节点提供读写能力,slave只能提供读能力。在集群恢复方面,上述每种集群都可以轻松解决单点故障和重加入的问本文档来自技高网...

【技术保护点】
1.一种有状态集群恢复方法,其特征在于,包括:目标节点重启后,获取分布式协调服务记录的身份标识文件;利用所述身份标识文件确定主节点身份标识,并判断所述主节点身份标识与本机标识是否相同;如果是,则获取所述分布式协调服务的分布式锁,并在本机网卡中设置有状态集群对外提供访问服务的VIP;如果否,则在主节点获取所述分布式锁后,以从节点身份加入所述有状态集群,并加入申请主身份队列。

【技术特征摘要】
1.一种有状态集群恢复方法,其特征在于,包括:目标节点重启后,获取分布式协调服务记录的身份标识文件;利用所述身份标识文件确定主节点身份标识,并判断所述主节点身份标识与本机标识是否相同;如果是,则获取所述分布式协调服务的分布式锁,并在本机网卡中设置有状态集群对外提供访问服务的VIP;如果否,则在主节点获取所述分布式锁后,以从节点身份加入所述有状态集群,并加入申请主身份队列。2.根据权利要求1所述的有状态集群恢复方法,其特征在于,所述在本机网卡中设置有状态集群对外提供访问服务的VIP,包括:将本机的主从服务的状态设置为主状态,并在所述本机网卡中添加所述VIP。3.根据权利要求1所述的有状态集群恢复方法,其特征在于,在所述以从节点身份加入所述有状态集群,并加入申请主身份队列之后,还包括:循环监听所述分布式协调服务的分布式锁,以及所述主从服务的状态变更消息。4.根据权利要求3所述的有状态集群恢复方法,其特征在于,在所述循环监听所述分布式协调服务的分布式锁,以及所述主从服务的状态变更消息之后,还包括:获取所述分布式锁,执行所述获取所述分布式协调服务的分布式锁,并在本机网卡中设置有状态集群对外提供访问服务的VIP的步骤;将所述本机标识作为所述主节点身份标识写入所述身份标识文件。5.根据权利要求4所述的有状态集群恢复方法,其特征在于,所述获取所述分布式锁,包括:以竞争方式,获取所述分布式锁。6.根据权利要求1所述的有状态集群恢复方法,其特征在于,所述目标节点重启后,获取分布式协调服务记录的身份...

【专利技术属性】
技术研发人员:杜鹏飞
申请(专利权)人:杭州数梦工场科技有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1