数据库集群的管理控制方法、装置、设备及存储介质制造方法及图纸

技术编号:37328237 阅读:9 留言:0更新日期:2023-04-21 23:06
本申请公开了一种数据库集群的管理控制方法、装置、设备及存储介质,涉及集群管理技术领域,实现了数据库集群的异常自动恢复,提升了集群高可用性。该技术方案在数据库集群出现异常时,则管理节点可以及时检测并进行相应的自动修复,无需等待相关人员人工修复,减少异常修复所需消耗的时长,从而提升数据库集群的可用性,以向用户提供更高可用的数据库服务。并且,本申请实施例所提供的分布式数据库包括至少两个管理节点以及多个成对的数据节点,每对数据节点包含主数据节点和备用数据节点,从而能够实现数据的备份,提升数据存储的可靠性。性。性。

【技术实现步骤摘要】
数据库集群的管理控制方法、装置、设备及存储介质


[0001]本申请涉及计算机
,尤其涉及集群管理
,提供一种数据库集群的管理控制方法、装置、设备及存储介质。

技术介绍

[0002]分布式数据库包括多个互连的数据库,通过分布式数据库的管理集群进行管理,由于其运行性能更高,从而分布式数据库的应用前景将越来越广。
[0003]但是,在分布式数据库的运行过程中不可避免的会出现一些异常,目前,当数据库出现异常时,通常需要人为的检测异常并进行修复,并且,人工恢复的过程繁杂,效率不高,而往往分布式数据库其本身承载着业务数据的存储加工功能,在等待人工恢复的过程中,其带来的业务损失是难以接受的,对于用户的数据库使用体验也不佳。
[0004]因此,目前如何实现分布式数据库的自动恢复是目前亟待解决的问题。

技术实现思路

[0005]本申请实施例提供一种数据库集群的管理控制方法、装置、设备及存储介质,用于实现分布式数据库的自动恢复功能。
[0006]一方面,提供一种数据库集群的管理控制方法,应用于分布式数据库集群包括的任一管理节点中,所述集群包含存储所述集群的元数据的至少两个管理节点,以及存储数据的多对数据节点,每一对数据节点包括主数据节点和备份数据节点;所述方法包括:
[0007]基于异常恢复指令的触发,执行数据库操作功能所对应的测试指令,获得相应的执行结果;其中,所述执行结果表征所述测试指令是否成功执行;
[0008]基于所述执行结果以及本节点的角色状态信息,确定本节点是否处于异常状态;其中,所述角色状态信息用于表征本节点为主管理节点或者备用管理节点;
[0009]若确定本节点处于异常状态,则基于各个预设异常场景所对应的异常场景条件,确定本节点所满足异常场景条件的目标异常场景;
[0010]获取为所述目标异常场景配置的异常恢复策略,并基于所述异常恢复策略执行异常恢复处理,以对所述数据库操作功能进行恢复。
[0011]在一种可能的实施方式中,基于所述执行结果以及本节点的角色状态信息,确定本节点的数据库操作功能是否处于异常状态,包括:
[0012]若所述执行结果指示测试指令执行失败的次数超过设定数量阈值,则确定本节点的数据库操作功能处于异常状态;
[0013]若所述执行结果指示测试指令执行失败的次数未超过设定数量阈值,则对本节点的网络环境进行检测,以确认网络环境是否出现异常。
[0014]在一种可能的实施方式中,所述方法还包括:
[0015]监测预设时长内是否接收到其他管理节点发送的心跳信息;
[0016]若未收到,则对其他管理节点进行离线检测,以确定其他管理节点是否处于离线
模式;
[0017]若确定其他管理节点是否处于所述离线模式,则将本节点的运行模式切换为单节点模式。
[0018]一方面,提供一种数据库集群的管理控制装置,应用于分布式数据库集群包括的任一管理节点中,所述集群包含存储所述集群的元数据的至少两个管理节点,以及存储数据的多对数据节点,每一对数据节点包括主数据节点和备份数据节点;所述装置包括:
[0019]异常检测单元,用于基于异常恢复指令的触发,执行数据库操作功能所对应的测试指令,获得相应的执行结果;其中,所述执行结果表征所述测试指令是否成功执行;以及,基于所述执行结果以及本节点的角色状态信息,确定本节点是否处于异常状态;其中,所述角色状态信息用于表征本节点为主管理节点或者备用管理节点;
[0020]异常场景检测单元,用于若确定本节点处于异常状态,则基于各个预设异常场景所对应的异常场景条件,确定本节点所满足异常场景条件的目标异常场景;
[0021]异常恢复单元,用于获取为所述目标异常场景配置的异常恢复策略,并基于所述异常恢复策略执行异常恢复处理,以对所述数据库操作功能进行恢复。
[0022]在一种可能的实施方式中,所述异常检测单元,具体用于:
[0023]基于异常恢复指令的触发,根据所述至少两个管理节点各自的角色状态信息,确定是否存在多个管理节点为主管理节点;
[0024]若不存在多个管理节点为主管理节点,则执行数据库操作功能所对应的测试指令,获得相应的执行结果。
[0025]在一种可能的实施方式中,所述集群通过连接池对外提供服务;则异常恢复单元,还用于:
[0026]若存在多个管理节点为主管理节点,则停止所述连接池的对外服务功能;
[0027]根据所述多个管理节点的数据操作进度,从所述多个管理节点中确定数据操作时间最靠后的目标管理节点;
[0028]若本节点并非所述目标管理节点,则将本节点的操作数据发送给所述目标管理节点,以使得所述目标管理节点在基于所述操作数据重新执行相应的数据操作后,重新启动所述连接池的对外服务功能。
[0029]在一种可能的实施方式中,异常恢复单元,还用于:
[0030]若确定所述数据库操作功能处于正常状态,则检测所述集群的连接池所对应的对外服务功能是否处于异常状态;
[0031]若所述对外服务功能处于异常状态,则获取为所述对外服务功能配置的异常恢复策略,并基于所述异常恢复策略执行异常恢复处理。
[0032]在一种可能的实施方式中,所述异常检测单元,具体用于:
[0033]若所述执行结果指示测试指令执行失败的次数超过设定数量阈值,则确定本节点的数据库操作功能处于异常状态;
[0034]若所述执行结果指示测试指令执行失败的次数未超过设定数量阈值,则对本节点的网络环境进行检测,以确认网络环境是否出现异常。
[0035]在一种可能的实施方式中,所述装置还包括角色状态切换单元,用于:
[0036]基于本节点与数据库之间的连接状态,确定本节点当前的角色状态信息;
[0037]若所述角色状态信息为备用管理节点,则执行地址解绑操作,以解除本节点与数据库的虚拟访问地址的绑定关系;
[0038]在检测到所述集群的数据库操作功能处于异常状态时,确定本节点是否满足切换为主管理节点的前置条件;
[0039]若满足,执行角色状态切换操作,以将本节点切换为主管理节点。
[0040]在一种可能的实施方式中,所述装置还包括锁管理单元,用于:
[0041]响应于针对所述集群进行的目标操作所触发的锁请求消息,从本节点获取相应的锁;其中,所述锁请求消息用于请求为所述目标操作分配锁,所述目标操作为针对所述集群进行的任意操作;
[0042]若所述锁请求消息为本节点中的本地应用所触发,则向除本节点之外的其他管理节点发起锁获取请求;
[0043]若除本节点之外的其他管理节点均成功返回锁,则输出指示所述锁请求消息获取锁成功的指示信息。
[0044]在一种可能的实施方式中,所述锁管理单元,具体用于:
[0045]若所述锁请求消息为本节点中的本地应用所触发,则确认所述集群当前是否处于单节点模式;其中,所述单节点模式表征本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据库集群的管理控制方法,其特征在于,应用于分布式数据库集群包括的任一管理节点中,所述集群包含存储所述集群的元数据的至少两个管理节点,以及存储数据的多对数据节点,每一对数据节点包括主数据节点和备份数据节点;所述方法包括:基于异常恢复指令的触发,执行数据库操作功能所对应的测试指令,获得相应的执行结果;其中,所述执行结果表征所述测试指令是否成功执行;基于所述执行结果以及本节点的角色状态信息,确定本节点是否处于异常状态;其中,所述角色状态信息用于表征本节点为主管理节点或者备用管理节点;若确定本节点处于异常状态,则基于各个预设异常场景所对应的异常场景条件,确定本节点所满足异常场景条件的目标异常场景;获取为所述目标异常场景配置的异常恢复策略,并基于所述异常恢复策略执行异常恢复处理,以对所述数据库操作功能进行恢复。2.如权利要求1所述的方法,其特征在于,基于异常恢复指令的触发,执行数据库操作功能所对应的测试指令,获得相应的执行结果,包括:基于异常恢复指令的触发,根据所述至少两个管理节点各自的角色状态信息,确定是否存在多个管理节点为主管理节点;若不存在多个管理节点为主管理节点,则执行数据库操作功能所对应的测试指令,获得相应的执行结果。3.如权利要求2所述的方法,其特征在于,所述集群通过连接池对外提供服务;则在基于异常恢复指令的触发,根据所述至少两个管理节点各自的角色状态信息,确定是否存在多个管理节点为主管理节点之后,所述方法还包括:若存在多个管理节点为主管理节点,则停止所述连接池的对外服务功能;根据所述多个管理节点的数据操作进度,从所述多个管理节点中确定数据操作时间最靠后的目标管理节点;若本节点并非所述目标管理节点,则将本节点的操作数据发送给所述目标管理节点,以使得所述目标管理节点在基于所述操作数据重新执行相应的数据操作后,重新启动所述连接池的对外服务功能。4.如权利要求1所述的方法,其特征在于,在基于所述执行结果以及本节点的角色状态信息,确定本节点的数据库操作功能是否处于异常状态之后,所述方法还包括:若确定所述数据库操作功能处于正常状态,则检测所述集群的连接池所对应的对外服务功能是否处于异常状态;若所述对外服务功能处于异常状态,则获取为所述对外服务功能配置的异常恢复策略,并基于所述异常恢复策略执行异常恢复处理。5.如权利要求1~4任一所述的方法,其特征在于,所述方法还包括:基于本节点与数据库之间的连接状态,确定本节点当前的角色状态信息;若所述角色状态信息为备用管理节点,则执行地址解绑操作,以解除本节点与数据库的虚拟访问地址的绑定关系;在检测到所述集群的数据库操作功能处于异常状态时,确定本节点是否满足切换为主管理节点的前置条件;若满足,执行角...

【专利技术属性】
技术研发人员:凌培杰周明伟
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1