分布式数据库系统的故障检测方法及其系统技术方案

技术编号:16188055 阅读:64 留言:0更新日期:2017-09-12 11:22
本发明专利技术公开了一种分布式数据库系统的故障检测方法及其系统,方法包括:HA组件集群中的主节点按照预设的时间周期探测数据库节点,得到第一探测结果;若所述第一探测结果为失败的次数大于等于预设值,则所述主节点发送所述数据库节点故障确认的通知;HA组件集群中的至少一个从节点接收所述故障确认的通知后对所述数据库节点进行探测,得到第二探测结果;所述从节点将第二探测结果反馈给主节点;所述主节点根据所述第二探测结果,判断所述数据库节点是否故障。采用主节点进行故障探测,从节点辅助故障确认的故障检测策略,能有效降低因网络抖动引起的误检测,提高了故障检测的准确性,保证了数据库服务的高可用性。

Fault detection method and system for distributed database system

The invention discloses a fault detection method and system, a distributed database system method includes: the master node of HA components in the cluster according to the preset time period to detect the database node, the first detection results; if the first detection results for failure times is more than or equal to the preset value, then send the main node of the confirmation of database node fault notification; at least one receives the fault confirmation from the nodes of the HA component in the cluster on the database node detection, second detection results; the detection results from node second feedback to the master node; the master node according to the detection results of the second judgments the database node fault. The master node fault detection, fault detection strategy confirmation from the assistant node failure, can effectively reduce the detection error caused by network jitter and improve the accuracy of fault detection, to ensure the high availability of database service.

【技术实现步骤摘要】
分布式数据库系统的故障检测方法及其系统
本专利技术涉及分布式数据库领域,尤其涉及一种分布式数据库系统的故障检测方法及其系统。
技术介绍
大数据时代,分布式数据库成为数据存储的必要基础设施。分布式数据库系统存在一些问题,其中,对于大多数应用服务来说,可用性问题是一个基本问题。提供一定程度高可用性服务,是分布式数据库系统必备的特征之一。目前有很多分布式数据库系统的高可用性方案,常采用单节点高可用性组件(HA组件)进行故障检测和故障处理。该方案存在单点故障,在高可用性组件本身异常时,将无法提供高可用性服务。对于高可用性组件多节点部署的分布式高可用性系统,可以解决单点问题。但是,多个高可用性组件节点之间必须确定主备关系,只有主节点可以对故障进行处理,否则多个高可用性节点的操作很容易造成冲突。在申请号为201210148938.9的专利公开文件中,提出了一种数据库集群单点故障的监控系统及方法,应用于若干个数据库的数据库集群中,所述数据库包括主库或从库,监控系统包括:若干个数据库代理,至少三个基于分布式协调机制相互通信的协调终端,其中至少三个协调终端中包括一个领导协调终端;一个数据库代理与数据库本文档来自技高网...
分布式数据库系统的故障检测方法及其系统

【技术保护点】
一种分布式数据库系统的故障检测方法,其特征在于:包括:HA组件集群中的主节点按照预设的时间周期探测数据库节点,得到第一探测结果;若所述第一探测结果为失败的次数大于等于预设值,则所述主节点发送所述数据库节点故障确认的通知;HA组件集群中的至少一个从节点接收所述通知后对所述数据库节点进行探测,得到第二探测结果;所述从节点将第二探测结果反馈给主节点;所述主节点根据所述第二探测结果,判断所述数据库节点是否故障。

【技术特征摘要】
1.一种分布式数据库系统的故障检测方法,其特征在于:包括:HA组件集群中的主节点按照预设的时间周期探测数据库节点,得到第一探测结果;若所述第一探测结果为失败的次数大于等于预设值,则所述主节点发送所述数据库节点故障确认的通知;HA组件集群中的至少一个从节点接收所述通知后对所述数据库节点进行探测,得到第二探测结果;所述从节点将第二探测结果反馈给主节点;所述主节点根据所述第二探测结果,判断所述数据库节点是否故障。2.根据权利要求1所述的分布式数据库系统的故障检测方法,其特征在于:所述“所述主节点根据所述第二探测结果,判断所述数据库节点是否故障”具体为:若所述从节点反馈的第二探测结果均为异常,则判定所述数据库节点故障;若至少一个从节点反馈的第二探测结果为正常,则判定所述数据库节点正常。3.根据权利要求1所述的分布式数据库系统的故障检测方法,其特征在于:所述“所述主节点根据所述第二探测结果,判断所述数据库节点是否故障”之后,进一步包括:若故障的数据库节点为主数据库节点,则在可用的备数据库节点中选取一个新的主数据库节点。4.根据权利要求1所述的分布式数据库系统的故障检测方法,其特征在于:所述“所述主节点发送所述数据库节点故障确认的通知”具体为:所述主节点发送所述数据库节点故障确认的通知给协调组件;协调组件将所述通知发送给HA组件集群中的所有从节点。5.根据权利要求1所述的分布式数据库系统的故障检测方法,其特征在于:所述“所述从节点将第二探测结果反馈给主节点”具体为:所述从节点将第二探测结果反馈给协调组件;协调组件将第二探测结果反馈给所述主节点。6....

【专利技术属性】
技术研发人员:刘德建陈小钟贾玉博陈霖吴拥民陈宏展
申请(专利权)人:福建天晴数码有限公司
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1