一种集群节点故障处理方法、存储介质及设备技术

技术编号:40987622 阅读:19 留言:0更新日期:2024-04-18 21:31
本发明专利技术提供了一种集群节点故障处理方法、存储介质及设备,该故障处理方法包括:多个节点和共享存储设备,共享储存设备通过网络与多个节点连接,以实现集群数据的共享和访问,共享存储设备上保存有多个节点定时更新的节点信息,故障处理方法包括:每个节点定时读取节点信息中自身对应节点信息;判断对应节点信息是否存在隔离信息;若存在,则确认节点为故障节点;获取数据库集群的操作类型;根据操作类型将故障节点隔离。本发明专利技术的数据库集群的故障处理方法提出一种基于共享存储的故障节点的自动隔离的软件方法,实现故障节点自动隔离。

【技术实现步骤摘要】

本专利技术涉及数据库领域,特别是涉及一种集群节点故障处理方法、存储介质及设备


技术介绍

1、现有技术中使用共享存储设备通过高速网络连接到多个节点,以实现数据的共享和访问,组成共享存储集群。共享存储集群中节点的故障无法避免,为了保证数据安全性和集群的高可用性,需要对故障的节点进行隔离(fencing)防止故障的扩散。

2、目前数据库领域通用的方案有三类:第一类为io级隔离,主要通过对故障节点在io路径上进行拦截,向上返错或挂住等待;第二类为存储级隔离,主要通过scsi-3预留技术让故障节点无法访问后端存储;第三类为节点电源级隔离,主要通过stonith(shoot theother node in the head)机制,由集群中正常的节点感知到其他节点的故障,并通过电源控制管理接口,对故障节点进行重启或关机。

3、在数据库领域,由于数据库集群的高可用性和高可靠性要求,节点电源级隔离方案是较为适合的方案。

4、然而目前的一些远程电源控制方法,例如使用ipmi(intelligent platformmanagement 本文档来自技高网...

【技术保护点】

1.一种数据库集群的故障处理方法,所述集群包括多个节点和共享存储设备,所述共享存储设备通过网络与所述多个节点连接,以实现集群数据的共享和访问,所述共享存储设备上保存有所述多个节点定时更新的节点信息,所述故障处理方法包括:

2.根据权利要求1所述的数据库集群的故障处理方法,其中,所述共享存储设备根据所述多个节点划分为多个存储分区,每个所述存储分区用于存放任一所述节点的节点信息,所述节点信息包括分区最后更新的时间戳、隔离信息。

3.根据权利要求2所述的数据库集群的故障处理方法更新,其中,所述每个节点定时读取所述节点信息中自身对应的节点信息的步骤之前还包括:

...

【技术特征摘要】

1.一种数据库集群的故障处理方法,所述集群包括多个节点和共享存储设备,所述共享存储设备通过网络与所述多个节点连接,以实现集群数据的共享和访问,所述共享存储设备上保存有所述多个节点定时更新的节点信息,所述故障处理方法包括:

2.根据权利要求1所述的数据库集群的故障处理方法,其中,所述共享存储设备根据所述多个节点划分为多个存储分区,每个所述存储分区用于存放任一所述节点的节点信息,所述节点信息包括分区最后更新的时间戳、隔离信息。

3.根据权利要求2所述的数据库集群的故障处理方法更新,其中,所述每个节点定时读取所述节点信息中自身对应的节点信息的步骤之前还包括:

4.根据权利要求3所述的数据库集群的故障处理方法,其中,所述通过所述最后更新时间戳判断是否存在超过时间阈值未更新的节点的步骤包括:

5.根据权利要求3所述的数据库集群的故障处理方法,其中,所述通过...

【专利技术属性】
技术研发人员:陈胤光杨尚孙文奇
申请(专利权)人:北京人大金仓信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1