The invention discloses a controller node failure recovery method in cluster system, the method includes: in the cluster system, every two nodes of a IO controller for each group; group IO, establishing a link between two nodes in the controller in the IO group, the link will be two nodes connected communication controller specify a node controller; in the IO group as the master node and another node controller for standby node; when the main node in the IO group when a fault occurs, start standby node work. This method can recover the cluster when the node fails.
【技术实现步骤摘要】
本专利技术涉及集群系统
,特别是涉及一种集群系统中控制器节点故障恢复方法。
技术介绍
目前,集群是一组相互独立的、通过高速网络互联的计算机,它们构成了一个组,并以单一系统的模式加以管理。一个客户与集群相互作用时,集群像是一个独立的服务器。集群配置是用于提高可用性和可缩放性。集群技术是一种通用的技术,能够解决单机运算能力的不足、IO能力的不足、提高服务的可靠性、获得规模可扩展能力,降低整体方案的运维成本,例如运行、升级、维护成本。但是,当集群中的节点发生故障时,没有一套机制保障集群数据,保证集群恢复。
技术实现思路
本专利技术的目的是提供一种集群系统中控制器节点故障恢复方法,以实现节点故障时恢复集群。为解决上述技术问题,本专利技术提供一种集群系统中控制器节点故障恢复方法,应用于由多个控制器节点组成的集群系统,该方法包括:在集群系统中,将每两个控制器节点组成一个IO组;对于每个IO组,在IO组中的两个控制器节点之间建立链路,通过链路将两个控制器节点进行连接通信;指定IO组中的一个控制器节点为主节点,另一个控制器节点为备用节点;当IO组中的主节点出现故障时,启动备用 ...
【技术保护点】
一种集群系统中控制器节点故障恢复方法,其特征在于,应用于由多个控制器节点组成的集群系统,包括:在集群系统中,将每两个控制器节点组成一个IO组;对于每个IO组,在IO组中的两个控制器节点之间建立链路,通过链路将两个控制器节点进行连接通信;指定IO组中的一个控制器节点为主节点,另一个控制器节点为备用节点;当IO组中的主节点出现故障时,启动备用节点进行工作。
【技术特征摘要】
1.一种集群系统中控制器节点故障恢复方法,其特征在于,应用于由多个控制器节点组成的集群系统,包括:在集群系统中,将每两个控制器节点组成一个IO组;对于每个IO组,在IO组中的两个控制器节点之间建立链路,通过链路将两个控制器节点进行连接通信;指定IO组中的一个控制器节点为主节点,另一个控制器节点为备用节点;当IO组中的主节点出现故障时,启动备用节点进行工作。2.如权利要求1所述的方法,其特征在于,对于每个IO组,IO组中的两个控制器节点互为备份,并通过链路保持数据一致性。3.如权利要求1所述的方法,其特征在于,每个IO组之间通过主节点进行通信。4.如权利要求1所述的方法,其特征在于,还包括:在集群系统中,指定一个控制器节点为中心节点,剩余所有控制器节点为普通节点;当普通节点检测到集群系统中...
【专利技术属性】
技术研发人员:王佳琪,李美欣,
申请(专利权)人:郑州云海信息技术有限公司,
类型:发明
国别省市:河南;41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。