一种存储网关智能防脑裂系统及方法技术方案

技术编号:16177713 阅读:30 留言:0更新日期:2017-09-09 05:10
本发明专利技术公开了一种存储网关智能防脑裂系统及方法,包括应用服务层、网络链路层、存储管理层和存储设备层,其中应用服务器层为客户应用系统服务器,装有各种应用系统及数据库软件;网络链路层,包含IP网络及FC光纤网络;存储管理层,包括两个存储网关作为节点,当有一个节点故障时,另外一个节点可以正常工作;在两存储网关之间配置仲裁者,当节点出现故障时,该仲裁者仲裁判断每个节点的状态,判断出出现故障的节点;存储设备层,包含至少两个存储阵列。本发明专利技术的一种存储网关智能防脑裂系统及方法与现有技术相比,提出了三级脑裂判断机制,能够在数据保护高可用方案中有效判断节点之间的Active与Inactive状态,从而判定Primary节点,防止脑裂现象的发生。

【技术实现步骤摘要】
一种存储网关智能防脑裂系统及方法
本专利技术涉及计算机
,具体地说是一种存储网关智能防脑裂系统及方法。
技术介绍
大数据时代,数据已经成为各行业至关重要的核心资产。传统的灾备方案中存在着资源利用率低、可用性差、出现故障时停机时间长、数据恢复慢、风险高等问题。数据是否安全、业务是否连续运行无中断成为用户衡量一个灾备方案的关键。传统数据中心存储灾备一般采用主备模式,只有当生产数据中心存储故障后,灾备中心存储才会接管数据访问业务,并且此过程需要手动执行,将灾备中心对应的业务Lun手动激活读写服务;此外,主备数据中心的模式,在正常业务运转情况下,只有主中心发挥作用,备中心的资源一直处于“待命”模式,无法最大程度发挥所有资源的效率。双活数据中心将是未来数据中心发展的趋势,而存储双活又是数据中心双活的重要基础。传统灾备部署方式为一个生产中心、一个灾备中心,灾备中心平台处在不工作状态,只有当灾难发生时,生产数据中心瘫痪,灾备中心才启动。这种灾备系统面临以下挑战:1.当生产中心遭遇供电故障、火灾、洪灾、地震等灾难时,需要手动将业务切换到灾备中心,业务中断时间长,无法保证业务连续运行。2.灾备中心不能对外提供服务,常年处于闲置状态,资源利用率低。针对传统灾备系统建设面临的挑战,基于存储的双活解决方案应运而生。在目前的存储双活技术中,两个存储网关之间比如NodeA和NodeB会通过心跳检测以确认对方存在,在通过心跳检测确认不到对方存在时,就接管对应的(共享)resource;如果突然间,NodeA和NodeB之间的心跳不存在了(如网络断开),而NodeA和NodeB事实上却都处于Active状态,此时NodeA要接管NodeB的resource,同时NodeB要接管NodeA的resource,这时就是脑裂(split-brain)在“双机热备”高可用(HA)系统中,当联系2个节点的“心跳线”断开时,本来构成同一个整体、动作协调的HA系统,就分裂成为2个独立的个体。由于相互失去了联系,都以为是对方出了故障,2个节点上的HA软件像“裂脑人”一样,“本能”地争抢“共享资源”、争着起动“应用服务”,那么必然会发生严重的后果:或者共享资源被瓜分、两边的“服务”都起不来了;或者两边“服务”都起来了,但同时读写“共享存储”,导致数据损坏(常见如数据库轮询着的联机日志出错)。由此可见,创建一种可靠且智能的仲裁机制以防止脑裂发生至关重要。基于此,本专利技术提供一种存储网关智能防脑裂系统及方法。
技术实现思路
本专利技术的技术任务是针对以上不足之处,提供一种存储网关智能防脑裂系统及方法。一种存储网关智能防脑裂系统,包括应用服务层、网络链路层、存储管理层和存储设备层,其中,应用服务器层为客户应用系统服务器,装有各种应用系统及数据库软件;网络链路层,包含IP网络及FC光纤网络,并通过IP交换机及FC交换机互连;存储管理层,包括两个存储网关作为节点,当有一个节点故障时,另外一个节点可以正常工作,将上层客户端数据写入下层存储;在两存储网关之间配置仲裁者,当节点出现故障时,该仲裁者仲裁判断每个节点的状态,判断出出现故障的节点;存储设备层,包含至少两个存储阵列。所述仲裁者为一个锁服务或是一个共享盘,该仲裁者与节点之间可通过ping命令进行通信。所述仲裁者仲裁判断节点状态时,首先判断其与节点之间的IP网络心跳,当心跳停止时则该节点出现故障;未停止则继续FC心跳判断,即光纤心跳判断,当心跳停止时则该节点出现故障;未停止则继续IMPI判断,将能够接收到IO请求的节点作为无故障网关继续进行读写服务。所述网络心跳是在集群中节点间通过IP链路传递的通讯包,用于监测集群节点、网络和网络接口工作状态是否正常,防止孤立节点的产生以保证集群的正常工作。所述光纤心跳指在集群节点间通过光纤链路传递的通信包,用于监测集群节点、网络和网络接口工作状态是否正常,防止孤立节点的产生以保证集群的正常工作。一种存储网关智能防脑裂方法,应用于双活数据中心,该双活数据中心中配置有两个存储网关,将两个存储网关视为两个节点,其实现步骤为,当两个节点出现分歧时,设置一个第三方仲裁者,由出现分歧的两节点分别通过仲裁者仲裁,判断每个节点的状态,确定每个节点是否出现故障。所述仲裁者为一个锁服务或是一个共享盘。所述仲裁者仲裁包括三种仲裁机制,具体为:网络心跳判断,将两个出现分歧的节点分别ping通仲裁者,当不通时则表明断点就在本端,通则继续下一种判断;光纤心跳判断,将两个出现分歧的节点分别ping通仲裁者,当不通时则表明断点就在本端,通则继续下一种判断;IMPI判断,由仲裁者发送写IO请求,当Standby状态的节点收到写IO请求时,则通过IPMI把另外一台节点强制关机,然后把自己转为Primary,该Primary节点继续提供读写服务。所述网络心跳判断中的心跳是在集群中节点间通过IP链路传递的通讯包,用于监测集群节点、网络和网络接口工作状态是否正常,防止孤立节点的产生以保证集群的正常工作;在判断时,网络间的通信首先判断IP心跳通道,即两个出现分歧的节点都各自ping一下参考IP,如果ping不通仲裁者则表明断点就出在本端,让能ping通仲裁者的的节点去服务。所述光纤心跳指在集群节点间通过光纤链路传递的通信包,用于监测集群节点、网络和网络接口工作状态是否正常,防止孤立节点的产生以保证集群的正常工作。本专利技术的一种存储网关智能防脑裂系统及方法和现有技术相比,具有以下有益效果:本专利技术的一种存储网关智能防脑裂系统及方法,提出了三级脑裂判断机制,能够在数据保护高可用方案中有效判断节点之间的Active与Inactive状态,从而判定Primary节点,防止脑裂现象的发生,有效保护数据的安全具有广泛的实际应用性;本系统设计在网络层,存储管理层及存储设备层全冗余设计,任何一个节点出现故障,都不会影响客户上层应用的继续访问;设计仲裁,可以为一个锁服务或是一个共享盘,设计简单方便搭建;三种仲裁判断机制,优先走网络心跳通道,若网络心跳线不通,系统将尝试FC心跳通信,若以上两者都不通则启动第三级IPMI机制;三级判断防护机制能够有效阻止脑裂情况的发生,适用范围广泛,具有很好的推广应用价值。附图说明附图1为本专利技术的实现示意图。具体实施方式下面结合附图及具体实施例对本专利技术作进一步说明。如附图1所示,一种存储网关智能防脑裂系统,包括应用服务层、网络链路层、存储管理层和存储设备层,其中,应用服务器层为客户应用系统服务器,装有各种应用系统及数据库软件;网络链路层,包含IP网络及FC光纤网络,并通过IP交换机及FC交换机互连;存储管理层,包括存储网关1和存储网关2作为节点NodeA和NodeB,当有一个节点故障时,另外一个节点可以正常工作,将上层客户端数据写入下层存储;在两存储网关之间配置仲裁者,当节点出现故障时,该仲裁者仲裁判断每个节点的状态,判断出出现故障的节点;存储设备层,包含存储阵列1和存储阵列2。所述仲裁者为一个锁服务或是一个共享盘,该仲裁者与节点之间可通过ping命令进行通信。所述仲裁者仲裁判断节点状态时,首先判断其与节点之间的IP网络心跳,当心跳停止时则该节点出现故障;未停止则继续FC心跳判断,即光纤心跳判断,当心跳停本文档来自技高网
...
一种存储网关智能防脑裂系统及方法

【技术保护点】
一种存储网关智能防脑裂系统,其特征在于,包括应用服务层、网络链路层、存储管理层和存储设备层,其中,应用服务器层为客户应用系统服务器,装有各种应用系统及数据库软件;网络链路层,包含IP网络及FC光纤网络,并通过IP交换机及FC交换机互连;存储管理层,包括两个存储网关作为节点,当有一个节点故障时,另外一个节点可以正常工作,将上层客户端数据写入下层存储;在两存储网关之间配置仲裁者,当节点出现故障时,该仲裁者仲裁判断每个节点的状态,判断出出现故障的节点;存储设备层,包含至少两个存储阵列。

【技术特征摘要】
1.一种存储网关智能防脑裂系统,其特征在于,包括应用服务层、网络链路层、存储管理层和存储设备层,其中,应用服务器层为客户应用系统服务器,装有各种应用系统及数据库软件;网络链路层,包含IP网络及FC光纤网络,并通过IP交换机及FC交换机互连;存储管理层,包括两个存储网关作为节点,当有一个节点故障时,另外一个节点可以正常工作,将上层客户端数据写入下层存储;在两存储网关之间配置仲裁者,当节点出现故障时,该仲裁者仲裁判断每个节点的状态,判断出出现故障的节点;存储设备层,包含至少两个存储阵列。2.根据权利要求1所述的一种存储网关智能防脑裂系统,其特征在于,所述仲裁者为一个锁服务或是一个共享盘,该仲裁者与节点之间可通过ping命令进行通信。3.根据权利要求1或2所述的一种存储网关智能防脑裂系统,其特征在于,所述仲裁者仲裁判断节点状态时,首先判断其与节点之间的IP网络心跳,当心跳停止时则该节点出现故障;未停止则继续FC心跳判断,即光纤心跳判断,当心跳停止时则该节点出现故障;未停止则继续IMPI判断,将能够接收到IO请求的节点作为无故障网关继续进行读写服务。4.根据权利要求3所述的一种存储网关智能防脑裂系统,其特征在于,所述网络心跳是在集群中节点间通过IP链路传递的通讯包,用于监测集群节点、网络和网络接口工作状态是否正常,防止孤立节点的产生以保证集群的正常工作。5.根据权利要求3所述的一种存储网关智能防脑裂系统,其特征在于,所述光纤心跳指在集群节点间通过光纤链路传递的通信包,用于监测集群节点、网络和网络接口工作状态是否正常,防止孤立节点的产生以保证集群的正常工作。6.一种存储网关智能防脑裂方法,其特征在于,应用于双...

【专利技术属性】
技术研发人员:付丽莉
申请(专利权)人:郑州云海信息技术有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1