一种存储双控防脑裂方法、系统、终端及存储介质技术方案

技术编号:22946148 阅读:12 留言:0更新日期:2019-12-27 17:28
本发明专利技术提供一种存储双控防脑裂方法、系统、终端及存储介质,包括:确认双控制器之间的NTB通道失效,调用当前节点fence资源向对端节点宿主机发送登录请求;确认所述登录请求无应答,向当前节点宿主机的守护进程发送socket连接;根据守护进程返回的宿主机集群状态定位故障节点,重启故障节点的NAS虚拟机。本发明专利技术可以及时发现NTB链路故障,在第一时间避免在心跳线中断时防止脑裂,使nas业务不受影响,且方法简单,易于实现,保障了存储系统的稳定运行。

【技术实现步骤摘要】
一种存储双控防脑裂方法、系统、终端及存储介质
本专利技术涉及存储设备
,具体涉及一种存储双控防脑裂方法、系统、终端及存储介质。
技术介绍
NAS(NetworkAttachedStorage,网络附属存储系统)是连接于网络,具备数据存储功能的装置,其以数据为中心,将存储设备与服务器彻底分离,集中管理数据,从而达到释放带宽、提高性能的目的,具备低成本、高效率的优势,是一种专用数据存储服务器。集群NAS则是协同多个宿主机节点(HOST节点)以提供高性能、高可用或高负载均衡的NAS服务。NAS集群系统是一种横向扩展存储架构,具有容量和性能线性扩展的优势,随着存储产品的不断更新升级,现在都使用存储双控(控制器)间的NTB通道作为NAS心跳信息交换物理链路。存储双控(控制器)间的NTB通道首先要生成虚拟网卡驱动,存储系统启动时,需要立即创建虚拟网卡,保证虚拟网能够顺利使用。存储系统的Agent模块,用于管理NAS虚拟机与硬件NTB芯片的链接,该通道是NAS心跳信息传输的透明通道。Agent模块与NAS虚拟网卡之间进行数据的收发。但是使用此物料链路作为心跳信息交换,容易出现故障后无法连接,无法进行信息交互,导致两个nas节点脑裂,无法提供业务,从而nas业务中断。
技术实现思路
针对现有技术的上述不足,本专利技术提供一种存储双控防脑裂方法、系统、终端及存储介质,以解决上述技术问题。第一方面,本专利技术提供一种存储双控防脑裂方法,包括:确认双控制器之间的NTB通道失效,调用当前节点fence资源向对端节点宿主机发送登录请求;确认所述登录请求无应答,向当前节点宿主机的守护进程发送socket连接;根据守护进程返回的宿主机集群状态定位故障节点,重启故障节点的NAS虚拟机。进一步的,所述确认双控制器之间的NTB通道失效,包括:获取双控控制组件返回的NAS心跳信号不通的信息,所述双控节点之间周期性交换NAS心跳信号,所述双控控制组件实时监控所述NAS心跳信号交换结果。进一步的,所述根据守护进程返回的宿主机集群状态定位故障节点,重启故障节点的NAS虚拟机,包括:采集守护进程返回的第一节点宿主机状态和第二节点宿主机状态,所述第一节点和第二节点为双控两端节点;将宿主机状态为非ACTIVE的节点确定为故障节点;重启所述故障节点的NAS虚拟机。第二方面,本专利技术提供一种存储双控防脑裂系统,包括:失效确认单元,配置用于确认双控制器之间的NTB通道失效,调用当前节点fence资源向对端节点宿主机发送登录请求;连接发送单元,配置用于确认所述登录请求无应答,向当前节点宿主机的守护进程发送socket连接;故障重启单元,配置用于根据守护进程返回的宿主机集群状态定位故障节点,重启故障节点的NAS虚拟机。进一步的,所述失效确认单元包括:心跳判断模块,配置用于获取双控控制组件返回的NAS心跳信号不通的信息,所述双控节点之间周期性交换NAS心跳信号,所述双控控制组件实时监控所述NAS心跳信号交换结果。进一步的,所述故障重启单元包括:状态采集模块,配置用于采集守护进程返回的第一节点宿主机状态和第二节点宿主机状态,所述第一节点和第二节点为双控两端节点;故障定位模块,配置用于将宿主机状态为非ACTIVE的节点确定为故障节点;重启执行模块,配置用于重启所述故障节点的NAS虚拟机。第三方面,提供一种终端,包括:处理器、存储器,其中,该存储器用于存储计算机程序,该处理器用于从存储器中调用并运行该计算机程序,使得终端执行上述的终端的方法。第四方面,提供了一种计算机存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。本专利技术的有益效果在于,本专利技术提供的存储双控防脑裂方法、系统、终端及存储介质,利用fence资源(fence_virsh脚本)通过socket连接后发送信号给守护进程vm_daemon,由vm_daemon根据宿主机判断是否重启虚机,进而保留一个节点提供业务,避免脑裂发生。本专利技术可以及时发现NTB链路故障,在第一时间避免在心跳线中断时防止脑裂,使nas业务不受影响,且方法简单,易于实现,保障了存储系统的稳定运行。此外,本专利技术设计原理可靠,结构简单,具有非常广泛的应用前景。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术一个实施例的方法的示意性流程图。图2是本专利技术一个实施例的系统的示意性框图。图3为本专利技术实施例提供的一种终端的结构示意图。具体实施方式为了使本
的人员更好地理解本专利技术中的技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。图1是本专利技术一个实施例的方法的示意性流程图。其中,图1执行主体可以为一种存储双控防脑裂系统。如图1所示,该方法100包括:步骤110,确认双控制器之间的NTB通道失效,调用当前节点fence资源向对端节点宿主机发送登录请求;步骤120,确认所述登录请求无应答,向当前节点宿主机的守护进程发送socket连接;步骤130,根据守护进程返回的宿主机集群状态定位故障节点,重启故障节点的NAS虚拟机。可选地,作为本专利技术一个实施例,所述确认双控制器之间的NTB通道失效,包括:获取双控控制组件返回的NAS心跳信号不通的信息,所述双控节点之间周期性交换NAS心跳信号,所述双控控制组件实时监控所述NAS心跳信号交换结果。可选地,作为本专利技术一个实施例,所述根据守护进程返回的宿主机集群状态定位故障节点,重启故障节点的NAS虚拟机,包括:采集守护进程返回的第一节点宿主机状态和第二节点宿主机状态,所述第一节点和第二节点为双控两端节点;将宿主机状态为非ACTIVE的节点确定为故障节点;重启所述故障节点的NAS虚拟机。,为了便于对本专利技术的理解,下面以本专利技术存储双控防脑裂方法的原理,结合实施例中对双控节点进行监控和管理的过程,对本专利技术提供的存储双控防脑裂方法做进一步的描述。具体的,所述存储双控防脑裂方法包括:S1、确认双控制器之间的NTB通道失效,调用当前节点fence资源向对端节点宿主机发送登录请求。双控控制组件corosync是监控NTB通道NAS心跳信息交互情况,一旦NTB通道发生故障导致NAS心跳不通时,本文档来自技高网
...

【技术保护点】
1.一种存储双控防脑裂方法,其特征在于,包括:/n确认双控制器之间的NTB通道失效,调用当前节点fence资源向对端节点宿主机发送登录请求;/n确认所述登录请求无应答,向当前节点宿主机的守护进程发送socket连接;/n根据守护进程返回的宿主机集群状态定位故障节点,重启故障节点的NAS虚拟机。/n

【技术特征摘要】
1.一种存储双控防脑裂方法,其特征在于,包括:
确认双控制器之间的NTB通道失效,调用当前节点fence资源向对端节点宿主机发送登录请求;
确认所述登录请求无应答,向当前节点宿主机的守护进程发送socket连接;
根据守护进程返回的宿主机集群状态定位故障节点,重启故障节点的NAS虚拟机。


2.根据权利要求1所述的存储双控防脑裂方法,其特征在于,所述确认双控制器之间的NTB通道失效,包括:
获取双控控制组件返回的NAS心跳信号不通的信息,所述双控节点之间周期性交换NAS心跳信号,所述双控控制组件实时监控所述NAS心跳信号交换结果。


3.根据权利要求1所述的存储双控防脑裂方法,其特征在于,所述根据守护进程返回的宿主机集群状态定位故障节点,重启故障节点的NAS虚拟机,包括:
采集守护进程返回的第一节点宿主机状态和第二节点宿主机状态,所述第一节点和第二节点为双控两端节点;
将宿主机状态为非ACTIVE的节点确定为故障节点;
重启所述故障节点的NAS虚拟机。


4.一种存储双控防脑裂系统,其特征在于,包括:
失效确认单元,配置用于确认双控制器之间的NTB通道失效,调用当前节点fence资源向对端节点宿主机发送登录请求;
连接发送单...

【专利技术属性】
技术研发人员:戚勇吕玉彬李佩
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1