一种基于故障探测和路由策略的NFS高可用系统及方法技术方案

技术编号:37573218 阅读:18 留言:0更新日期:2023-05-15 07:50
本发明专利技术公开了一种基于故障探测和路由策略的NFS高可用系统及方法,通过建立建立特定用于NFS方式连接的子网;然后在当前NFS客户端节点上设置固定的NFS服务端节点虚拟IP;将NFS服务端节点虚拟IP路由至NFS服务端节点;实时检测NFS方式连接的连接状态和当前NFS服务端节点的运行状态,依据监控模块的检测结果,实时将出现故障的NFS方式连接的连接状态切换到正常的NFS服务端节点或将出现故障的NFS服务端节点切换到正常的NFS服务端节点。端节点切换到正常的NFS服务端节点。端节点切换到正常的NFS服务端节点。

【技术实现步骤摘要】
一种基于故障探测和路由策略的NFS高可用系统及方法


[0001]本专利技术涉及超融合存储数据处理领域,具体设计一种基于故障探测和路由策略的NFS高可用系统及方法。

技术介绍

[0002]在超融合基础架构中,计算负载(应用程序/虚拟机)与关联的数据在同一组物理服务器上。但是与传统的家用设备上应用程序仅使用设备直接连接的存储设备不同,超融合系统中并不将存储资源(硬盘或者AEP等新型存储介质)直接暴露给应用程序使用,而是先把整个超融合集群中所有存储资源池化,再提供虚拟存储服务(虚拟磁盘,虚拟文件系统等)交付应用程序使用。每个应用程序的访问的数据会有可能会分布在整个超融合系统的所有节点之上,在单个存储服务器或者单块磁盘等存储介质异常导致数据损失时可以从其他健康的磁盘或服务器中获取冗余/备份数据来重建损失的数据。
[0003]另外,在超融合基础架构中,超融合分布式存储集群将存储资源池化之后可以通过多种方式暴露给服务器主机,NFS就是其中一种。但是直接使用NFS有一些问题,最主要的问题是:NFS存在单点故障导致存储不可用的可能,也就是说NFS本身不具备高可用能力。
[0004]为解决这一问题,现有技术通常使用基于DNS的NFS高可用方案与基于VIP的NFS高可用方案,
[0005]常用的基于DNS的NFS高可用方案中,NFS客户端不再直接访问NFS服务端,而是通过一个域名来代理;域名能够映射到多个IP上,简单地轮询找出一个可用的NFS服务端,将NFS请求转移到对应服务端上;但需要维护多个NFS服务端来保证NFS的高可用,多个NFS服务端属于同一个集群,代表同一组数据。他们之间会同步数据。
[0006]基于VIP的NFS高可用方案工作流程与基于DNS的NFS高可用方案类似,客户端看到的还是一个唯一的VIP(虚拟IP)地址。VIP会在存储集群中保持高可用(即同一个时刻仅有一台主服务器持有这个VIP地址)。在主服务器异常之后,集群里的其他服务器会通过集群策略感知到,重新选举出一个新的主服务再自动配置好VIP对外提供服务。对客户端而言连接的始终都是这个VIP地址。
[0007]相比较与基于DNS的NFS高可用方案,基于VIP的高可用方案故障切换会更快一些(这是由于通常用于外部公共网络的DNS协议解析和探测所容忍的异常阈值从最初的设计目标上就要高于主要用于内部网络的IP协议以避免公共网络里常见的高延迟抖动引发不必要的异常切换)。但是这个方案中任一时刻VIP所映射到的NFS服务端是唯一的。所以传统的NFS高可用方案都存在单点问题,即任一时刻只有一个NFS服务端真正提供服务,其他NFS服务端只是热备份,但是不提供服务。这不利于充分发挥集群性能。

技术实现思路

[0008]本专利技术的目的在于提供一种基于故障探测和路由策略的NFS高可用系统及方法,解决了现有技术中指出的上述技术问题。
[0009]本专利技术提供了一种基于故障探测和路由策略的NFS高可用系统,包括分布式存储服务端集群、NFS系统、多个NFS客户端、监控模块;
[0010]所述分布式存储服务端集群,包括多个NFS服务端;
[0011]其中,所述NFS系统包括心跳模块、网络探测模块、故障探测模块;
[0012]其中,所述心跳模块,用于异步地每间隔变化的预设时间周期收集NFS方式连接的连接状态和当前NFS服务端节点的运行状态,然后将所述NFS方式连接的连接状态和当前NFS服务端节点的运行状态上报给监控模块;
[0013]所述网络探测模块,用于获取分布式存储集群的节点信息;然后向每个NFS服务端节点发送数据包来检查各个NFS服务端节点是否IP可访问的;
[0014]所述故障探测模块,用于根据所述IP可访问节点列表实时检测当前NFS服务端节点虚拟IP的目的地是否出现故障,若检测NFS服务端节点出现故障,则主动将NFS服务端虚拟IP根据IP可访问节点列表的排序切换到集群中下一个正常的NFS服务端节点上;同时,若NFS服务端节点恢复正常,则主动将NFS服务端的虚拟IP的连接切回到原NFS服务端节点;
[0015]所述NFS服务端分别通过NFS系统和NFS客户端实现连接;
[0016]所述NFS客户端,用于通过NFS系统向NFS服务端发送访问信号;
[0017]所述NFS服务端,用于通过NFS系统接收NFS客户端的访问信号,并对NFS客户端的访问信号做出访问信号反馈。
[0018]相应地,本专利技术提供了一种基于故障探测和路由策略的NFS高可用方法,包括如下操作步骤:
[0019]在当前所运行的服务器上建立特定用于NFS方式连接的子网,以确保当前NFS客户端与当前NFS服务端节点虚拟IP处于同一网段;然后在当前NFS客户端节点上设置固定的NFS服务端节点虚拟IP;
[0020]初始化当前分布式存储集群节点信息,记录所述分布式存储集群的IP信息,并记录分布式存储集群中的NFS服务端节点的IP信息;并将NFS服务端节点虚拟IP路由至当一个正常的NFS服务端节点;
[0021]异步地每间隔变化的预设时间周期收集NFS方式连接的连接状态和当前NFS服务端节点的运行状态,然后将所述NFS方式连接的连接状态和当前NFS服务端节点的运行状态上报给监控模块;
[0022]获取分布式存储集群的节点信息;然后向每个NFS服务端节点发送数据包来检查各个NFS服务端节点是否IP可访问的,选取其中IP可访问的NFS服务端,并根据NFS服务端的编号建立IP可访问节点列表;
[0023]根据所述IP可访问节点列表实时检测当前NFS服务端节点虚拟IP的目的地是否出现故障,若检测NFS服务端节点出现故障,则主动将NFS服务端虚拟IP根据IP可访问节点列表的排序切换到集群中下一个正常的NFS服务端节点上;同时,若NFS服务端节点恢复正常,则主动将NFS客户端的虚拟IP的连接切回到原NFS服务端节点。
[0024]优选的,作为一种可实施方式;所述分布式存储集群节点信息即为分布式存储服务端集群节点信息,所述分布式存储服务端集群节点信息包括服务端集群中所有的NFS服务端节点的属性信息。
[0025]优选的,作为一种可实施方式;所述故障探测模块根据所述IP可访问节点列表实
时检测当前NFS服务端节点虚拟IP的目的地是否出现故障,若检测NFS服务端节点出现故障,则主动将NFS服务端虚拟IP根据IP可访问节点列表的排序切换到集群中下一个正常的NFS服务端节点上;同时,若NFS服务端节点恢复正常,则主动将NFS客户端的虚拟IP的连接切回到原NFS服务端节点,具体包括如下步骤:
[0026]访问分布式存储服务端集群,更新分布式存储服务端集群中NFS服务端节点IP列表;
[0027]检查当前NFS服务端节点虚拟IP的连接配置是否已经配置,如果没有配置,则优先选择将虚拟IP路由至分布式存储NFS服务端集群里的任意的一个正常NFS服务端节点;如果选择的当前NFS服务端节点出现故障,则根据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于故障探测和路由策略的NFS高可用系统,包括分布式存储服务端集群、NFS系统、多个NFS客户端、监控模块;所述分布式存储服务端集群,包括多个NFS服务端;其中,所述NFS系统包括心跳模块、网络探测模块、故障探测模块;其中,所述心跳模块,用于异步地每间隔变化的预设时间周期收集NFS方式连接的连接状态和当前NFS服务端节点的运行状态,然后将所述NFS方式连接的连接状态和当前NFS服务端节点的运行状态上报给监控模块;所述网络探测模块,用于获取分布式存储集群的节点信息;然后向每个NFS服务端节点发送数据包来检查各个NFS服务端节点是否IP可访问的;所述故障探测模块,用于根据所述IP可访问节点列表实时检测当前NFS服务端节点是否出现故障,若检测NFS服务端节点出现故障,则主动将NFS服务端节点虚拟IP根据IP可访问节点列表的排序切换到集群中下一个正常的NFS服务端节点上;同时,若NFS服务端节点恢复正常,则主动将NFS服务端的虚拟IP的连接切回到原NFS服务端节点;所述NFS服务端分别通过NFS系统和NFS客户端实现连接;所述NFS客户端,用于通过NFS系统向NFS服务端发送访问信号;所述NFS服务端,用于通过NFS系统接收NFS客户端的访问信号,并对NFS客户端的访问信号做出访问信号反馈。2.一种基于故障探测和路由策略的NFS高可用方法,其特征在于,包括如下操作步骤:在当前所运行的服务器上建立特定用于NFS方式连接的子网,以确保当前NFS客户端与当前NFS服务端节点虚拟IP处于同一网段;然后在当前NFS客户端节点上设置固定的NFS服务端节点虚拟IP;初始化当前分布式存储集群节点信息,记录所述分布式存储集群的IP信息,并记录分布式存储集群中的NFS服务端节点的IP信息;并将NFS服务端节点虚拟IP路由至一个正常的NFS服务端节点;异步地每间隔变化的预设时间周期收集NFS方式连接的连接状态和当前NFS服务端节点的运行状态,然后将所述NFS方式连接的连接状态和当前NFS服务端节点的运行状态上报给监控模块;获取分布式存储集群的节点信息;然后向每个NFS服务端节点发送数据包来检查各个NFS服务端节点是否IP可访问的,选取其中IP可访问的NFS服务端,并根据NF...

【专利技术属性】
技术研发人员:陈奇徐文豪王弘毅张凯
申请(专利权)人:北京志凌海纳科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1