A method of handling lock server fault in distributed system, which includes m lock server in distributed system, each lock server locally has the same lock server connection information, and M is a natural number of more than 2. The non fault lock server in the distributed system receives the first notification message, the first notification message carries the information of the failure of the first lock server; the second lock server receives the first notification message and takes over the relationship information according to the local stored lock server, and determines that it is the first lock server's takeover lock. The server enters the silent state; the third lock server receives the first notification message and takes over the local storage lock server to take over the relationship information, determines that it is not the first lock server's takeover lock server; the third lock server receives the lock request and asks for the distribution of the lock permission information according to the lock. The invention can minimize the range affected by the failure of the lock server and improve the stability of the distributed system.
【技术实现步骤摘要】
分布式系统中锁服务器故障的处理方法及其系统
本专利技术涉及存储技术,尤其是涉及一种分布式系统中的锁服务器(master)故障的处理方法及其系统。
技术介绍
NAS(NetworkAttachedStorage,网络附属存储)系统以其简单、高效和易管理等特点,广泛应用于企业文件分布式系统中的共享,其典型组网附图1所示。在NAS系统中,同一文件可以接收不同的应用主机发送的读写请求,为了避免读写冲突,当一个文件接收到某个应用主机的读写请求时,节点设备中的锁服务器需要把当前文件加锁(锁权限),用于实现共享资源的并发互斥访问。当读写操作结束后,释放该文件。锁权限信息与应用主机之间的对应关系,可以存储在各节点中,也可以存储在一个共享存储中。共享存储独立于各节点,且各节点均可访问,在附图1中未示出。近来,伴随虚拟化技术的发展,VDI(VirtualDesktopInfrastructure,虚拟桌面基础架构)、Oracle数据库和SQLServer(StructuredQueryLanguage,结构化查询语言)数据库平台等应用也开始部署到分布式系统中,从而对分布式系统的可靠性提出更高的要求。当分布式系统中的某个节点设备发生故障后,NAS系统会采用节点设备IPFailover(IP漂移)的方式,将发生故障的节点设备的IP地址配置到其他的节点设备上,增强NAS系统的可靠性。这些切换对各应用主机来讲是透明,即各应用主机感知不到NAS系统中各节点设备的IP漂移,从而减少对应用主机中各应用的影响。NFS(NetworkFileSystem,网络文件系统)V3是目前应用最久、最多 ...
【技术保护点】
一种分布式系统中锁服务器故障处理方法,其特征在于,所述分布式系统中包括至少三个锁服务器,所述方法包括:当所述分布式系统中的第一锁服务器发生故障时,所述分布式系统中的第二锁服务器和所述分布式系统中的第三锁服务器分别确定自己是否为所述第一锁服务器的接管锁服务器;所述第三锁服务器确定自己不是所述第一锁服务器的接管锁服务器时,所述第三锁服务器用于处理加锁请求;所述第二锁服务器确定自己为所述第一锁服务器的接管锁服务器时,进入静默状态,进入所述静默状态之后,所述接管锁服务器用于处理锁重申请求,不用于处理加锁请求。
【技术特征摘要】
1.一种分布式系统中锁服务器故障处理方法,其特征在于,所述分布式系统中包括至少三个锁服务器,所述方法包括:当所述分布式系统中的第一锁服务器发生故障时,所述分布式系统中的第二锁服务器和所述分布式系统中的第三锁服务器分别确定自己是否为所述第一锁服务器的接管锁服务器;所述第三锁服务器确定自己不是所述第一锁服务器的接管锁服务器时,所述第三锁服务器用于处理加锁请求;所述第二锁服务器确定自己为所述第一锁服务器的接管锁服务器时,进入静默状态,进入所述静默状态之后,所述接管锁服务器用于处理锁重申请求,不用于处理加锁请求。2.根据权利要求1所述的方法,其特征在于,还包括:所述接管锁服务器接收到锁重申请求时,根据锁权限信息表返回对应的锁权限信息;所述接管锁服务器接收到加锁请求时,返回拒绝的响应消息。3.根据权利要求1或2所述的方法,其特征在于,所述分布式系统中还包括至少三个协议服务器和相应的锁代理,所述协议服务器和相应的锁代理位于同一节点设备中,所述方法还包括:当所述协议服务器接收到锁请求后,将所述锁请求发送给的相应的锁代理,所述锁请求为锁重申请求或加锁请求。4.根据权利要求3所述的方法,其特征在于,所述每个锁代理本地存储有锁服务器接管关系信息和锁服务器管理范围信息,所述方法还包括:所述锁代理接收到锁请求后,根据本地存储的锁服务器管理范围信息确定处理所述锁请求的锁服务器;若所述锁服务器管理范围信息中确定出的处理所述锁请求的锁服务器标识为故障状态,所述锁代理根据本地存储的锁服务器接管关系信息确定所述故障状态的锁服务器的接管锁服务器;将接收到的锁请求发送给所述接管锁服务器。5.根据权利要求4所述的方法,其特征在于,所述第三锁服务器中保存有所述锁服务器接管关系信息,所述锁服务器接管关系信息通过一致性哈希环来确定,所述第三锁服务器确定自己不是所述第一锁服务器的接管锁服务器具体为:所述第三锁服务器按照本地存储的一致性哈希环的顺时针方向或者逆时针方向确定自己不是所述第一锁服务器的接管锁服务器。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:所述第三锁服务器将本地存储的一致性哈希环中的所述第一锁服务器标识为故障状态;到达预定的时间后,更新本地存储的所述一致性哈希环,所述更新后的一致性哈希环中不包括所述第一锁服务器。7.根据权利要求5-6任一所述的方法,其特征在于,所述每个锁代理本地存储有所述锁服务器接管关系信息和锁服务器管理范围信息,所述锁服务器管理范围信息和所述锁服务器接管关系信息通过所述一致性哈希环来确定;所述锁代理接收到锁请求后,按照本地存储的一致性哈希环的顺时针方向或者逆时针方向确定处理所述锁请求的锁服务器;若所述本地存储的一致性哈希环中的所述处理所述锁请求的锁服务器标识为故障状态;所述锁代理按照本地存储的一致性哈希环的同样的方向确定所述处理所述锁请求的锁服务器的接管锁服务器。8.根据权利要求7所述的方法,其特征在于,还包括:所述锁代理将本地存储的一致性哈希环中的所述第一锁服务器标识为故障状态;到达预定的时间后,更新本地存储的一致性哈希环,所述更新后的一致性哈希环中不包括所述第一锁服务器。9.根据权利要求7所述的方法,其特征在于,还包括:所述第三锁服务器接收第一通知消息,更新本地存储的一致性哈希环,所述更新后的一致性哈希环中不包括所述第一锁服务器,其中所述第一通知消息用于通知锁服务器更新本地存储的一致性哈希环,所述第一通知消息中携带所述第一锁服务器的信息;所述锁代理接收所述第一通知消息,更新本地存储的一致性哈希环,所述更新后的一致性哈希环中不包括所述第一锁服务器。10.根据权利要求7所述的方法,其特征在于,还包括:所述第三锁服务器接收第二通知消息,更新本地存储的一致性哈希环,更新后的一致性哈希环中包含了新加入的锁服务器;其中所述第二通知消息用于通知锁服务器更新本地存储的一致性哈希环,所述第二通知消息中携带新加入的锁服务器的信息;所述锁代理接收所述第二通知消息;更新本地存储的一致性哈希环,更新后的一致性哈希环中包含了新加入的锁服务器。11.一种实现锁服务器故障处理的分布式系统,其特征在于,包括至少三个锁服务器;当所述分布式系统中的第一锁服务器发生故障时,第三锁服务器用于确定自己是否为所述第一锁服务器的接管锁服务器;所述第三锁服务器还用于确定自己不是所述第一锁服务器的接管锁服务器时,所述第三锁服务器用于处理加锁请求;第二锁服务器用于确定自己是否为所述第一锁服务器的接管锁服务器;所述第二锁服务器还用于确定自己为所述第一锁服务器的接管锁服务器时进入静默状态,进入所述静默状态之后,所述接管锁服务器用于处理锁重申请求,不用于处理加锁请求。12.根据权利要求11所述的系统,其特征在于,还包括,所述接管锁服务器用于:接收到锁重申请求时,根据锁权限信息表返回对应的锁权限信息;接收到加锁请求时,返回拒绝的响应消息。13.根据权利要求11或12所述的系统,其特征在于,所述分布式系统中还包括至少三个协议服务器和锁代理,其中,所述协议服务器和对应的锁代理位于一个节点设备中,所述系统还包括:所述协议服务器用于接收到锁请求后,将所述锁请求发送给对应的锁代理,所述锁请求为锁重申请求或加锁请求。14.根据权利要求13所述的系统,其特征在于,所述每个...
【专利技术属性】
技术研发人员:冯锐,刘军,向光友,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。