This application discloses a storage system fault handling method, which is applied to a two-node data group storage cluster, including: determining the fault node and normal node when starting a fault handover; cutting off communication with the fault node and marking the fault node as a fault state; switching the data processing mode of the normal node to a direct writing mode; and brushing the buffered data in the normal node to magnetic field. Disk; Write new data to disk when receiving new data write notification; generate and return corresponding prompt information according to new data write situation. Through the above fault handling mechanism, which can switch to the above state when the storage system fails, not only can the security of the cached data be guaranteed, but also the business continuity be realized, which improves the stability of the storage system data and optimizes the storage experience. The application also discloses a storage system fault handling device, device and readable storage medium, all of which have the above beneficial effects.
【技术实现步骤摘要】
存储系统故障处理方法、装置、设备及可读存储介质
本申请涉及存储系统领域,特别涉及一种存储系统故障处理方法、装置、设备及计算机可读存储介质。
技术介绍
在大数据时代到来的今天,越来越多的存储系统被应用到数据存储中。庞大的存储集群中,节点故障的发生越来越频繁。为了数据的可靠性,存储集群通常采用可靠的数据恢复技术来实现数据的安全性。目前在存储集群双节点IO-GROUP下,当其中一个节点宕机离线时,则存储系统中无法实现对该IO-GROUP进行任何操作,即对该IO-GROUP存储业务中止,直至故障节点恢复。而在这种故障处理方法中不仅会耽误正常的节点进行业务处理,同时在故障节点进行故障恢复过程中容易出现缓存至内存的数据丢失的情况。因此,如何在不中断业务的情况下提高存储数据的稳定性,是本领域技术人员亟待解决的问题。
技术实现思路
本申请的目的是提供一种存储系统故障处理方法,该方法可以在不中断业务的情况下尽量保证缓存数据不丢失,从而提高存储数据的稳定性;本申请的另一目的是提供一种存储系统故障处理装置、设备及可读存储介质,均具有上述有益效果。为解决上述技术问题,本申请提供了一种存储系统 ...
【技术保护点】
1.一种存储系统故障处理方法,其特征在于,应用于双节点数据组存储集群,包括:当启动故障切换时,确定故障节点以及正常节点;切断与所述故障节点的通信,并将所述故障节点标记为故障状态;将所述正常节点的数据处理模式切换为直写模式;将所述正常节点中的缓存数据刷写至磁盘;当接收到新数据写入通知时,将所述新数据写入磁盘;根据所述新数据的写入情况生成并返回相应的提示信息。
【技术特征摘要】
1.一种存储系统故障处理方法,其特征在于,应用于双节点数据组存储集群,包括:当启动故障切换时,确定故障节点以及正常节点;切断与所述故障节点的通信,并将所述故障节点标记为故障状态;将所述正常节点的数据处理模式切换为直写模式;将所述正常节点中的缓存数据刷写至磁盘;当接收到新数据写入通知时,将所述新数据写入磁盘;根据所述新数据的写入情况生成并返回相应的提示信息。2.如权利要求1所述的存储系统故障处理方法,其特征在于,当接收到新数据写入通知时,将所述新数据写入磁盘,包括:当接收到数据写入时,判断是否存在未刷写的缓存数据;如果存在,将所述新数据加入队列;如果不存在,将所述新数据直写入磁盘。3.如权利要求2所述的存储系统故障处理方法,其特征在于,将所述新数据加入队列后,还包括:将所述新数据的标志位置为harden掉电恢复状态。4.如权利要求1所述的存储系统故障处理方法,其特征在于,当启动故障切换时,确定故障节点以及正常节点,包括:当启动故障切换时,获取集群状态信息;根据所述集群状态信息中节点状态确定正常节点以及故障节点。5.如权利要求1所述的存储系统故障处理方法,其特征在于,还包括:当接收到节点离线信息后,将队列的IO状态切换至QuiesceIO静默状态;当检测到无待刷写的缓存数据时,将队列的IO状态切换至activeIO正常状态。6.如权利要求1所述的存储系统故障...
【专利技术属性】
技术研发人员:柳增运,
申请(专利权)人:郑州云海信息技术有限公司,
类型:发明
国别省市:河南,41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。