一种存储系统的故障处理方法及装置制造方法及图纸

技术编号:15690729 阅读:88 留言:0更新日期:2017-06-24 03:21
本发明专利技术公开了一种存储系统的故障处理方法及装置,对存储系统采用基于Sanlock的管理机制,根据Sanlock提供的不同的锁失效管理策略,将存储系统的不同故障信息,划分成不同等级的故障类型,并利用Sanlock的租约,分别对各等级的故障类型进行隔离,与此同时,针对不同等级的故障类型提供相对应的处理措施。因此,本发明专利技术针对存储系统可能出现的故障提供了一个完整的解决方案,从而大大提高了整个虚拟化系统的稳定性。

Fault processing method and device for storage system

The invention discloses a fault processing method and device of a storage system, the storage system adopts the management mechanism based on Sanlock, according to the different lock failure management strategy of Sanlock provided by the storage system of different fault information, fault type is divided into different levels, and the use of Sanlock agreement, the fault type for each grade were isolated at the same time, provides corresponding measures for different fault types level. Therefore, the invention provides a complete solution for the possible failure of the storage system, thereby greatly improving the stability of the entire virtualization system.

【技术实现步骤摘要】
一种存储系统的故障处理方法及装置
本专利技术涉及计算机应用
,更具体的说,涉及一种存储系统的故障处理方法及装置。
技术介绍
共享存储作为目前企业虚拟化软件中的主流存储方式,它的主要职责是为虚拟机和上层业务提供数据支撑。目前的共享存储通常由存储系统进行管理,因此,存储系统的稳定性直接关系到整个虚拟化系统的稳定性。若存储系统发生故障,如服务器故障或各种设备故障,则会造成系统服务中断,从而造成客户的流失和企业收入的损失。然而,针对存储系统出现的故障,目前市场上的开源软件及商业软件尚无完善的解决方案。
技术实现思路
有鉴于此,本专利技术公开了一种存储系统的故障处理方法及装置,以解决目前针对存储系统出现的故障,市场上的开源软件及商业软件尚无完善的解决方案的问题。一种存储系统的故障处理方法,包括:采集存储系统的不同故障信息,其中,所述存储系统采用基于Sanlock的管理机制;根据Sanlock提供的不同的锁失效管理策略,将所述不同故障信息划分成不同等级的故障类型;利用Sanlock的租约,分别对各等级的故障类型进行隔离,并针对不同等级的故障类型提供相对应的处理措施,其中,所述租约包括:delt本文档来自技高网...
一种存储系统的故障处理方法及装置

【技术保护点】
一种存储系统的故障处理方法,其特征在于,包括:采集存储系统的不同故障信息,其中,所述存储系统采用基于Sanlock的管理机制;根据Sanlock提供的不同的锁失效管理策略,将所述不同故障信息划分成不同等级的故障类型;利用Sanlock的租约,分别对各等级的故障类型进行隔离,并针对不同等级的故障类型提供相对应的处理措施,其中,所述租约包括:delta lease和paxos lease。

【技术特征摘要】
1.一种存储系统的故障处理方法,其特征在于,包括:采集存储系统的不同故障信息,其中,所述存储系统采用基于Sanlock的管理机制;根据Sanlock提供的不同的锁失效管理策略,将所述不同故障信息划分成不同等级的故障类型;利用Sanlock的租约,分别对各等级的故障类型进行隔离,并针对不同等级的故障类型提供相对应的处理措施,其中,所述租约包括:deltalease和paxoslease。2.根据权利要求1所述的故障处理方法,其特征在于,所述根据Sanlock提供的不同的锁失效管理策略,将所述不同故障信息划分成不同等级的故障类型包括:根据Sanlock提供的不同的锁失效管理策略,将所述不同故障信息划分成六种等级的故障类型,按照等级从低到高的顺序,依次包括:第一等级,所述第一等级对应的故障类型包括:存储瞬时的链路颠簸;第二等级,所述第二等级对应的故障类型包括:进程短期更新时间戳失败;第三等级,所述第三等级对应的故障类型包括:进程长期更新时间戳失败;第四等级,所述第四等级对应的故障类型包括:存储短期离线;第五等级,所述第五等级对应的故障类型包括:存储长期离线;第六等级,所述第六等级对应的故障类型包括:数据无法完全清理。3.根据权利要求2所述的故障处理方法,其特征在于,当所述存储系统发生所述第一等级对应的故障类型时,处理措施包括:切换路径避免业务中断;或当存储上层的虚拟机业务不均衡时,配置负载均衡。4.根据权利要求2所述的故障处理方法,其特征在于,当所述存储系统发生所述第二等级对应的故障类型或所述第三等级对应的故障类型时,利用Sanlock的租约的处理措施包括:控制虚拟机通过Sanlock代理模块申请一个paxoslease;将锁的相关信息记录在共享存储中与所述虚拟机对应的锁空间上;启动deltalease来定时更新时间戳;判断新申请的paxoslease未更新时间戳的时间是否大于第一预设时间;若所述新申请的paxoslease未更新时间戳的时间不大于所述第一预设时间,则定义所述虚拟机的当前状态为有效状态;若所述新申请的paxoslease未更新时间戳的时间大于所述第一预设时间,同时小于第二预设时间,则监控模块定义当前故障类型为第二等级,并调用Sanlock的控制清理功能恢复所述新申请的paxoslease;其中,所述第二预设时间大于所述第一预设时间。5.根据权利要求4所述的故障处理方法,其特征在于,还包括:若所述新申请的paxoslease未更新时间戳的时间不小于所述第二预设时间,则定义当前故障类型为第三等级,并调用清理模块中的强制清理功能,强制关闭所述虚拟机。6.根据权利要求2所述的故障处理方法,其特征在于,当所述存储系统...

【专利技术属性】
技术研发人员:方浩
申请(专利权)人:郑州云海信息技术有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1