分布式文件系统的故障处理方法及相关设备技术方案

技术编号:19778404 阅读:38 留言:0更新日期:2018-12-15 11:20
本申请实施例公开了一种分布式文件系统的故障处理方法及相关设备,该分布式文件系统中包含有至少一个监控服务Mon,用于提高了故障定位的效率。本申请实施例方法包括:获取所述至少一个Mon中各个Mon的状态信息,所述状态信息用于描述Mon在运行过程中产生的各种属性信息;根据所述状态信息,判断所述各个Mon中是否存在预设故障类型的目标Mon;若存在所述预设故障类型的目标Mon,执行与所述预设故障类型对应的故障处理程序。

【技术实现步骤摘要】
分布式文件系统的故障处理方法及相关设备
本申请涉及文件系统领域,尤其涉及一种分布式文件系统的故障处理方法及相关设备。
技术介绍
计算机通过文件系统管理和存储数据,而信息爆炸时代中,由于可以获取到的数据成指数倍的增长,单纯通过增加硬盘个数来扩展计算机文件系统的存储容量的方式,在数据存储和管理方面的表现都差强人意。分布式文件系统可以有效解决上述问题:将固定于某个地点的某个文件系统,扩展到任意多个地点/多个文件系统,众多的存储节点组成一个文件系统网络。每个存储节点可以分布在不同的地点,通过网络进行存储节点间的通信和数据传输。在分布式文件系统中配置有监控服务(monitor,Mon),Mon用于监控分布式文件系统的状态,同时辅助维护状态的变化。Mon采用集群模式,每个存储节点上都配置有Mon,为了保证Mon无单点故障,需要保证Mon的数量为奇数,在部署2×N+1个Mon时,系统最多允许N个Mon同时出现故障。在现有技术提供的文件系统中,当集群中某一Mon出现故障时,需要由现场人员向研发人员描述从故障开始的各个操作,再逐个排除导致故障的各个操作,最终经过测试复现故障状态,才能获知故障原因,上述本文档来自技高网...

【技术保护点】
1.一种分布式文件系统的故障处理方法,其特征在于,所述分布式文件系统中包含有至少一个监控服务Mon,所述方法包括:获取所述至少一个Mon中各个Mon的状态信息,所述状态信息用于描述Mon在运行过程中产生的各种属性信息;根据所述状态信息,判断所述各个Mon中是否存在预设故障类型的目标Mon;若存在所述预设故障类型的目标Mon,执行与所述预设故障类型对应的故障处理程序。

【技术特征摘要】
1.一种分布式文件系统的故障处理方法,其特征在于,所述分布式文件系统中包含有至少一个监控服务Mon,所述方法包括:获取所述至少一个Mon中各个Mon的状态信息,所述状态信息用于描述Mon在运行过程中产生的各种属性信息;根据所述状态信息,判断所述各个Mon中是否存在预设故障类型的目标Mon;若存在所述预设故障类型的目标Mon,执行与所述预设故障类型对应的故障处理程序。2.根据权利要求1所述的方法,其特征在于,所述状态信息包括时钟迟延,所述预设故障类型包括时钟漂移,所述目标Mon包括第一Mon,所述判断所述各个Mon中是否存在预设故障类型的目标Mon包括:判断所述各个Mon中是否存在所述时钟迟延超过预设阈值的所述第一Mon;若存在,则确定存在所述时钟漂移的所述第一Mon;所述执行与所述预设故障类型对应的故障处理程序包括:关闭所述第一Mon所在的所述分布式文件系统的防火墙;对所述各个Mon设置时钟同步。3.根据权利要求1所述的方法,其特征在于,所述状态信息包括运行状态,所述故障类型包括Mon震荡,所述目标Mon包括第二Mon,所述判断所述各个Mon中是否存在预设故障类型的目标Mon包括:在预设时长内,判断所述各个Mon中是否存在所述运行状态的切换次数超过预设阈值的所述第二Mon;若存在,则确定存在所述Mon震荡的所述第二Mon;所述执行与所述预设故障类型对应的故障处理程序包括:将与所述第二Mon对应的部署目录修改为与第一固态硬盘对应的部署目录;修改所述第二Mon的心跳检测频率。4.根据权利要求1所述的方法,其特征在于,所述状态信息包括运行状态,所述故障类型包括Mon停止,所述目标Mon包括第三Mon,所述判断所述各个Mon中是否存在预设故障类型的目标Mon包括:判断所述各个Mon中是否存在所述运行状态为停止的时长超过预设阈值的所述第三Mon;若存在,则确定存在所述Mon停止的所述第三Mon;所述执行与所述预设故障类型对应的故障处理程序包括:获取所述第三Mon监控的存储节点;删除所述第三Mon;在所述存储节点上...

【专利技术属性】
技术研发人员:徐晓阳
申请(专利权)人:郑州云海信息技术有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1