【技术实现步骤摘要】
一种分布式文件系统的故障诊断方法、装置、设备及介质
[0001]本专利技术涉及分布式存储
,特别是涉及一种分布式文件系统的故障诊断方法、装置、设备及计算机可读存储介质。
技术介绍
[0002]分布式存储系统中的IO栈比较复杂,从主机到网络再到存储,并且在存储内部又存在多种服务,例如有前端接入文件协议处理、元数据管理、落盘管理等各种服务。当现场出现问题之后,很难快速定位到具体的故障原因,现有技术中通常需要依托专业的售后服务团队,工程师通过远程或者到客户现场进行故障排查,不仅需要消耗大量的人力,而且导致故障修复时间较长,影响系统可靠性。
[0003]鉴于此,如何缩短故障修复时间,提高故障诊断效率及系统可靠性成为本领域技术人员需要解决的问题。
技术实现思路
[0004]本专利技术实施例的目的是提供一种分布式文件系统的故障诊断方法、装置、设备及计算机可读存储介质,在使用过程中能够实现自动对故障进行诊断定位,不仅节约人力,还有利于缩短故障修复时间,提高系统可靠性。
[0005]为解决上述技术问题, ...
【技术保护点】
【技术特征摘要】
1.一种分布式文件系统的故障诊断方法,其特征在于,包括:采集分布式文件系统中各节点的数据信息,所述数据信息包括质量指标信息和日志信息;根据各个所述数据信息判断所述分布式文件系统是否发生故障,若是,则依据预先建立的故障诊断规则对所述数据信息及所述分布式文件系统的当前状态信息进行分析,得到故障分析结果。2.根据权利要求1所述的分布式文件系统的故障诊断方法,其特征在于,所述根据各个所述数据信息判断所述分布式文件系统是否发生故障的过程为:根据各个所述质量指标信息提取出所述分布式存储系统对外提供服务的整体时延;判断所述整体时延是否大于预设时延阈值,若是,则发生故障。3.根据权利要求1所述的分布式文件系统的故障诊断方法,其特征在于,所述依据预先建立的故障诊断规则对所述数据信息及所述分布式文件系统的当前状态信息进行分析,得到故障分析结果的过程为:从主节点上查看所述分布式文件系统的整体状态,并在确定出所述整体状态为故障状态时,获取对应的故障节点信息及故障模块信息;依据所述故障节点信息从各个所述数据信息中获取对应的目标数据信息,并采集对应的故障节点的实时状态信息;依据预先建立的故障诊断规则对所述故障节点信息、所述故障模块信息、所述目标数据信息及所述实时状态信息进行分析,得到故障分析结果。4.根据权利要求3所述的分布式文件系统的故障诊断方法,其特征在于,所述依据预先建立的故障诊断规则对所述故障节点信息、所述故障模块信息、所述目标数据信息及所述实时状态信息进行分析,得到故障分析结果的过程为:预先建立与每类模块各自对应的故障诊断规则组,所述故障诊断规则组包括与所述模型对应的各个组件的故障类型及与每个所述故障类型各自对应的故障诊断标准;依据所述故障模块信息从预先建立的故障诊断规则组中匹配出对应的目标故障诊断规则组;依据所述目标数据信息及所述实时状态信息从所述目标故障诊断规则组中确定出目标故障组件的组件信息及故障信息;依据所述目标故障组件的组件信息、所述故障信息、所述故障节点信息和所述故障模...
【专利技术属性】
技术研发人员:梁鑫辉,王团结,李强,苏楠,
申请(专利权)人:浪潮电子信息产业股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。