【技术实现步骤摘要】
本专利技术涉及计算机领域,并且特别地,涉及一种。
技术介绍
为了保证分布式文件系统的高可靠性,对于分布式文件系统中的关键服务,如元数据服务、数据服务等,都需要通过冗余的方式来提高其可靠性。对于可靠性的实现方法,一般有两种(I)主备方式主节点进行系统服务,备份节点不工作,处于备份状态,一旦主节点出现故障,则将服务切换到备份节点,由备份节点提供服务,当故障节点修复完成之后,变成新的备份节点,等待后续切换;(2)热备模式在该模式下,正常情况下,高可靠组中间的所有节点都向外提供不同的服务,同时互为备份。当某一个节点出现故障时,高可靠组中的其他节点接管故障节点的服务。现有的高可用系统,一般支持双机高可用,通过两个节点之间的心跳消息判定节点故障并进行备份系统的切换。或采用多机均衡方式,该方式实现中存在一个前端节点,和多个后端服务节点,前端节点负责监控后端节点,并将服务请求转向到后端服务节点,后端服务节点定期向前端节点报告节点状态,并对传入的请求进行服务。多机机群方式,指多个节点组成一个高可靠性组,节点内部的某一个节点出现故障,系统内部的其他节点根据规则进行接管。现有的高可靠 ...
【技术保护点】
一种分布式文件系统的故障处理方法,其特征在于,所述故障处理方法包括:在分布式文件系统中存在故障节点的情况下,从所述分布式文件系统中的其他节点中选择备份节点;所述故障节点向所述备份节点发送接管请求,且所述故障节点进行重启;所述分布式文件系统对重启后的所述故障节点分配任务。
【技术特征摘要】
1.一种分布式文件系统的故障处理方法,其特征在于,所述故障处理方法包括在分布式文件系统中存在故障节点的情况下,从所述分布式文件系统中的其他节点中选择备份节点;所述故障节点向所述备份节点发送接管请求,且所述故障节点进行重启;所述分布式文件系统对重启后的所述故障节点分配任务。2.根据权利要求1所述的故障处理方法,其特征在于,进一步包括通过以下方式确定所述分布式文件系统中的节点是否出现故障在所述分布式文件系统中节点的监控进程在预定周期内未收到所述该节点的服务进程发送的心跳消息的情况下,所述分布式文件系统中的其他部分或全部节点向该节点发送待响应消息;如果该节点无法对来自其他节点的待响应消息进行响应,则确定该节点为故障节点。3.根据权利要求2所述的故障处理方法,其特征在于,进一步包括所述服务进程按预定周期向所述监控进程发送心跳消息;所述监控进程实时查询所述服务进程的心跳消息。4.根据权利要求1所述的故障处理方法,其特征在于,从所述分布式文件系统中的其他节点中选择备份节点包括选择所述分布式文件系统中负载最轻的节点作为备份节点接管所述故障节点的服务。5.根据权利要求1所述的故障处理方法,其特征在于,所述故障节点向所述备份节点发送接管请求包括所述故障节点的服务进程通过数据网络向所述分布式文件系统中的备份节点的服务进程发送接管请求。6.根...
【专利技术属性】
技术研发人员:张攀勇,苗艳超,赵力,
申请(专利权)人:曙光信息产业北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。