分布式文件系统监控器切换方法、装置、设备及存储介质制造方法及图纸

技术编号:20865693 阅读:18 留言:0更新日期:2019-04-17 09:12
本发明专利技术实施例公开了一种分布式文件系统的监控器切换方法、装置、设备及计算机可读存储介质。其中,方法包括当前监控器所在磁盘发生故障触发磁盘IO错误处理流程并同时触发条件变量,当前监控器接收到磁盘故障信号后,向分布式文件系统的其他各监控器发送磁盘故障信息以触发监控器进行选举,并向磁盘IO错误处理流程反馈信号量信息;磁盘IO错误处理流程接收到当前监控器反馈的信号量信息时结束等待,当前监控器进程退出。本申请可将监控器切换时间控制在毫秒级别,远小于监控器心跳时间,缩短了分布式集群故障时间,从而解决了相关技术中监控器所在磁盘故障后无法对外提供服务导致集群长时间异常的问题,极大提升了分布式集群系统出现故障的容错率。

【技术实现步骤摘要】
分布式文件系统监控器切换方法、装置、设备及存储介质
本专利技术实施例涉及分布式集群系统
,特别是涉及一种分布式文件系统的监控器切换方法、装置、设备及计算机可读存储介质。
技术介绍
随着云计算、大数据的快速发展,数据呈现爆炸式增长,单纯通过增加硬盘个数来扩展计算机文件系统的存储容量的方式,已经无法满足信息爆炸时代指数倍增长的数据的存储需求,分布式集群系统应用而生。分布式集群系统(DistributedFileSystem)为基于客户端/服务器模式的文件系统管理的物理存储资源,通过计算机网络与节点相连,可以有效解决数据的存储和管理难题。将固定于某个地点的某个文件系统,扩展到任意多个地点/多个文件系统,众多的节点组成一个文件系统网络。每个节点可以分布在不同的地点,通过网络进行节点间的通信和数据传输。用户在使用分布式集群系统时,无需关心数据是存储在哪个节点上、或者是从哪个节点从获取的,只需要像使用本地文件系统一样管理和存储文件系统中的数据。分布式文件系统集群运行时,监控器所在的磁盘故障后,磁盘IO错误,监控器数据读写错误,进程退出,该监控器停止服务。由于监控器直接需要议案进行数据同步,其他监控器会一直等待该监控器回响应,导致造成监控器业务卡主,进而集群出现故障直到其他监控器心跳超时,重新选举成功后,监控器对外提供服务,集群才能恢复正常由上可知,相关技术在监控器所在磁盘故障后,会出现一段时间的集群异常,这个时间依赖于监控器的超时时间,由于监控器任务繁重,超时时间通常设置较长,导致集群出现故障的时间就比较长。
技术实现思路
本公开实施例提供了一种分布式文件系统的监控器切换方法、装置、设备及计算机可读存储介质,解决了相关技术中监控器所在磁盘故障后无法对外提供服务导致集群长时间异常的问题。为解决上述技术问题,本专利技术实施例提供以下技术方案:本专利技术实施例一方面提供了一种分布式文件系统的监控器切换方法,包括:当接收到磁盘IO错误处理流程发送的磁盘故障信号,向分布式文件系统非当前监控器的其他各监控器发送磁盘故障信息以触发监控器进行选举,并向所述磁盘IO错误处理流程反馈信号量信息;当所述错误处理流程等待结束,退出进程;其中,所述磁盘IO错误处理流程为所述当前监控器所在磁盘发生故障时被触发并同时设置条件变量,所述条件变量与所述信号量信息相对应,用于控制所述磁盘IO错误处理流程的等待时间;所述磁盘IO错误处理流程在接收到所述信号量信息时结束等待。可选的,所述当前监控器读写数据出现错误,则判定所述当前监控器所在磁盘故障。可选的,所述磁盘故障信号为SIGINT信号。可选的,所述退出进程之前,还包括:判断是否接收到监控器选举成功的信息;若是,则退出进程;若否,则重新向所述当前监控器发送磁盘故障信号,以使所述当前监控器向分布式文件系统非所述当前监控器的其他各监控器发送磁盘故障信息以触发监控器选举。可选的,所述判断是否接收到监控器选举成功的信息为在预设时间段内判断是否接收到监控器选举成功的信息,所述预设时间段起始计时时间为所述磁盘故障信号发送时间。本专利技术实施例另一方面提供了一种分布式文件系统的监控器切换装置,包括:错误处理流程触发模块,用于当检测到当前监控器所在磁盘发生故障,触发磁盘IO错误处理流程;所述磁盘IO错误处理流程为所述当前监控器所在磁盘发生故障时被触发并同时设置条件变量,所述条件变量与所述信号量信息相对应,用于控制所述磁盘IO错误处理流程的等待时间;所述磁盘IO错误处理流程在接收到所述信号量信息时结束等待;磁盘故障信号发送模块,用于向当接收到磁盘IO错误处理流程发送的磁盘故障信号,向分布式文件系统非当前监控器的其他各监控器发送磁盘故障信息以触发进行监控器选举,并向所述磁盘IO错误处理流程反馈信号量信息;进程退出模块,用于当所述错误处理流程等待结束,退出进程。可选的,所述错误处理流程触发模块为当当前监控器读写数据出现错误,则判定所述当前监控器所在磁盘发生故障的模块。可选的,还包括磁盘故障信号处理结果检测模块,用于当预设时间段内未接收到监控器选举成功的信息,则重新向所述当前监控器发送磁盘故障信号,以使所述当前监控器向分布式文件系统非所述当前监控器的其他各监控器发送磁盘故障信息以触发监控器选举;所述预设时间段起始计时时间为所述磁盘故障信号发送时间。本专利技术实施例还提供了一种分布式文件系统的监控器切换设备,包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如前任一项所述分布式文件系统的监控器切换方法的步骤。本专利技术实施例最后还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有分布式文件系统的监控器切换程序,所述分布式文件系统的监控器切换程序被处理器执行时实现如前任一项所述分布式文件系统的监控器切换方法的步骤。本申请提供的技术方案的优点在于,在检测到监控器所在磁盘发生故障后,向监控器进程发送磁盘故障信号,监控器进程在收到该信号后,将磁盘故障信息发送给其他监控器,告知其他监控器开始选举,保证最短时间内监控器重新选举,可将监控器切换时间控制在毫秒级别,远小于监控器心跳时间,大大的缩短了分布式集群故障时间,从而解决了相关技术中监控器所在磁盘故障后无法对外提供服务导致集群长时间异常的问题,极大的提升了分布式集群系统出现故障的容错率,适用于对分布式集群系统磁盘故障后快速切换要求的业务场景,使得分布式集群系统的应用更加广泛。此外,本专利技术实施例还针对分布式文件系统的监控器切换方法提供了相应的实现装置、设备及计算机可读存储介质,进一步使得所述方法更具有实用性,所述装置、设备及计算机可读存储介质具有相应的优点。应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。附图说明为了更清楚的说明本专利技术实施例或相关技术的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种分布式文件系统的监控器切换方法的流程示意图;图2为本专利技术实施例提供的分布式文件系统的监控器切换装置的一种具体实施方式结构图;图3为本专利技术实施例提供的分布式文件系统的监控器切换装置的另一种具体实施方式结构图;图4为本专利技术实施例提供的分布式文件系统的监控器切换设备的一种具体实施方式结构图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面结合附图和具体实施方式对本专利技术作进一步的详细说明。显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等是用于区别不同的对象,而不是用于描述特定的顺序。此外术语“包括”和“具有”以及他们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。在介绍了本专利技术实施例的技术方案后,下面详细的说明本申请的各种非限制性实施方式。首先参本文档来自技高网
...

【技术保护点】
1.一种分布式文件系统的监控器切换方法,其特征在于,包括:当接收到磁盘IO错误处理流程发送的磁盘故障信号,向分布式文件系统非当前监控器的其他各监控器发送磁盘故障信息以触发监控器进行选举,并向所述磁盘IO错误处理流程反馈信号量信息;当所述错误处理流程等待结束,退出进程;其中,所述磁盘IO错误处理流程为所述当前监控器所在磁盘发生故障时被触发并同时设置条件变量,所述条件变量与所述信号量信息相对应,用于控制所述磁盘IO错误处理流程的等待时间;所述磁盘IO错误处理流程在接收到所述信号量信息时结束等待。

【技术特征摘要】
1.一种分布式文件系统的监控器切换方法,其特征在于,包括:当接收到磁盘IO错误处理流程发送的磁盘故障信号,向分布式文件系统非当前监控器的其他各监控器发送磁盘故障信息以触发监控器进行选举,并向所述磁盘IO错误处理流程反馈信号量信息;当所述错误处理流程等待结束,退出进程;其中,所述磁盘IO错误处理流程为所述当前监控器所在磁盘发生故障时被触发并同时设置条件变量,所述条件变量与所述信号量信息相对应,用于控制所述磁盘IO错误处理流程的等待时间;所述磁盘IO错误处理流程在接收到所述信号量信息时结束等待。2.根据权利要求1所述的分布式文件系统的监控器切换方法,其特征在于,所述当前监控器读写数据出现错误,则判定所述当前监控器所在磁盘故障。3.根据权利要求2所述的分布式文件系统的监控器切换方法,其特征在于,所述磁盘故障信号为SIGINT信号。4.根据权利要求1至3任意一项所述的分布式文件系统的监控器切换方法,其特征在于,所述退出进程之前,还包括:判断是否接收到监控器选举成功的信息;若是,则退出进程;若否,则重新向所述当前监控器发送磁盘故障信号,以使所述当前监控器向分布式文件系统非所述当前监控器的其他各监控器发送磁盘故障信息以触发监控器选举。5.根据权利要求4所述的分布式文件系统的监控器切换方法,其特征在于,所述判断是否接收到监控器选举成功的信息为在预设时间段内判断是否接收到监控器选举成功的信息,所述预设时间段起始计时时间为所述磁盘故障信号发送时间。6.一种分布式文件系统的监控器切换装置,其特征在于,包括:错误处理流程触发模块,用于当检测到当前监控器所在磁盘发生故障,触发磁盘IO错误处理...

【专利技术属性】
技术研发人员:李彦博
申请(专利权)人:浪潮电子信息产业股份有限公司
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1