分布式数据系统失效检测处理方法及装置制造方法及图纸

技术编号:13638443 阅读:57 留言:0更新日期:2016-09-03 03:38
本发明专利技术公开了一种分布式数据系统失效检测处理方法和装置,该方法包括:控制各个数据节点每间隔预设周期向周边数据节点广播响应消息,以供各个数据节点基于接收的响应消息更新自存的邻接状态表;定期获取一个或多个数据节点当前的邻接状态表,将获取当前的邻接状态表作为参考表;对参考表进行分析,将消息计数值在预设时长未变动的节点标识所对应的数据节点作为失效数据节点。本发明专利技术通过让分布式数据系统的维护人员及时了解到哪些数据节点失效,以利于维护人员及时采取措施,进而避免因过多的数据节点失效而导致数据不能正常访问,提高了分布式数据系统数据的可靠性。

【技术实现步骤摘要】

本专利技术涉及分布式数据系统
,尤其涉及一种分布式数据系统失效检测处理方法及装置
技术介绍
随着信息化的深入开展,各行各业的业务系统所产生的数据越来越多,由于传统的集中式数据系统方案(集中式数据系统是指为待存储的数据制定一个特定的存取区域,将所有数据都存取在该存取区域中)将所有的数据均存在数据中心主机上以供集中提取数据,若数据中心主机出故障,则整个系统无法存储和提取数据,即集中式数据系统方案相较于分布式数据系统方案,数据稳定性较低,故而分布式数据系统应运而生。特别是近年来,网络分布式数据系统存储方案已经成为存储技术发展的新趋势。分布式数据系统是构建大规模的分布式存储系统必不可少的组成部分。由于数据是分布存储在不同数据节点上的,即使某几个数据节点失效不可用时,由于这些数据在其他数据节点上依然存在,所以访问节点依然可以正常访问数据,这就提供了数据的高可靠性。虽然数据在其它数据节点上有备份存储,但是当失效的数据节点不断的累积增加时,可能会导致数据的丢失,进而导致数据不能正常访问,分布式文件存储系统失效不可用,导致分布式数据系统的数据不可靠。
技术实现思路
本专利技术的主要目的在于提供一种分布式数据系统失效检测处理方法及装置,旨在解决因数据节点失效而导致分布式数据系统的数据不可靠的技术问题。为实现上述目的,本专利技术提供的一种分布式数据系统失效检测处理方法,所述分布式数据系统包括多个存储数据的数据节点,每个数据节点存有邻接状态表,所述邻接状态表包括各个数据节点的节点标识以及各个数据节点对应的消息计数值,所述分布式数据系统失效检测处理方法包括:控制各个数据节点每间隔预设周期向周边数据节点广播响应消息,以供各个数据节点基于接收的响应消息更新自存的邻接状态表;定期获取一个或多个数据节点当前的邻接状态表,将获取当前的邻接状态表作为参考表;对所述参考表进行分析,将消息计数值在预设时长未变动的节点标识所对应的数据节点作为失效数据节点。优选地,在所述对所述参考表进行分析,将消息计数值在预设时长未变动的节点标识所对应的数据节点作为失效数据节点的步骤之后还包括:统计分布式数据系统中失效数据节点的数量;在分布式数据系统中所述失效数据节点的数量大于第一阈值时,确定所述分布式系统失效。优选地,所述统计分布式数据系统中失效数据节点的数量的步骤之后还包括:在分布式数据系统中所述失效数据节点的数量小于第二阈值时,确定所述分布式系统有效,其中第二阈值小于或等于第一阈值。优选地,在所述对所述参考表进行分析,将消息计数值在预设时长未变动的节点标识所对应的数据节点作为失效数据节点的步骤之后还包括:使用预存的正确程序内容对所述失效数据节点的程序内容进行数据修复;若检测到失效数据节点基于进行数据修复后的程序广播的响应消息,则判定所述失效数据节点发生软件失效,输出第一事件提示。优选地,所述使用预存的正确程序内容对所述失效数据节点的程序内容进行数据修复的步骤之后还包括:若未检测到失效数据节点基于进行数据修复后的程序广播的响应消息,则复位重启所述失效数据节点;若检测到复位重启后的失效数据节点广播的响应消息,则判定所述失效数据节点发生软件失效,输出第一事件提示;若未检测到复位重启后的失效数据节点广播的响应消息,则判定所述失效数据节点发生硬件失效,输出第二事件提示。本专利技术还提供一种分布式数据系统失效检测处理装置,所述分布式数据系统包括多个存储数据的数据节点,每个数据节点存有邻接状态表,所述邻接状态表包括各个数据节点的节点标识以及各个数据节点对应的消息计数值,所述分布式数据系统失效检测处理装置包括:控制模块,用于控制各个数据节点每间隔预设周期向周边数据节点广播响应消息,以供各个数据节点基于接收的响应消息更新自存的邻接状态表;获取模块,用于定期获取一个或多个数据节点当前的邻接状态表,将获取当前的邻接状态表作为参考表;分析模块,用于对所述参考表进行分析,将消息计数值在预设时长未变动的节点标识所对应的数据节点作为失效数据节点。优选地,所述分布式数据系统失效检测处理装置还包括:统计模块,用于统计分布式数据系统中失效数据节点的数量;系统确定模块,用于在分布式数据系统中所述失效数据节点的数量大于第一阈值时,确定所述分布式系统失效。优选地,所述系统确定模块还用于:在分布式数据系统中所述失效数据节点的数量小于第二阈值时,确定所述分布式系统有效,其中第二阈值小于或等于第一阈值。优选地,所述分布式数据系统失效检测处理装置还包括:软件修复模块,用于使用预存的正确程序内容对所述失效数据节点的程序内容进行数据修复;第一输出模块,用于在检测到失效数据节点基于进行数据修复后的程序广播的响应消息时,判定所述失效数据节点发生软件失效,输出第一事件提示。优选地,所述分布式数据系统失效检测处理装置还包括硬件修复模块和第二输出模块,所述硬件修复模块,用于在未检测到失效数据节点基于进行数据修复后的程序广播的响应消息时,复位重启所述失效数据节点;所述第二输出模块用于:在检测到复位重启后的失效数据节点广播的响应消息时,判定所述失效数据节点发生软件失效,输出第一事件提示;在未检测到复位重启后的失效数据节点广播的响应消息时,判定所述失效数据节点发生硬件失效,输出第二事件提示。本专利技术通过在分布式数据系统启动时,控制各个数据节点每间隔预设周期向周边数据节点广播响应消息,以供各个数据节点基于接收的响应消息更新自存的邻接状态表;然后定期获取一个或多个数据节点当前的邻接状态表,将获取当前的邻接状态表作为参考表;再对参考表进行分析,将消息计数值在预设时长未变动的节点标识所对应的数据节点作为失效数据节点,从而通过对参考表中消息计数值的变化状况,并根据数据节点若预设时长未广播响应消息,则判定失效的判断规则,推测各个数据节点的运行情况,从而确定分布式数据系统当前的失效数据节点,让分布式数据系统的维护人员及时了解到哪些数据节点失效,以利于维护人员及时采取措施,进而避免因过多的数据节点失效而导致数据不能正常访问,提高了分布式数据系统数据的可靠性,也减少了维护人员查询、确认失效节点的工作量。附图说明图1为本专利技术分布式数据系统失效检测处理方法第一实施例的流程示意图;图2为本专利技术分布式数据系统失效检测处理方法第二实施例的流程示意图;图3为本专利技术分布式数据系统失效检测处理方法第三实施例的流程示意图;图4为本专利技术分布式数据系统失效检测处理方法第四实施例的流程示意图;图5为本专利技术分布式数据系统失效检测处理方法第五实施例的流程示意图;图6为本专利技术分布式数据系统失效检测处理装置第一实施例的功能模块示意图;图7为本专利技术分布式数据系统失效检测处理装置第二实施例的功能模块示意图;图8为本专利技术分布式数据系统失效检测处理装置第三实施例的功能模块示意图;图9为本专利技术分布式数据系统失效检测处理装置第四实施例的功能模块示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。本专利技术提供一种分布式数据系统失效检测处理方法(以下简称失效检测处理方法),在本专利技术失效检测处理方法的第一实施例中,参照图1,分布式数据系统包括多个存储数据的数据节点,每个数据节点存有邻本文档来自技高网...

【技术保护点】
一种分布式数据系统失效检测处理方法,其特征在于,所述分布式数据系统包括多个存储数据的数据节点,每个数据节点存有邻接状态表,所述邻接状态表包括各个数据节点的节点标识以及各个数据节点对应的消息计数值,所述分布式数据系统失效检测处理方法包括:控制各个数据节点每间隔预设周期向周边数据节点广播响应消息,以供各个数据节点基于接收的响应消息更新自存的邻接状态表;定期获取一个或多个数据节点当前的邻接状态表,将获取当前的邻接状态表作为参考表;对所述参考表进行分析,将消息计数值在预设时长未变动的节点标识所对应的数据节点作为失效数据节点。

【技术特征摘要】
1.一种分布式数据系统失效检测处理方法,其特征在于,所述分布式数据系统包括多个存储数据的数据节点,每个数据节点存有邻接状态表,所述邻接状态表包括各个数据节点的节点标识以及各个数据节点对应的消息计数值,所述分布式数据系统失效检测处理方法包括:控制各个数据节点每间隔预设周期向周边数据节点广播响应消息,以供各个数据节点基于接收的响应消息更新自存的邻接状态表;定期获取一个或多个数据节点当前的邻接状态表,将获取当前的邻接状态表作为参考表;对所述参考表进行分析,将消息计数值在预设时长未变动的节点标识所对应的数据节点作为失效数据节点。2.如权利要求1所述的分布式数据系统失效检测处理方法,其特征在于,在所述对所述参考表进行分析,将消息计数值在预设时长未变动的节点标识所对应的数据节点作为失效数据节点的步骤之后还包括:统计分布式数据系统中失效数据节点的数量;在分布式数据系统中所述失效数据节点的数量大于第一阈值时,确定所述分布式系统失效。3.如权利要求2所述的分布式数据系统失效检测处理方法,其特征在于,所述统计分布式数据系统中失效数据节点的数量的步骤之后还包括:在分布式数据系统中所述失效数据节点的数量小于第二阈值时,确定所述分布式系统有效,其中第二阈值小于或等于第一阈值。4.如权利要求1至3任意一项所述的分布式数据系统失效检测处理方法,其特征在于,在所述对所述参考表进行分析,将消息计数值在预设时长未变动的节点标识所对应的数据节点作为失效数据节点的步骤之后还包括:使用预存的正确程序内容对所述失效数据节点的程序内容进行数据修
\t复;若检测到失效数据节点基于进行数据修复后的程序广播的响应消息,则判定所述失效数据节点发生软件失效,输出第一事件提示。5.如权利要求4所述的分布式数据系统失效检测处理方法,其特征在于,所述使用预存的正确程序内容对所述失效数据节点的程序内容进行数据修复的步骤之后还包括:若未检测到失效数据节点基于进行数据修复后的程序广播的响应消息,则复位重启所述失效数据节点;若检测到复位重启后的失效数据节点广播的响应消息,则判定所述失效数据节点发生软件失效,输出第一事件提示;若未检测到复位重启后的失效数据节点广播的响应消息,则判定所述失效数据节点发生硬件失...

【专利技术属性】
技术研发人员:张锐
申请(专利权)人:深圳市永兴元科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1