节点设备的状态检测方法和装置制造方法及图纸

技术编号:13605584 阅读:89 留言:0更新日期:2016-08-28 04:23
本发明专利技术提供一种节点设备的状态检测方法和装置,应用于设备集群,设备集群被预划分为一个或多个具有相同主节点的环形检测组,包括:主节点向第一从节点设备发送携带所有节点标识列表的检测报文;如果第一从节点正常响应该报文,在标识列表中将自身标记为检测通过,并转发至第二从节点;如果第二从节点正常响应该报文,在标识列表中将自身标记为检测通过,并继续转发该报文,直至该报文被转发至主节点;如果第二从节点无法正常响应该报文,第一从节点在标识列表中将第二从节点标记为检测失败,并将该报文上报至主节点;主节点基于接收到的检测报文确定检测组中各节点的状态。本申请可以缓解主节点设备的处理压力。

【技术实现步骤摘要】

本专利技术涉及通信
,尤其涉及一种节点设备的状态检测方法和装置
技术介绍
ElasticSearch是一个基于Lucene的搜索服务器集群。它提供了一个分布式多用户能力的全文搜索引擎,是目前流行的企业搜索引擎之一。ElasticSearch的搜索服务器集群中的节点设备,包括一选举产生的主节点设备,以及若干从节点设备,这些节点呈现一种星形的拓扑结构,每个节点都可以与其他节点进行通信,因此集群的每个节点都包括所有其他节点的信息。ElasticSearch的搜索服务器集群中,错误检测(fault detection)是节点发现以及状态的维护与更新过程中的重要基础功能之一,目前的错误检测机制,是由主节点设备和各从节点设备之间分别互相发送ping报文来进行错误检测,以发现集群中的错误节点,由于主节点设备需要向各从节点设备分别发送ping报文,因此主节点设备的处理压力大,而且在节点数量较多的集群中,会导致整个网络的带宽资源过多的消耗。
技术实现思路
有鉴于此,本申请提出一种节点设备的状态检测方法,应用于设备集群中的主节点设备,所述设备集群被预划分为一个或者多个具有相同主节点设备的环形检测组,所述方法包括:向所述检测组中下一待检测的从节点设备发送检测报文,以发起针对所述检测组中所有节点的状态检测;其中,所述检测报文携带所述检测组中所有节点设备的标识列表;所述第一从节点设备在正常响应所述检测报文时,在所述标识列表中将其自身标记为检测通过状态,并转发所述检测报文至下一待检测的第二从节点设备,以使所述第二从节点设备在正常响应所述检测报文时继续向下游从节点设备转发该检测报文,直至该检测报文被转发至所述主节点设备;接收所述检测组中返回的检测报文;基于接收到的检测报文确定所述检测组中各节点设备的状态。可选的,所述方法还包括:接收所述第一从节点设备在确定所述第二从节点设备无法响应转发的所述检测报文时上报的该检测报文;其中,所述第一从节点设备已在该检测报文的标识列表中将所述第二从节点设备标记为检测失败状态。可选的,所述方法还包括如果在预设时长内未收到所述第一从节点设备发送的针对所述检测报文的响应报文,则向所述该从节点设备重新发送所述检测报文;当所述检测报文重新发送的次数达到预设次数,仍未收到该从节点设备发送的所述响应报文时,确定该从节点设备无法正常响应所述检测报文,则根据所述标识列表向下一个待检测节点发送所述检测报文。可选的,所述方法还包括:当基于接收到的所述检测报文确定所述检测组中存在检测失败状态的节点时,将该检测失败状态的节点从所述标识列表中移除,并向所述第一从节点设备重新发送检测报文,以再次发起针对所述检测组中所有节点的状态检测。可选的,所述方法还包括:当基于接收到的所述检测报文确定所述检测组中存在检测失败状态的节点时,继续将所述检测报文转发至该检测失败状态的从节点设备的下一从节
点设备,以使该下一从节点设备在正常响应该检测报文时,在所述标识列表中将自身标记为检测通过状态,并在所述检测组中继续转发该检测报文。本申请还提出一种节点设备的状态检测方法,应用于设备集群中的从节点设备,所述设备集群被预划分为一个或者多个具有相同主节点设备的环形检测组,所述方法包括:接收当前检测组中上一节点设备发送的检测报文;所述检测报文由所述检测组中的主节点设备发出;所述检测报文携带所述检测组中所有节点的标识列表;如果正常响应所述检测报文时,在所述标识列表中将自身标记为检测通过状态,并转发所述检测报文至下一待检测的从节点设备,以使所述下一待检测的从节点设备在正常响应该检测报文时,在所述标识列表中将其自身标记为检测通过状态,并继续向下游从节点设备转发该检测报文,直至该检测报文被转发至所述主节点设备。可选的,所述方法还包括:如果在预设时长内未收到所述下一从节点设备发送的针对所述检测报文的响应报文,则向该从节点设备重新发送所述检测报文;当所述检测报文重新发送的次数达到预设次数,仍未收到该从节点设备发送的所述响应报文时,确定该从节点设备无法正常响应所述检测报文;如果所述下一从节点设备无法正常响应该检测报文,在所述标识列表中将所述下一从节点设备标记为检测失败状态,并将该检测报文上报至所述主节点设备。本申请还提出一种节点设备的状态检测装置,应用于设备集群中的主节点设备,所述设备集群被预划分为一个或者多个具有相同主节点设备的环形检测组,所述装置包括:发送模块,用于向所述检测组中下一待检测的从节点设备发送检测报文,以发起针对所述检测组中所有节点的状态检测;其中,所述检测报文携带所述检测组中所有节点设备的标识列表;所述第一从节点设备在正常响应所述
检测报文时,在所述标识列表中将其自身标记为检测通过状态,并转发所述检测报文至下一待检测的第二从节点设备,以使所述第二从节点设备在正常响应所述检测报文时继续向下游从节点设备转发该检测报文,直至该检测报文被转发至所述主节点设备;第一接收模块,用于接收所述检测组中返回的检测报文;确定模块,用于基于接收到的检测报文确定所述检测组中各节点设备的状态。可选的,所述第一接收模块进一步用于:接收所述第一从节点设备在确定所述第二从节点设备无法响应转发的所述检测报文时上报的该检测报文;其中,所述第一从节点设备已在该检测报文的标识列表中将所述第二从节点设备标记为检测失败状态。可选的,所述发送模块进一步用于:如果在预设时长内未收到所述第一从节点设备发送的针对所述检测报文的响应报文,则向所述该从节点设备重新发送所述检测报文;当所述检测报文重新发送的次数达到预设次数,仍未收到该从节点设备发送的所述响应报文时,确定该从节点设备无法正常响应所述检测报文,则根据所述标识列表向下一个待检测节点发送所述检测报文。可选的,所述发送模块进一步用于:当基于接收到的所述检测报文确定所述检测组中存在检测失败状态的节点时,将该检测失败状态的节点从所述标识列表中移除,并向所述第一从节点设备重新发送检测报文,以再次发起针对所述检测组中所有节点的状态检测。可选的,所述发送模块进一步用于:当基于接收到的所述检测报文确定所述检测组中存在检测失败状态的节点时,继续将所述检测报文转发至该检测失败状态的从节点设备的下一从节点设备,以使该下一从节点设备在正常响应该检测报文时,在所述标识列表中将自身标记为检测通过状态,并在所述检测组中继续转发该检测报文。本申请还提出一种节点设备的状态检测装置,应用于设备集群中的从节点设备,所述设备集群被预划分为一个或者多个具有相同主节点设备的环形检测组,所述装置包括:第二接收模块,用于接收当前检测组中上一节点设备发送的检测报文;所述检测报文由所述检测组中的主节点设备发出;所述检测报文携带所述检测组中所有节点的标识列表;转发模块,用于在正常响应所述检测报文时,在所述标识列表中将自身标记为检测通过状态,并转发所述检测报文至下一待检测的从节点设备,以使所述下一待检测的从节点设备在正常响应该检测报文时,在所述标识列表中将其自身标记为检测通过状态,并继续向下游从节点设备转发该检测报文,直至该检测报文被转发至所述主节点设备。可选的,所述转发模块进一步用于:如果在预设时长内未收到所述下一从节点设备发送的针对所述检测报文的响应报文,则向该从本文档来自技高网
...

【技术保护点】
一种节点设备的状态检测方法,应用于设备集群中的主节点设备,其特征在于,所述设备集群被预划分为一个或者多个具有相同主节点设备的环形检测组,所述方法包括:向所述检测组中下一待检测的从节点设备发送检测报文,以发起针对所述检测组中所有节点的状态检测;其中,所述检测报文携带所述检测组中所有节点设备的标识列表;所述第一从节点设备在正常响应所述检测报文时,在所述标识列表中将其自身标记为检测通过状态,并转发所述检测报文至下一待检测的第二从节点设备,以使所述第二从节点设备在正常响应所述检测报文时继续向下游从节点设备转发该检测报文,直至该检测报文被转发至所述主节点设备;接收所述检测组中返回的检测报文;基于接收到的检测报文确定所述检测组中各节点设备的状态。

【技术特征摘要】
1.一种节点设备的状态检测方法,应用于设备集群中的主节点设备,其特征在于,所述设备集群被预划分为一个或者多个具有相同主节点设备的环形检测组,所述方法包括:向所述检测组中下一待检测的从节点设备发送检测报文,以发起针对所述检测组中所有节点的状态检测;其中,所述检测报文携带所述检测组中所有节点设备的标识列表;所述第一从节点设备在正常响应所述检测报文时,在所述标识列表中将其自身标记为检测通过状态,并转发所述检测报文至下一待检测的第二从节点设备,以使所述第二从节点设备在正常响应所述检测报文时继续向下游从节点设备转发该检测报文,直至该检测报文被转发至所述主节点设备;接收所述检测组中返回的检测报文;基于接收到的检测报文确定所述检测组中各节点设备的状态。2.如权利要求1所述的方法,其特征在于,所述方法还包括:接收所述第一从节点设备在确定所述第二从节点设备无法响应转发的所述检测报文时上报的该检测报文;其中,所述第一从节点设备已在该检测报文的标识列表中将所述第二从节点设备标记为检测失败状态。3.如权利要求1所述的方法,其特征在于,所述方法还包括如果在预设时长内未收到所述第一从节点设备发送的针对所述检测报文的响应报文,则向所述该从节点设备重新发送所述检测报文;当所述检测报文重新发送的次数达到预设次数,仍未收到该从节点设备发送的所述响应报文时,确定该从节点设备无法正常响应所述检测报文,则根据所述标识列表向下一个待检测节点发送所述检测报文。4.如权利要求2所述的方法,其特征在于,所述方法还包括:当基于接收到的所述检测报文确定所述检测组中存在检测失败状态的节点时,将该检测失败状态的节点从所述标识列表中移除,并向所述第一从节
\t点设备重新发送检测报文,以再次发起针对所述检测组中所有节点的状态检测。5.如权利要求3所述的方法,其特征在于,所述方法还包括:当基于接收到的所述检测报文确定所述检测组中存在检测失败状态的节点时,继续将所述检测报文转发至该检测失败状态的从节点设备的下一从节点设备,以使该下一从节点设备在正常响应该检测报文时,在所述标识列表中将自身标记为检测通过状态,并在所述检测组中继续转发该检测报文。6.一种节点设备的状态检测方法,应用于设备集群中的从节点设备,其特征在于,所述设备集群被预划分为一个或者多个具有相同主节点设备的环形检测组,所述方法包括:接收当前检测组中上一节点设备发送的检测报文;所述检测报文由所述检测组中的主节点设备发出;所述检测报文携带所述检测组中所有节点的标识列表;如果正常响应所述检测报文时,在所述标识列表中将自身标记为检测通过状态,并转发所述检测报文至下一待检测的从节点设备,以使所述下一待检测的从节点设备在正常响应该检测报文时,在所述标识列表中将其自身标记为检测通过状态,并继续向下游从节点设备转发该检测报文,直至该检测报文被转发至所述主节点设备。7.如权利要求6所述的方法,其特征在于,所述方法还包括:如果在预设时长内未收到所述下一从节点设备发送的针对所述检测报文的响应报文,则向该从节点设备重新发送所述检测报文;当所述检测报文重新发送的次数达到预设次数,仍未收到该从节点设备发送的所述响应报文时,确定该从节点设备无法正常响应所述检测报文;如果所述下一从节点设备无法正常响应该检测报文,在所述标识列表中将所述下一从节点设备标记为检测失败状态,并将该检测报文上报至所述主节点设备。8.一种节点设备的状态检测装置,应用于设备集群中的主节点设备,其
\t...

【专利技术属性】
技术研发人员:孙策
申请(专利权)人:杭州数梦工场科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1