【技术实现步骤摘要】
本专利技术涉及通信
,尤其涉及一种节点设备的状态检测方法和装置。
技术介绍
ElasticSearch是一个基于Lucene的搜索服务器集群。它提供了一个分布式多用户能力的全文搜索引擎,是目前流行的企业搜索引擎之一。ElasticSearch的搜索服务器集群中的节点设备,包括一选举产生的主节点设备,以及若干从节点设备,这些节点呈现一种星形的拓扑结构,每个节点都可以与其他节点进行通信,因此集群的每个节点都包括所有其他节点的信息。ElasticSearch的搜索服务器集群中,错误检测(fault detection)是节点发现以及状态的维护与更新过程中的重要基础功能之一,目前的错误检测机制,是由主节点设备和各从节点设备之间分别互相发送ping报文来进行错误检测,以发现集群中的错误节点,由于主节点设备需要向各从节点设备分别发送ping报文,因此主节点设备的处理压力大,而且在节点数量较多的集群中,会导致整个网络的带宽资源过多的消耗。
技术实现思路
有鉴于此,本申请提出一种节点设备的状态检测方法,应用于设备集群中的主节点设备,所述设备集群被预划分为一个或者多个具有相同主节点设备的环形检测组,所述方法包括:向所述检测组中下一待检测的从节点设备发送检测报文,以发起针对所述检测组中所有节点的状态检测;其中,所述检测报文携带所述检测组中所有节点设备的标识列表;所述第一从节点设备在正常响应所述检测报文时,在所述标识列表中将其自身标记为检测通过状态,并转发所述检测报文至下一待检测的第二从节点设备,以使所述第二从节点设备在正常响应所述检测报文时继续向下游从节点设备转发该检测报 ...
【技术保护点】
一种节点设备的状态检测方法,应用于设备集群中的主节点设备,其特征在于,所述设备集群被预划分为一个或者多个具有相同主节点设备的环形检测组,所述方法包括:向所述检测组中下一待检测的从节点设备发送检测报文,以发起针对所述检测组中所有节点的状态检测;其中,所述检测报文携带所述检测组中所有节点设备的标识列表;所述第一从节点设备在正常响应所述检测报文时,在所述标识列表中将其自身标记为检测通过状态,并转发所述检测报文至下一待检测的第二从节点设备,以使所述第二从节点设备在正常响应所述检测报文时继续向下游从节点设备转发该检测报文,直至该检测报文被转发至所述主节点设备;接收所述检测组中返回的检测报文;基于接收到的检测报文确定所述检测组中各节点设备的状态。
【技术特征摘要】
1.一种节点设备的状态检测方法,应用于设备集群中的主节点设备,其特征在于,所述设备集群被预划分为一个或者多个具有相同主节点设备的环形检测组,所述方法包括:向所述检测组中下一待检测的从节点设备发送检测报文,以发起针对所述检测组中所有节点的状态检测;其中,所述检测报文携带所述检测组中所有节点设备的标识列表;所述第一从节点设备在正常响应所述检测报文时,在所述标识列表中将其自身标记为检测通过状态,并转发所述检测报文至下一待检测的第二从节点设备,以使所述第二从节点设备在正常响应所述检测报文时继续向下游从节点设备转发该检测报文,直至该检测报文被转发至所述主节点设备;接收所述检测组中返回的检测报文;基于接收到的检测报文确定所述检测组中各节点设备的状态。2.如权利要求1所述的方法,其特征在于,所述方法还包括:接收所述第一从节点设备在确定所述第二从节点设备无法响应转发的所述检测报文时上报的该检测报文;其中,所述第一从节点设备已在该检测报文的标识列表中将所述第二从节点设备标记为检测失败状态。3.如权利要求1所述的方法,其特征在于,所述方法还包括如果在预设时长内未收到所述第一从节点设备发送的针对所述检测报文的响应报文,则向所述该从节点设备重新发送所述检测报文;当所述检测报文重新发送的次数达到预设次数,仍未收到该从节点设备发送的所述响应报文时,确定该从节点设备无法正常响应所述检测报文,则根据所述标识列表向下一个待检测节点发送所述检测报文。4.如权利要求2所述的方法,其特征在于,所述方法还包括:当基于接收到的所述检测报文确定所述检测组中存在检测失败状态的节点时,将该检测失败状态的节点从所述标识列表中移除,并向所述第一从节
\t点设备重新发送检测报文,以再次发起针对所述检测组中所有节点的状态检测。5.如权利要求3所述的方法,其特征在于,所述方法还包括:当基于接收到的所述检测报文确定所述检测组中存在检测失败状态的节点时,继续将所述检测报文转发至该检测失败状态的从节点设备的下一从节点设备,以使该下一从节点设备在正常响应该检测报文时,在所述标识列表中将自身标记为检测通过状态,并在所述检测组中继续转发该检测报文。6.一种节点设备的状态检测方法,应用于设备集群中的从节点设备,其特征在于,所述设备集群被预划分为一个或者多个具有相同主节点设备的环形检测组,所述方法包括:接收当前检测组中上一节点设备发送的检测报文;所述检测报文由所述检测组中的主节点设备发出;所述检测报文携带所述检测组中所有节点的标识列表;如果正常响应所述检测报文时,在所述标识列表中将自身标记为检测通过状态,并转发所述检测报文至下一待检测的从节点设备,以使所述下一待检测的从节点设备在正常响应该检测报文时,在所述标识列表中将其自身标记为检测通过状态,并继续向下游从节点设备转发该检测报文,直至该检测报文被转发至所述主节点设备。7.如权利要求6所述的方法,其特征在于,所述方法还包括:如果在预设时长内未收到所述下一从节点设备发送的针对所述检测报文的响应报文,则向该从节点设备重新发送所述检测报文;当所述检测报文重新发送的次数达到预设次数,仍未收到该从节点设备发送的所述响应报文时,确定该从节点设备无法正常响应所述检测报文;如果所述下一从节点设备无法正常响应该检测报文,在所述标识列表中将所述下一从节点设备标记为检测失败状态,并将该检测报文上报至所述主节点设备。8.一种节点设备的状态检测装置,应用于设备集群中的主节点设备,其
\t...
【专利技术属性】
技术研发人员:孙策,
申请(专利权)人:杭州数梦工场科技有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。