节点识别方法、装置及系统制造方法及图纸

技术编号:35087891 阅读:13 留言:0更新日期:2022-10-01 16:42
本申请公开了一种节点识别方法、装置及系统,属于通信技术领域。所述方法包括:管理节点在获取多个服务节点在目标时长内的等待关系之后,根据该等待关系,确定每个服务节点的被等待参数;之后,管理节点再根据多个服务节点的被等待参数,识别多个服务节点中的亚健康节点和非亚健康节点。其中,任一服务节点的被等待参数用于指示:该任一服务节点被多个服务节点中除该任一服务节点之外的其他服务节点等待的程度;亚健康节点的被等待参数所指示的被等待程度,高于非亚健康节点的被等待参数所指示的被等待程度。本申请能够解决目前管理节点的功能较为单一的问题,本申请用于亚健康节点的识别。的识别。的识别。

【技术实现步骤摘要】
节点识别方法、装置及系统


[0001]本申请涉及通信
,特别涉及一种节点识别方法、装置及系统。

技术介绍

[0002]分布式系统包括多个服务节点,且这些服务节点之间能够相互配合,共同完成数据处理等工作,以对外提供服务。
[0003]通常,分布式系统还包括管理节点,管理节点能够对多个服务节点进行故障检测,识别出该多个服务节点中的故障节点,以便于工作人员对故障节点进行维修。示例地,管理节点可以根据服务节点是否能够对外提供服务,来确定服务节点是否是故障节点。
[0004]但是,目前管理节点的功能较为单一。

技术实现思路

[0005]本申请提供了一种节点识别方法、装置及系统,可以解决目前管理节点的功能较为单一的问题,所述技术方案如下:
[0006]第一方面,提供了一种节点识别方法,所述方法由分布式系统中的管理节点执行,所述分布式系统还包括多个服务节点,所述方法包括:管理节点在获取所述多个服务节点在目标时长内的等待关系之后,根据获取的所述等待关系,确定所述多个服务节点中每个服务节点的被等待参数;之后,管理节点再根据所述多个服务节点的被等待参数,识别所述多个服务节点中的亚健康节点和非亚健康节点。其中,所述多个服务节点中的任一服务节点的被等待参数用于指示:所述任一服务节点被所述多个服务节点中除所述任一服务节点之外的其他服务节点等待的程度;所述亚健康节点的被等待参数所指示的被等待程度,高于所述非亚健康节点的被等待参数所指示的被等待程度,所述非亚健康节点为所述多个服务节点中与所述亚健康节点不同的节点。
[0007]本申请实施例提供的节点识别方法中,管理节点能够根据服务节点间的等待关系,识别出多个服务节点中的亚健康节点,从而丰富了管理节点的功能。并且,在识别亚健康节点的过程中,并不会影响分布式系统的正常运行,分布式系统仍然能够对外提供服务。另外,本申请提供的方法能够用统一的方式实现对节点健康状态的自动检测,无论是何种软硬件的早期故障(包括未知的故障类型),都可以通过本申请提出的方法来识别。
[0008]可选地,所述任一服务节点的被等待参数相关于W
d
,W
d
表示所述任一服务节点在所述目标时长内被所述其他服务节点等待的次数或时长。在本申请中,被等待参数相关于某一参数(如W
d
)是指:该被等待参数是采用某一函数该某一参数进行运算所得到的参数,其中,该某一函数可以是任意的函数。
[0009]比如,服务节点的被等待参数等于W
d

[0010]又比如,所述任一服务节点的被等待参数相关于W
d

W
i
,W
i
表示所述任一服务节点在所述目标时长内等待所述其他服务节点的次数或时长。在这种情况下,服务节点的被等待参数是该服务节点的净被等待次数或时长,该净被等待次数或时长是该服务节点在目标
时长内被其他服务节点等待的次数或时长,减去该服务节点在目标时长内等待其他服务节点的次数或时长。
[0011]需要说明的是,在分布式系统中,可能同时存在大量不同类型的操作,服务节点间的等待关系往往很复杂。对于分布式系统中的每个服务节点,这个服务节点被其他服务节点等待,可能是因为这个服务节点同时在等待其他服务节点返回结果或数据,才能进行下一步处理,而不是这个服务节点自身处理速度慢。因此,采用服务节点的净被等待次数或时长作为服务节点的被等待参数,能够比较准确的反映服务节点间的等待关系,管理节点根据被等待参数能更加准确地识别出分布式系统中的亚健康节点。
[0012]可选地,所述任一服务节点的被等待参数相关于λ1W
d1
,λ2W
d2
,λ3W
d3
和W
i
中的至少一种;λ1、λ2和λ3均为系数,W
d1
表示在所述目标时长内所述任一服务节点在第一条件下等待所述其他服务节点的次数或时长,W
d2
表示在所述目标时长内所述任一服务节点在第二条件下等待所述其他服务节点的次数或时长,W
d3
表示在所述目标时长内所述任一服务节点在第三条件下等待所述其他服务节点的次数或时长,W
i
表示所述任一服务节点在所述目标时长内等待所述其他服务节点的次数或时长;其中,所述第一条件包括:所述其他服务节点中的至少两个节点同时只等待所述任一服务节点的时长大于时长阈值;所述第二条件包括:所述多个服务节点中同时被等待的服务节点的数量大于1且小于或等于数量阈值,所述同时被等待的服务节点包括所述任一服务节点;所述第三条件包括:所述同时被等待的服务节点的数量大于所述数量阈值。
[0013]可选地,λ1>λ2>λ3>0。
[0014]本申请中管理节点在确定服务节点的被等待参数时,可以根据服务节点在三种被等待情况下的风险等级,对不同风险等级下等待其他服务节点的次数或时长采用不同的权重系数,从而重点突出高风险等级的被等待情况,提升根据被等待参数识别出的亚健康节点的准确度。
[0015]示例地,W
n
=g(λ1W
d1
,λ2W
d2
,λ3W
d3
,W
i
),g表示任一函数。比如,W
n
=λ1W
d1
+λ2W
d2
+λ3W
d3

W
i
。当然,W
n
=g(λ1W
d1
,λ2W
d2
,λ3W
d3
,W
i
)还可以有除W
n
=λ1W
d1
+λ2W
d2
+λ3W
d3

W
i
之外的其他实现方式,本申请对此不作限定。
[0016]可选地,管理节点在获取分布式系统中的多个服务节点在目标时长内的等待关系时,可以多次获取所述多个服务节点的等待关系,并根据所述多次获取的所述等待关系,确定所述多个服务节点在所述目标时长内的等待关系,所述多个服务节点在所述目标时长内的等待关系包括所述多次获取的所述等待关系。这样一来,便可以避免由于服务节点短期的负载波动,而导致根据服务节点间短期的等待关系识别出的亚健康节点较不准确的问题。
[0017]可选地,所述方法还包括:管理节点将识别出的满足目标条件的所述亚健康节点识别为所述非亚健康节点;其中,所述目标条件包括:所述亚健康节点的负载大于负载阈值,以及所述亚健康节点的目标参数与参数阈值的差值的绝对值小于或等于所述参数阈值对应的差值阈值中的至少一种条件;所述目标参数与所述被等待参数相关,所述参数阈值为:服务节点的负载与所述目标参数的对应关系中,所述亚健康节点的负载对应的目标参数,所述对应关系中的任一负载对应的目标参数为:服务节点在所述任一负载下的目标参数。...

【技术保护点】

【技术特征摘要】
1.一种节点识别方法,其特征在于,所述方法由分布式系统中的管理节点执行,所述分布式系统还包括多个服务节点,所述方法包括:获取所述多个服务节点在目标时长内的等待关系;根据获取的所述等待关系,确定所述多个服务节点中每个服务节点的被等待参数;其中,所述多个服务节点中的任一服务节点的被等待参数用于指示:所述任一服务节点被所述多个服务节点中除所述任一服务节点之外的其他服务节点等待的程度;根据所述多个服务节点的被等待参数,识别所述多个服务节点中的亚健康节点和非亚健康节点;其中,所述亚健康节点的被等待参数所指示的被等待程度,高于所述非亚健康节点的被等待参数所指示的被等待程度,所述非亚健康节点为所述多个服务节点中与所述亚健康节点不同的节点。2.根据权利要求1所述的方法,其特征在于,所述任一服务节点的被等待参数相关于W
d
,W
d
表示所述任一服务节点在所述目标时长内被所述其他服务节点等待的次数或时长。3.根据权利要求2所述的方法,其特征在于,所述任一服务节点的被等待参数相关于W
d

W
i
,W
i
表示所述任一服务节点在所述目标时长内等待所述其他服务节点的次数或时长。4.根据权利要求1所述的方法,其特征在于,所述任一服务节点的被等待参数相关于λ1W
d1
,λ2W
d2
,λ3W
d3
和W
i
中的至少一种;λ1、λ2和λ3均为系数,W
d1
表示在所述目标时长内所述任一服务节点在第一条件下等待所述其他服务节点的次数或时长,W
d2
表示在所述目标时长内所述任一服务节点在第二条件下等待所述其他服务节点的次数或时长,W
d3
表示在所述目标时长内所述任一服务节点在第三条件下等待所述其他服务节点的次数或时长,W
i
表示所述任一服务节点在所述目标时长内等待所述其他服务节点的次数或时长;其中,所述第一条件包括:所述其他服务节点中的至少两个节点同时只等待所述任一服务节点的时长大于时长阈值;所述第二条件包括:所述多个服务节点中同时被等待的服务节点的数量大于1且小于或等于数量阈值,所述同时被等待的服务节点包括所述任一服务节点;所述第三条件包括:所述同时被等待的服务节点的数量大于所述数量阈值。5.根据权利要求4所述的方法,其特征在于,λ1>λ2>λ3>0。6.根据权利要求4或5所述的方法,其特征在于,所述任一服务节点的被等待参数W
n
满足公式:W
n
=λ1W
d1
+λ2W
d2
+λ3W
d3

W
i
。7.根据权利要求1至6任一所述的方法,其特征在于,所述获取分布式系统中的多个服务节点在目标时长内的等待关系,包括:多次获取所述多个服务节点的等待关系;根据所述多次获取的所述等待关系,确定所述多个服务节点在所述目标时长内的等待关系,所述多个服务节点在所述目标时长内的等待关系包括所述多次获取的所述等待关系。8.根据权利要求1至7任一所述的方法,其特征在于,所述方法还包括:将识别出的满足目标条件的所述亚健康节点识别为所述非亚健康节点;其中,所述目标条件包括:所述亚健康节点的负载大于负载阈值,以及所述亚健康节点的目标参数与参数阈值的差值的绝对值小于或等于所述参数阈值对应的差值阈值中的至少一种条件;
所述目标参数与所述被等待参数相关,所述参数阈值为:服务节点的负载与所述目标参数的对应关系中,所述亚健康节点的负载对应的目标参数,所述对应关系中的任一负载对应的目标参数为:服务节点在所述任一负载下的目标参数。9.根据权利要求8所述的方法,其特征在于,所述亚健康节点的负载相关于:L
com
、L
io
和L
cpu
中的至少一种;其中,L
com
表示所述亚健康节点在单位时间内的流量,L
io
表示所述亚健康节点在所述单位时间内的数据读写次数,L
cpu
表示所述亚健康节点在所述单位时间内的中央处理器CPU使用量。10.根据权利要求1至9任一所述的方法,其特征在于,所述获取所述多个服务节点在目标时长内的等待关系,包括:接收所述多个服务节点发送的所述多个服务节点的运行数据;根据所述多个服务节点运行数据,确定所述多个服务节点在所述目标时长内的等待关系。11.一种节点识别装置,其特征在于,所述节点识别装置属于分布式系统中的管理节点,所述分布式系统还包括多个服务节点,所述节点识别装置包括:获取模块,用于获取所述多个服务节点在目标时长内的等待关系;确定模块,用于根据获取的所述等待关系,确定所述多个服务节点中每个服务节点的被等待参数;其中,所述多个服务节点中的任一服务节点的被等待参数用于指示:所述任一服务节点被所述多个服务节点中除所述任一服务节点之外的其他服务节点等待...

【专利技术属性】
技术研发人员:张婧垚刘晓冯帅
申请(专利权)人:华为云计算技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1