节点状态的检测方法、节点异常的处理方法及装置制造方法及图纸

技术编号:33352334 阅读:51 留言:0更新日期:2022-05-08 10:00
本申请公开了一种节点状态的检测方法、节点异常的处理方法及装置。该方法包括:接收部署在目标集群中目标节点上的代理终端发送的目标检测指标,以及所述目标检测指标对应的运行数据,其中,所述目标节点为目标检测指标处于异常状态的节点;根据所述运行数据确定所述目标检测指标对应的目标异常类型;查询所述目标异常类型对应的目标异常处理脚本;在存在所述目标异常处理脚本的情况下,执行所述目标异常处理脚本以使所述目标节点的目标检测指标恢复至正常状态。本申请提供的方法能够在目标集群中节点出现异常时,根据该节点出现异常的异常类型自动获取并执行异常处理脚本,实现了节点在出现异常后及时自愈,保证目标集群持续处于高可用的状态。处于高可用的状态。处于高可用的状态。

【技术实现步骤摘要】
节点状态的检测方法、节点异常的处理方法及装置


[0001]本申请涉及计算机
,尤其涉及节点状态的检测方法、节点异常的处理方法及装置。

技术介绍

[0002]目前k8s官方已提供node节点的故障探测功能,但是如上文所说,其探测功能在实际的生产中还是会出现很多问题,且不具备节点自愈的能力。腾讯在k8s官方提供的node节点故障检测功能的基础上增加了节点自愈能力,但是其节点自愈能力只是针对表面现象做重启操作,实际生产中发现,这种简单的重启是无法解决问题的,因为一个组件启动失败往往再重启它也不会启动成功。

技术实现思路

[0003]为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种节点状态的检测方法、节点异常的处理方法及装置。
[0004]根据本申请实施例的一个方面,还提供了一种节点异常的处理方法,该方法应用于部署在目标集群中主节点上的控制器,所述方法包括:
[0005]接收部署在目标集群中目标节点上的代理终端发送的目标检测指标,以及所述目标检测指标对应的运行数据,其中,所述目标节点为目标检测指本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种节点异常的处理方法,其特征在于,该方法应用于部署在目标集群中主节点上的控制器,所述方法包括:接收部署在目标集群中目标节点上的代理终端发送的目标检测指标,以及所述目标检测指标对应的运行数据,其中,所述目标节点为目标检测指标处于异常状态的节点;根据所述运行数据确定所述目标检测指标对应的目标异常类型;查询所述目标异常类型对应的目标异常处理脚本;在存在所述目标异常处理脚本的情况下,执行所述目标异常处理脚本以使所述目标节点的目标检测指标恢复至正常状态。2.根据权利要求1所述的方法,其特征在于,所述查询所述目标异常类型对应的异常处理脚本,包括:从所述控制器的缓存中读取异常类型与异常处理脚本之间的映射关系;基于所述映射关系,获取所述目标异常类型对应的目标异常处理脚本。3.根据权利要求2所述的方法,其特征在于,在不存在所述异常处理脚本的情况下,所述方法还包括:向目标客户端发送所述目标检测指标,以及所述目标检测指标对应的运行数据;接收所述目标客户端基于所述目标检测指标以及所述运行数据反馈的目标异常处理脚本;建立所述目标异常处理脚本与所述目标异常类型之间的映射关系,并将所述映射关系存储至所述控制器的缓存。4.一种节点状态的检测方法,其特征在于,该方法应用于代理终端,所述代理终端部署在目标集群中的每个节点,所述方法包括:按照检测指标对应的检测策略对节点进行周期性检测,得到所述节点中各个检测指标对应的运行数据;基于所述运行数据确定所述检测指标对应的状态信息;将所述状态信息为异常状态的检测指标确定为目标检测指标;向控制器发送所述目标检测指标对应的运行数据,以使所述控制器根据所述运行数据对所述目标节点执行异常处理操作。5.根据权利要求4所述的方法,其特征在于,在所述检测指标为网络指标的情况下,所述按照检测指标对应的检测策略对所述节点进行周期性检测,得到所述节点中各个检测指标对应的运行数据,包括:确定所述网络指标对应的网络检测策略;利用所述网络检测策略检测所述节点所在管理网、业...

【专利技术属性】
技术研发人员:董善义
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1