一种集群节点故障处理方法、系统及介质技术方案

技术编号:36693806 阅读:36 留言:0更新日期:2023-02-27 20:03
本发明专利技术实施例公开了一种集群节点故障处理方法、系统及介质。该方法包括:通过故障存储组件获取异常节点采用自定义资源CRD模式上报的故障节点信息;通过故障决策组件对故障存储组件中的故障节点信息进行监听,根据新增的故障节点信息判断是否触发为对应故障节点设置污点标签;通过故障决策组件根据判断结果调用故障处理组件发送故障处理消息给主节点中的Apiserver组件,故障处理消息用于指示Apiserver组件执行故障处理操作。本实施例可以快速的检测到集群中发生故障的节点并通过设置污点标签隔离该故障节点,从而保证了业务正常的运行。正常的运行。正常的运行。

【技术实现步骤摘要】
一种集群节点故障处理方法、系统及介质


[0001]本专利技术涉及计算机
,尤其涉及一种集群节点故障处理方法、系统及存储介质。

技术介绍

[0002]Kubernetes(简称K8s)是Google开源的用于管理容器化的系统,一般可以将web应用迁移到Kubernetes集群上。Kubernetes集群部署了多个节点和节点组件等。
[0003]现有技术中,对于Kubernetes集群的故障检测及处理方案更多的是依赖监控组件的监控,若监控到某一集群节点出现故障,通过手动的方式进行恢复,在恢复期间,主节点中的调度程序会将容器组件调度到当前发生故障的节点,从而影响业务的运行。
[0004]因此,如何在集群节点出现故障时,仍然可以保证业务正常运行成为亟待解决的问题,

技术实现思路

[0005]本专利技术提供了一种集群节点故障处理方法、系统及存储介质,以解决现有技术中,若某一集群节点出现故障,而Kubernetes仍然将工作负载调度到当前节点而影响业务的问题,实现快速的检测到节点的故障并隔离故障节点,从而保证业务正常的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种集群节点的故障处理方法,其特征在于,应用于集群中的健康节点,包括:通过故障存储组件获取异常节点采用自定义资源CRD模式上报的故障节点信息;通过故障决策组件对所述故障存储组件中的故障节点信息进行监听,根据新增的故障节点信息判断是否触发为对应故障节点设置污点标签;通过故障决策组件根据判断结果调用故障处理组件发送故障处理消息给主节点中的Api server组件,所述故障处理消息用于指示Api server组件执行故障处理操作。2.根据权利要求1所述的方法,其特征在于,所述根据新增的故障节点信息判断是否触发为对应故障节点设置污点标签,包括:在监听到新增的故障节点信息的情况下,通过故障决策组件根据所述新增的故障节点信息匹配设定的故障处理策略,根据匹配结果判断是否触发为对应故障节点设置污点标签,其中,故障处理策略包含故障场景与故障处理方式的关联关系。3.根据权利要求2所述的方法,其特征在于,所述设定的故障处理策略包括如下至少一项:在故障节点信息为Docker故障的情况下,故障场景为Docker组件故障触发的节点故障,故障处理方式包括为对应故障节点设置污点标签;在故障节点信息为Containerd故障且Calico故障的情况下,故障场景为Containerd组件与Calico组件同时故障触发的节点故障,故障处理方式包括为对应故障节点设置污点标签;在故障节点信息为Calico故障且Kubelet故障的情况下,故障场景为Calico组件与Kubelet组件同时故障触发的节点故障,故障处理方式包括为对应故障节点设置污点标签,且将对应故障节点上的容器组Pod驱逐到健康节点;在故障节点信息为Kubelet故障的情况下,故障场景为Kubelet组件故障触发的节点故障,故障处理方式包括为对应故障节点设置污点标签;在故障节点信息为硬件故障的情况下,故障场景为硬件故障触发的节点故障,故障处理方式包括重启故障节点并不为对应故障节点设置污点标签。4.根据权利要求3所述的方法,其特征在于,所述通过故障决策组件根据所述新增的故障节点信息匹配设定的故障处理策略,根据匹配结果判断是否触发为对应故障节点设置污点标签,包括:通过故障决策组件根据所述新增的故障节点信息匹配设定的故障处理策略得到故障场景;通过故障决策组件根据所述故障场景对应的故障处理方式,判断是否触发为对应故障节点设置污点标...

【专利技术属性】
技术研发人员:汪劲松张亚祥张铭
申请(专利权)人:上海浦东发展银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1