【技术实现步骤摘要】
一种集群节点故障处理方法、系统及介质
[0001]本专利技术涉及计算机
,尤其涉及一种集群节点故障处理方法、系统及存储介质。
技术介绍
[0002]Kubernetes(简称K8s)是Google开源的用于管理容器化的系统,一般可以将web应用迁移到Kubernetes集群上。Kubernetes集群部署了多个节点和节点组件等。
[0003]现有技术中,对于Kubernetes集群的故障检测及处理方案更多的是依赖监控组件的监控,若监控到某一集群节点出现故障,通过手动的方式进行恢复,在恢复期间,主节点中的调度程序会将容器组件调度到当前发生故障的节点,从而影响业务的运行。
[0004]因此,如何在集群节点出现故障时,仍然可以保证业务正常运行成为亟待解决的问题,
技术实现思路
[0005]本专利技术提供了一种集群节点故障处理方法、系统及存储介质,以解决现有技术中,若某一集群节点出现故障,而Kubernetes仍然将工作负载调度到当前节点而影响业务的问题,实现快速的检测到节点的故障并隔离故障节点 ...
【技术保护点】
【技术特征摘要】
1.一种集群节点的故障处理方法,其特征在于,应用于集群中的健康节点,包括:通过故障存储组件获取异常节点采用自定义资源CRD模式上报的故障节点信息;通过故障决策组件对所述故障存储组件中的故障节点信息进行监听,根据新增的故障节点信息判断是否触发为对应故障节点设置污点标签;通过故障决策组件根据判断结果调用故障处理组件发送故障处理消息给主节点中的Api server组件,所述故障处理消息用于指示Api server组件执行故障处理操作。2.根据权利要求1所述的方法,其特征在于,所述根据新增的故障节点信息判断是否触发为对应故障节点设置污点标签,包括:在监听到新增的故障节点信息的情况下,通过故障决策组件根据所述新增的故障节点信息匹配设定的故障处理策略,根据匹配结果判断是否触发为对应故障节点设置污点标签,其中,故障处理策略包含故障场景与故障处理方式的关联关系。3.根据权利要求2所述的方法,其特征在于,所述设定的故障处理策略包括如下至少一项:在故障节点信息为Docker故障的情况下,故障场景为Docker组件故障触发的节点故障,故障处理方式包括为对应故障节点设置污点标签;在故障节点信息为Containerd故障且Calico故障的情况下,故障场景为Containerd组件与Calico组件同时故障触发的节点故障,故障处理方式包括为对应故障节点设置污点标签;在故障节点信息为Calico故障且Kubelet故障的情况下,故障场景为Calico组件与Kubelet组件同时故障触发的节点故障,故障处理方式包括为对应故障节点设置污点标签,且将对应故障节点上的容器组Pod驱逐到健康节点;在故障节点信息为Kubelet故障的情况下,故障场景为Kubelet组件故障触发的节点故障,故障处理方式包括为对应故障节点设置污点标签;在故障节点信息为硬件故障的情况下,故障场景为硬件故障触发的节点故障,故障处理方式包括重启故障节点并不为对应故障节点设置污点标签。4.根据权利要求3所述的方法,其特征在于,所述通过故障决策组件根据所述新增的故障节点信息匹配设定的故障处理策略,根据匹配结果判断是否触发为对应故障节点设置污点标签,包括:通过故障决策组件根据所述新增的故障节点信息匹配设定的故障处理策略得到故障场景;通过故障决策组件根据所述故障场景对应的故障处理方式,判断是否触发为对应故障节点设置污点标...
【专利技术属性】
技术研发人员:汪劲松,张亚祥,张铭,
申请(专利权)人:上海浦东发展银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。