【技术实现步骤摘要】
集群故障处理方法、装置、电子设备及可读存储介质
[0001]本专利技术实施例涉及集群
,具体涉及一种集群故障处理方法、装置、电子设备及可读存储介质。
技术介绍
[0002]随着信息化技术的推进,无论是企业还是其他组织机构都越来越依赖于计算机系统。伴随着数据量的急剧膨胀,单个计算机已经无法满足其需要,若使用超级计算机又极大的增大了计算机的成本,在这种情况下,Kubernetes集群应运而生,Kubernetes集群是由多个用于运行容器化应用的节点组成的集群,节点可以是物理机或者虚拟机,节点负责执行请求和所分配任务。
[0003]Kubernetes集群在运行时会由于节点发生故障,导致不能正常提供服务,影响生产系统的可靠性。
[0004]目前集群使用的故障处理方法为,对集群中节点的运行状态进行监控,当检测到节点存在故障时,对其运行状态进行更改,然后由运维人员登录系统中,根据节点的运行状态查找出发生故障的节点。采用上述方式,如果故障是阶段间隙性触发的话,若运维人员不能在故障发生的第一时间登录到系统进行相关的取 ...
【技术保护点】
【技术特征摘要】
1.一种集群故障处理方法,其特征在于,包括:利用预先设置的与集群对应的代理服务,对所述集群进行故障节点检测;在确定所述集群中存在故障节点时,创建与所述故障节点对应的快照函数;执行所述快照函数,以获取所述故障节点的容器内部快照信息和容器外部快照信息。2.根据权利要求1所述的方法,其特征在于,执行所述快照函数,以获取所述故障节点的容器内部快照信息和容器外部快照信息,包括:所述快照函数中包含多条快照指令,所述多条快照指令包含用于获取容器外部快照信息的快照指令和用于获取容器内部快照信息的快照指令;根据每条快照指令对应的执行顺序,依次执行所述多条快照指令,从而获取到所述故障节点的容器内部快照信息和容器外部快照信息。3.根据权利要求2所述的方法,其特征在于,所述用于获取容器外部快照信息的快照指令包含下述指令中的至少一种:用于获取操作系统快照信息的快照指令、用于获取主机网络快照信息的快照指令、用于获取系统操作日志快照信息的快照指令、用于获取主机硬件快照信息的快照指令;所述用于获取容器内部快照信息的快照指令包含:用于获取容器快照信息的快照指令。4.根据权利要求1所述的方法,其特征在于,基于预先设置的与集群对应的代理服务,对所述集群进行故障节点检测,包括:所述代理服务获取所述集群的运行信息,所述运行信息中包含所述集群中各节点的工作状态信息;针对每个节点,将节点的工作状态信息与该节点对应的预设工作状态信息进行比较;若节点的工作状态信息与该节点对应的预设工作状态信息不一致,则确定该节点为故障节点。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:预先...
【专利技术属性】
技术研发人员:陈阔,
申请(专利权)人:苏州国双软件有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。