【技术实现步骤摘要】
本申请涉及集群,尤其涉及k8s集群中节点状态的检测方法、装置、设备及介质。
技术介绍
1、随着深度学习云平台的发展,其基于kubernetes(k8s)实现统一的资源监控和调度,以提升计算中心资源利用率、降低成本。但在实际应用中,数据中心节点可能因断电、断网、硬件故障等出现故障,因此,需要高效的节点状态检测机制,以保障集群稳定性和业务连续性。
2、传统技术中,kubernetes主要通过定期的心跳检测来监视节点的健康状态。节点上的kubelet组件会定期向api server(application programming interface server,应用程序编程接口服务)发送心跳信号。kubernetes中的node-controller(节点控制器)会定时检测节点状态信号是否更新,如果在预设的时间内没有收到节点的心跳信号,kubernetes就会将该节点标记为不可用。传统技术中,要实现k8s故障节点的快速检测,主要依靠调低kubelet(k8s的原生代理组件)的心跳上报周期(默认10s),以及调低kube-cont
...【技术保护点】
1.一种k8s集群中节点状态的检测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的k8s集群中节点状态的检测方法,其特征在于,所述当前工作节点部署有代理组件,所述根据哈希算法从部署于所述k8s集群的多个控制组件副本中获取目标控制组件副本,包括:
3.根据权利要求2所述的k8s集群中节点状态的检测方法,其特征在于,所述对所述代理组件所在容器组的标识信息进编码,并根据编码结果、所述控制组件副本的数目以及所述哈希算法进行哈希计算,得到第一哈希值,包括:
4.根据权利要求2所述的k8s集群中节点状态的检测方法,其特征在于,所述将所
...【技术特征摘要】
1.一种k8s集群中节点状态的检测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的k8s集群中节点状态的检测方法,其特征在于,所述当前工作节点部署有代理组件,所述根据哈希算法从部署于所述k8s集群的多个控制组件副本中获取目标控制组件副本,包括:
3.根据权利要求2所述的k8s集群中节点状态的检测方法,其特征在于,所述对所述代理组件所在容器组的标识信息进编码,并根据编码结果、所述控制组件副本的数目以及所述哈希算法进行哈希计算,得到第一哈希值,包括:
4.根据权利要求2所述的k8s集群中节点状态的检测方法,其特征在于,所述将所述第一哈希值与所述第二哈希值进行比对,并根据比对结果选取所述目标控制组件副本,包括:
5.根据权利要求4所述的k8s集群中节点状态的检测方法,其特征在于,所述方法还包括:
6.根据权利要求1所述的k8s集群中节点状态的检测方法,其特征在于,所述方法...
【专利技术属性】
技术研发人员:杨勇,乔霖,李少凯,付辰,杜海超,
申请(专利权)人:济南浪潮数据技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。