【技术实现步骤摘要】
集群资源伸缩方法、装置及容器集群管理系统
[0001]本公开涉及自动驾驶
,具体涉及一种集群资源伸缩方法、装置及容器集群管理系统。
技术介绍
[0002]随着容器化技术的日益成熟及普及,主流机器学习平台普遍使用容器集群管理系统(Kubernetes,简称k8s)作为业务容器化的基础设施。而在k8s系统的资源调度过程中,面临着严重的资源碎片化问题。
[0003]相关技术,为了解决资源碎片化问题,可以通过垂直容器组自动扩缩容(Vertical Pod Autoscaler,简称VPA)技术,根据容器资源使用率,自动设置容器资源的资源规格,以实现集群资源的垂直伸缩。但是相关技术中的VPA技术,在对集群资源进行垂直伸缩时,需要将当前正在运行的容器组(Pod)删除,再根据计算得到的新的资源规格信息,创建新的容器组,而删除当前的容器组会导致该容器组中的服务中断,从而影响服务的质量,在业务负载变化较快的场景下,该集群资源垂直伸缩方式对容器组管理的灵活性差。
技术实现思路
[0004]本公开提供了一种集群资源伸缩方法、装置及容器集群管理系统。
[0005]根据本公开的一方面,提供了一种集群资源伸缩方法,应用于容器集群管理系统中的调度组件,所述容器集群管理系统还包括接口服务组件以及至少一个工作节点上的节点代理组件;所述接口服务组件支持容器组的资源规格更新功能;所述方法包括:响应于监测到所述接口服务组件对目标容器组的资源规格信息进行更新的事件,且确定所述目标容器组具有原地更新标识,校验所述目标容器组 ...
【技术保护点】
【技术特征摘要】
1.一种集群资源伸缩方法,其特征在于,应用于容器集群管理系统中的调度组件,所述容器集群管理系统还包括接口服务组件以及至少一个工作节点上的节点代理组件;所述接口服务组件支持容器组的资源规格更新功能;所述方法包括:响应于监测到所述接口服务组件对目标容器组的资源规格信息进行更新的事件,且确定所述目标容器组具有原地更新标识,校验所述目标容器组是否满足原地更新条件;在确定所述目标容器组满足所述原地更新条件的情况下,删除所述目标容器组具有的所述原地更新标识,以使所述目标容器组所在工作节点上的节点代理组件,响应于监测到所述事件,且确定所述目标容器组不具有所述原地更新标识,对所述目标容器组的更新后资源规格信息进行生效。2.根据权利要求1所述的方法,其特征在于,所述容器集群管理系统还包括副本集控制组件及部署控制组件;所述目标容器组,由所述部署控制组件通过所述副本集控制组件进行管理;所述原地更新标识,是所述部署控制组件,响应于监测到所述接口服务组件对部署资源的资源规格信息进行更新,为所述目标容器组创建的;所述事件,是所述接口服务组件响应于接收到所述副本集控制组件发送的,对所管理的所述目标容器组的资源规格信息的更新请求,对所述目标容器组的资源规格信息进行更新而生成的;所述更新请求,是所述副本集控制组件,响应于监测到所述接口服务组件对副本集资源的资源规格信息进行更新发送的。3.根据权利要求1所述的方法,其特征在于,所述更新后资源规格信息包括目标资源量;所述原地更新条件,包括:所述目标容器组所在工作节点中的可用资源量,不低于所述目标资源量。4.根据权利要求3所述的方法,其特征在于,所述校验所述目标容器组是否满足原地更新条件之后,还包括:在确定所述目标容器组满足所述原地更新条件的情况下,更新已存储的所述目标容器组的资源规格信息,以及更新已存储的所述目标容器组所在工作节点中的可用资源量。5.根据权利要求2所述的方法,其特征在于,所述校验所述目标容器组是否满足原地更新条件之后,还包括:在确定所述目标容器组不满足所述原地更新条件的情况下,删除所述目标容器组,以使所述副本集控制组件根据所述目标容器组的更新后资源规格信息,创建对应的容器组。6.一种集群资源伸缩方法,其特征在于,应用于容器集群管理系统中的节点代理组件,所述容器集群管理系统还包括接口服务组件以及调度组件;所述接口服务组件支持容器组的资源规格更新功能;所述方法包括:响应于监测到所述接口服务组件对目标容器组的资源规格信息进行更新的事件,且确定所述目标容器组不具有原地更新标识,对所述目标容器组的更新后资源规格信息进行生效;所述目标容器组设置于所述节点代理组件所在工作节点上;其中,所述原地更新标识,是所述调度组件响应于监测到所述事件,且确定所述目标容器组具有所述原地更新标识,校验所述目标容器组是否满足原地更新条件后,确定所述目标容器组满足所述原地更新条件的情况下删除的。7.根据权利要求6所述的方法,其特征在于,所述目标容器组中包括多个容器;所述对
所述目标容器组的更新后资源规格信息进行生效,包括:根据所述目标容器组的更新后资源规格信息,依次更新所述目标容器组中各所述容器的资源规格信息,以及更新所述目标容器组的资源规格信息。8.根据权利要求7所述的方法,其特征在于,所述容器的资源规格信息包括内存的资源规格信息;所述依次更新所述目标容器组中各所述容器的资源规格信息,包括:对于每个所述容器,通过阶梯式的更新方式,逐次更新所述内存的资源规格信息。9.一种集群资源伸缩装置,其特征在于,应用于容器集群管理系统中的调度组件,所述容器集群管理系统还包括接口服务组件以及至少一个工作节点上的节点代理组件;所述接口服务组件支持容器组的资源规格更新功能;所述装置包括:校验模块,用于响应于监测到所述接口服务组件对目标容器组的资源规格信息进行更新的事件,且确定所述目标容器组具有原地更新标识,校验所述目标容器组是否满足原地更新条件;第一处理模块,用于在确定所述目标容器组满足所述原地更新条件的情况下,删除所述目标容器组具有的所述原地更新标识,以使所述目标容器组所在工作节点上的节点代理组件,响应于监测到所述事件,且确定所述目标容器组不具有所述原地更新标识,对所述目标容器组的更新后资源规格信息进行生效。10.根据权利要求9所述的装置,其特征在于,所述容器集群管理系统还包括副本集控制组件及部署控制组件;所述目标容器组,由所述部署控制组件通过所述副本集控制组件进行管理...
【专利技术属性】
技术研发人员:昌易,
申请(专利权)人:小米汽车科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。