集群资源伸缩方法、装置及容器集群管理系统制造方法及图纸

技术编号:35143712 阅读:19 留言:0更新日期:2022-10-05 10:20
本公开提出一种集群资源伸缩方法、装置及容器集群管理系统系统,应用于自动驾驶技术领域,方法包括:响应于监测到接口服务组件对目标容器组的资源规格信息进行更新的事件,且确定目标容器组具有原地更新标识;在确定目标容器组满足原地更新条件的情况下,删除原地更新标识,以使目标容器组所在工作节点上的节点代理组件,响应于监测到事件且确定目标容器组不具有原地更新标识,对目标容器组的更新后资源规格信息进行生效。能够通过调度组件与接口服务组件、节点代理组件协作实现集群资源的垂直伸缩,且无需删除当前正在运行的容器组,避免了当前正在运行的服务被中断,在业务负载变化较快的场景下仍能保证服务的质量,对容器组管理的灵活性高。理的灵活性高。理的灵活性高。

【技术实现步骤摘要】
集群资源伸缩方法、装置及容器集群管理系统


[0001]本公开涉及自动驾驶
,具体涉及一种集群资源伸缩方法、装置及容器集群管理系统。

技术介绍

[0002]随着容器化技术的日益成熟及普及,主流机器学习平台普遍使用容器集群管理系统(Kubernetes,简称k8s)作为业务容器化的基础设施。而在k8s系统的资源调度过程中,面临着严重的资源碎片化问题。
[0003]相关技术,为了解决资源碎片化问题,可以通过垂直容器组自动扩缩容(Vertical Pod Autoscaler,简称VPA)技术,根据容器资源使用率,自动设置容器资源的资源规格,以实现集群资源的垂直伸缩。但是相关技术中的VPA技术,在对集群资源进行垂直伸缩时,需要将当前正在运行的容器组(Pod)删除,再根据计算得到的新的资源规格信息,创建新的容器组,而删除当前的容器组会导致该容器组中的服务中断,从而影响服务的质量,在业务负载变化较快的场景下,该集群资源垂直伸缩方式对容器组管理的灵活性差。

技术实现思路

[0004]本公开提供了一种集群资源伸缩方法、装置及容器集群管理系统。
[0005]根据本公开的一方面,提供了一种集群资源伸缩方法,应用于容器集群管理系统中的调度组件,所述容器集群管理系统还包括接口服务组件以及至少一个工作节点上的节点代理组件;所述接口服务组件支持容器组的资源规格更新功能;所述方法包括:响应于监测到所述接口服务组件对目标容器组的资源规格信息进行更新的事件,且确定所述目标容器组具有原地更新标识,校验所述目标容器组是否满足原地更新条件;在确定所述目标容器组满足所述原地更新条件的情况下,删除所述目标容器组具有的所述原地更新标识,以使所述目标容器组所在工作节点上的节点代理组件,响应于监测到所述事件,且确定所述目标容器组不具有所述原地更新标识,对所述目标容器组的更新后资源规格信息进行生效。
[0006]根据本公开的另一方面,提供了一种集群资源伸缩方法,应用于容器集群管理系统中的节点代理组件,所述容器集群管理系统还包括接口服务组件以及调度组件;所述接口服务组件支持容器组的资源规格更新功能;所述方法包括:响应于监测到所述接口服务组件对目标容器组的资源规格信息进行更新的事件,且确定所述目标容器组不具有原地更新标识,对所述目标容器组的更新后资源规格信息进行生效;所述目标容器组设置于所述节点代理组件所在工作节点上;其中,所述原地更新标识,是所述调度组件响应于监测到所述事件,且确定所述目标容器组具有所述原地更新标识,校验所述目标容器组是否满足原地更新条件后,确定所述目标容器组满足所述原地更新条件的情况下删除的。
[0007]根据本公开的另一方面,提供了一种集群资源伸缩装置,应用于容器集群管理系统中的调度组件,所述容器集群管理系统还包括接口服务组件以及至少一个工作节点上的
节点代理组件;所述接口服务组件支持容器组的资源规格更新功能;所述装置包括:校验模块,用于响应于监测到所述接口服务组件对目标容器组的资源规格信息进行更新的事件,且确定所述目标容器组具有原地更新标识,校验所述目标容器组是否满足原地更新条件;第一处理模块,用于在确定所述目标容器组满足所述原地更新条件的情况下,删除所述目标容器组具有的所述原地更新标识,以使所述目标容器组所在工作节点上的节点代理组件,响应于监测到所述事件,且确定所述目标容器组不具有所述原地更新标识,对所述目标容器组的更新后资源规格信息进行生效。
[0008]根据本公开的另一方面,提供了一种集群资源伸缩装置,应用于容器集群管理系统中的节点代理组件,所述容器集群管理系统还包括接口服务组件以及调度组件;所述接口服务组件支持容器组的资源规格更新功能;所述装置包括:第二处理模块,用于响应于监测到所述接口服务组件对目标容器组的资源规格信息进行更新的事件,且确定所述目标容器组不具有原地更新标识,对所述目标容器组的更新后资源规格信息进行生效;所述目标容器组设置于所述节点代理组件所在工作节点上;其中,所述原地更新标识,是所述调度组件响应于监测到所述事件,且确定所述目标容器组具有所述原地更新标识,校验所述目标容器组是否满足原地更新条件后,确定所述目标容器组满足所述原地更新条件的情况下删除的。
[0009]根据本公开的另一方面,提供了一种容器集群管理系统,包括接口服务组件,用于对目标容器组的资源规格信息进行更新,并生成对所述目标容器组的资源规格信息进行更新的事件;调度组件,用于执行本公开第一方面实施例所述的集群资源伸缩方法;至少一个工作节点上的节点代理组件,用于执行本公开第二方面实施例所述的集群资源伸缩方法。
[0010]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开第一方面实施例所述的方法,或者执行本公开第二方面实施例所述的方法。
[0011]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开第一方面实施例所述的方法,或者执行本公开第二方面实施例所述的方法。
[0012]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开上述第一方面实施例所述的方法,或者实现本公开上述第二方面实施例所述的方法。
[0013]本公开的技术方案,应用于容器集群管理系统中的调度组件,容器集群管理系统还包括接口服务组件以及至少一个工作节点上的节点代理组件,通过设置接口服务组件支持容器组的资源规格更新功能,调度组件响应于监测到接口服务组件对目标容器组的资源规格信息进行更新的事件,且确定目标容器组具有原地更新标识,校验目标容器组是否满足原地更新条件,在确定目标容器组满足原地更新条件的情况下,删除目标容器组具有的原地更新标识,以使目标容器组所在工作节点上的节点代理组件,响应于监测到事件,且确定目标容器组不具有原地更新标识,对目标容器组的更新后资源规格信息进行生效,从而能够通过容器集群管理系统中的调度组件与接口服务组件、节点代理组件协作实现集群资源的垂直伸缩,且由于无需删除当前正在运行的容器组,从而避免了当前正在运行的服务
被中断,在业务负载变化较快的场景下,仍能保证服务的质量,对容器组管理的灵活性高。
[0014]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0015]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0016]图1为本公开实施例一所提供的集群资源伸缩方法的流程示意图;
[0017]图2为本公开实施例二所提供的集群资源伸缩方法的流程示意图;
[0018]图3为本公开实施例三所提供的集群资源伸缩方法的流程示意图;
[001本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种集群资源伸缩方法,其特征在于,应用于容器集群管理系统中的调度组件,所述容器集群管理系统还包括接口服务组件以及至少一个工作节点上的节点代理组件;所述接口服务组件支持容器组的资源规格更新功能;所述方法包括:响应于监测到所述接口服务组件对目标容器组的资源规格信息进行更新的事件,且确定所述目标容器组具有原地更新标识,校验所述目标容器组是否满足原地更新条件;在确定所述目标容器组满足所述原地更新条件的情况下,删除所述目标容器组具有的所述原地更新标识,以使所述目标容器组所在工作节点上的节点代理组件,响应于监测到所述事件,且确定所述目标容器组不具有所述原地更新标识,对所述目标容器组的更新后资源规格信息进行生效。2.根据权利要求1所述的方法,其特征在于,所述容器集群管理系统还包括副本集控制组件及部署控制组件;所述目标容器组,由所述部署控制组件通过所述副本集控制组件进行管理;所述原地更新标识,是所述部署控制组件,响应于监测到所述接口服务组件对部署资源的资源规格信息进行更新,为所述目标容器组创建的;所述事件,是所述接口服务组件响应于接收到所述副本集控制组件发送的,对所管理的所述目标容器组的资源规格信息的更新请求,对所述目标容器组的资源规格信息进行更新而生成的;所述更新请求,是所述副本集控制组件,响应于监测到所述接口服务组件对副本集资源的资源规格信息进行更新发送的。3.根据权利要求1所述的方法,其特征在于,所述更新后资源规格信息包括目标资源量;所述原地更新条件,包括:所述目标容器组所在工作节点中的可用资源量,不低于所述目标资源量。4.根据权利要求3所述的方法,其特征在于,所述校验所述目标容器组是否满足原地更新条件之后,还包括:在确定所述目标容器组满足所述原地更新条件的情况下,更新已存储的所述目标容器组的资源规格信息,以及更新已存储的所述目标容器组所在工作节点中的可用资源量。5.根据权利要求2所述的方法,其特征在于,所述校验所述目标容器组是否满足原地更新条件之后,还包括:在确定所述目标容器组不满足所述原地更新条件的情况下,删除所述目标容器组,以使所述副本集控制组件根据所述目标容器组的更新后资源规格信息,创建对应的容器组。6.一种集群资源伸缩方法,其特征在于,应用于容器集群管理系统中的节点代理组件,所述容器集群管理系统还包括接口服务组件以及调度组件;所述接口服务组件支持容器组的资源规格更新功能;所述方法包括:响应于监测到所述接口服务组件对目标容器组的资源规格信息进行更新的事件,且确定所述目标容器组不具有原地更新标识,对所述目标容器组的更新后资源规格信息进行生效;所述目标容器组设置于所述节点代理组件所在工作节点上;其中,所述原地更新标识,是所述调度组件响应于监测到所述事件,且确定所述目标容器组具有所述原地更新标识,校验所述目标容器组是否满足原地更新条件后,确定所述目标容器组满足所述原地更新条件的情况下删除的。7.根据权利要求6所述的方法,其特征在于,所述目标容器组中包括多个容器;所述对
所述目标容器组的更新后资源规格信息进行生效,包括:根据所述目标容器组的更新后资源规格信息,依次更新所述目标容器组中各所述容器的资源规格信息,以及更新所述目标容器组的资源规格信息。8.根据权利要求7所述的方法,其特征在于,所述容器的资源规格信息包括内存的资源规格信息;所述依次更新所述目标容器组中各所述容器的资源规格信息,包括:对于每个所述容器,通过阶梯式的更新方式,逐次更新所述内存的资源规格信息。9.一种集群资源伸缩装置,其特征在于,应用于容器集群管理系统中的调度组件,所述容器集群管理系统还包括接口服务组件以及至少一个工作节点上的节点代理组件;所述接口服务组件支持容器组的资源规格更新功能;所述装置包括:校验模块,用于响应于监测到所述接口服务组件对目标容器组的资源规格信息进行更新的事件,且确定所述目标容器组具有原地更新标识,校验所述目标容器组是否满足原地更新条件;第一处理模块,用于在确定所述目标容器组满足所述原地更新条件的情况下,删除所述目标容器组具有的所述原地更新标识,以使所述目标容器组所在工作节点上的节点代理组件,响应于监测到所述事件,且确定所述目标容器组不具有所述原地更新标识,对所述目标容器组的更新后资源规格信息进行生效。10.根据权利要求9所述的装置,其特征在于,所述容器集群管理系统还包括副本集控制组件及部署控制组件;所述目标容器组,由所述部署控制组件通过所述副本集控制组件进行管理...

【专利技术属性】
技术研发人员:昌易
申请(专利权)人:小米汽车科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1