【技术实现步骤摘要】
面向GPU碎片资源的容器调度方法、装置
[0001]本专利技术涉及GPU
,尤其涉及一种面向GPU碎片资源的容器调度方法、装置。
技术介绍
[0002]近年来,容器技术以轻量级,可移植,易于开发,部署等特点,在互联网企业中迅速普及,Kubernetes作为谷歌开源的容器编排平台,已经是事实上的容器编排标准。与此同时,人工智能在各行业大范围普及,通过容器技术高效管理GPU设备,保证资源合理利用至关重要。
[0003]但目前的技术存在容器独占GPU设备的问题,无法充分发挥GPU效益,对于待调度容器任务只是初始化调度到某一节点运行,没有考虑在运行过程中集群资源动态变化问题,容易造成GPU资源浪费,导致GPU资源利用不充分。
技术实现思路
[0004]针对现有技术的不足,本专利技术提出一种面向GPU碎片资源的容器调度方法、装置,该方法通过增强调度器对GPU碎片资源利用,提高了集群资源利用率。
[0005]为了实现上述目的,本专利技术一方面提供一种面向GPU碎片资源的容器调度方法,包括:
...
【技术保护点】
【技术特征摘要】
1.一种面向GPU碎片资源的容器调度方法,其特征在于,包括:获取GPU集群中待调度容器的资源需求;根据所述待调度容器的资源需求对所述GPU集群中的所有节点进行预选,获得预选节点列表;依据所述预选节点列表,确定出所述待调度容器的目标节点。2.根据权利要求1所述的方法,其特征在于,所述根据所述待调度容器的资源需求对所述GPU集群中的所有节点进行预选,获得预选节点列表,包括:依据未被调度容器资源需求对所述GPU集群中的所有节点进行预选,排除资源不足的节点,获得第一预选节点列表,所述预选节点列表包括第一预选节点列表;在第一预选节点列表不为空的情况下,所述依据所述预选节点列表,确定出所述待调度容器的目标节点,包括:依据所述第一预选节点列表,确定出所述待调度容器的目标节点。3.根据权利要求2所述的方法,其特征在于,在所述第一预选节点列表为空的情况下,所述根据所述待调度容器的资源需求对所述GPU集群中的所有节点进行预选,获得预选节点列表,还包括:通过迁移策略为所述待调度容器整理集群碎片资源,获取满足预设资源需求的第一节点,将所述第一节点加入所述第一预选节点列表,得到第二预选节点列表,所述预选节点列表包括第二预选节点列表;所述依据所述预选节点列表,确定出所述待调度容器的目标节点,包括:依据所述第二预选节点列表,确定出所述待调度容器的目标节点。4.根据权利要求3所述的方法,其特征在于,所述通过迁移策略为所述待调度容器整理集群碎片资源,获取满足预设资源需求的第一节点,将所述第一节点加入所述第一预选节点列表,包括:将节点按剩余资源大小分为第一分组、第二分组,所述第一分组比所述第二分组对应的剩余资源多;所述第一分组与第二分组之间通过贪心算法迁移容器使所述第一分组获得更多的资源;在所述第一分组内按照贪心算法迁移容器整理出剩余资源最多的第一节点;在所述第一节点的剩余资源满足待调度容器的预设资源需求的情况下,将所述第一节点加入所述第一预选节点列表。5.根据权利要求1
‑
4任一项所述的方法,其特征在于,依据所述预选节点列表,确定出所述待调度容器的目标节点,包括:依据所述预选节点列表内各节点,构建目标函数;依据所述目标函数,确定所述目标节点。6.根据权利要求5所述的方法,其特征在于,所述目标函数为:
其...
【专利技术属性】
技术研发人员:张尚宇,孙毓忠,张凯,李伟民,
申请(专利权)人:中国科学院计算技术研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。