System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种计算资源的调度方法及装置制造方法及图纸_技高网

一种计算资源的调度方法及装置制造方法及图纸

技术编号:40669606 阅读:4 留言:0更新日期:2024-03-18 19:05
本说明书提供一种计算资源的调度方法及装置,应用于与设备服务器集群相连的设备管理平台,所述设备服务器集群中的设备服务器分别归属于相应的团体;所述方法包括:获取来自目标团体的目标计算任务以及执行所述目标计算任务所需的预期计算资源;获取所述目标团体拥有的目标设备服务器所对应的剩余计算资源;在所述预期计算资源大于所述剩余计算资源的情况下,调用其他团体拥有的设备服务器所对应的计算资源分配至所述目标计算任务。

【技术实现步骤摘要】

本专利技术涉及计算机,尤其涉及一种计算资源的调度方法及装置


技术介绍

1、在数据计算场景中,通常可以借助设备服务器的计算能力解决用户需要解决的计算任务。面对涉及复杂计算需求的业务场景,通常需要不同团队共同借助设备服务器的计算资源实现各自的计算任务,然而,设备服务器所能提供的最大计算资源是固定的,这意味着一旦任一团队调用过多计算资源分配至自身的计算任务,那么意味着除上述任一团队的其他团队的计算任务在同一时间只能被分配到更少的计算资源,进而引发计算资源分配不均的情况,导致各计算任务之间的执行效率出现较大差异,整体计算效率下降。


技术实现思路

1、有鉴于此,本专利技术提供一种计算资源的调度方法及装置,以解决相关技术中的不足。

2、具体地,本专利技术是通过如下技术方案实现:

3、根据本专利技术的第一方面,提供了一种计算资源的调度方法,应用于与设备服务器集群相连的设备管理平台,所述设备服务器集群中的设备服务器分别归属于相应的团体;所述方法包括:

4、获取来自目标团体的目标计算任务以及执行所述目标计算任务所需的预期计算资源;

5、获取所述目标团体拥有的目标设备服务器所对应的剩余计算资源;

6、在所述预期计算资源大于所述剩余计算资源的情况下,调用其他团体拥有的设备服务器所对应的计算资源分配至所述目标计算任务。

7、根据本专利技术的第二方面,提供了一种模型训练方法,应用于与设备服务器集群相连的模型训练平台,所述设备服务器集群中的设备服务器分别归属于相应的团体;所述方法包括:

8、任务获取单元,用于获取来自目标团体的目标模型训练任务以及执行所述目标模型训练任务所需的预期计算资源;

9、剩余计算资源获取单元,用于获取所述目标团体拥有的目标设备服务器所对应的剩余计算资源;

10、任务执行单元,用于在所述预期计算资源大于所述剩余计算资源的情况下,调用其他团体拥有的设备服务器所对应的计算资源分配至所述目标模型训练任务,以执行所述目标模型训练任务。

11、根据本专利技术的第三方面,提供了一种计算资源的调度装置,应用于与设备服务器集群相连的设备管理平台,所述设备服务器集群中的设备服务器分别归属于相应的团体;所述装置包括:

12、任务获取单元,用于获取来自目标团体的目标计算任务以及执行所述目标计算任务所需的预期计算资源;

13、剩余计算资源获取单元,用于获取所述目标团体拥有的目标设备服务器所对应的剩余计算资源;

14、其他团体资源调用单元,用于在所述预期计算资源大于所述剩余计算资源的情况下,调用其他团体拥有的设备服务器所对应的计算资源分配至所述目标计算任务。

15、根据本专利技术的第四方面,提供了一种模型训练系统,包括:模型训练平台与设备服务器集群,所述模型训练平台与所述设备服务器集群相连,所述设备服务器集群中的设备服务器分别归属于相应的团体;其中:

16、所述模型训练平台,用于获取来自目标团体的目标模型训练任务以及执行所述目标模型训练任务所需的预期计算资源,并获取所述目标团体拥有的目标设备服务器所对应的剩余计算资源,并在所述预期计算资源大于所述剩余计算资源的情况下,调用其他团体拥有的设备服务器所对应的计算资源分配至所述目标模型训练任务;

17、所述设备服务器集群,用于根据分配至所述目标模型训练任务的设备服务器执行所述目标模型训练任务。

18、根据本说明书实施例的第五方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如第一方面或第二方面所述的方法的步骤。

19、根据本说明书实施例的第六方面,提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面或第二方面所述的方法的步骤。

20、本专利技术的实施例提供的技术方案可以包括以下有益效果:

21、在本专利技术的实施例中,通过将设备服务器集群中的设备服务器与各团体建立归属关系,使得设备管理平台获取到来自目标团体的目标计算任务时,可以优先将该目标团体拥有的目标设备服务器所对应的剩余计算资源与执行目标计算任务所需的预期计算资源进行比较,并在预期计算资源大于剩余计算资源的情况下,设备管理平台还可以基于类似资源借用的逻辑调用其他团体拥有的设备服务器所对应的计算资源分配至目标计算任务,进而保证目标计算任务可以尽可能分配到足够的计算资源。

本文档来自技高网...

【技术保护点】

1.一种计算资源的调度方法,其特征在于,应用于与设备服务器集群相连的设备管理平台,所述设备服务器集群中的设备服务器分别归属于相应的团体;所述方法包括:

2.根据权利要求1所述的方法,其特征在于,任一设备服务器为主要设备服务器或次要设备服务器,所述主要设备服务器用于执行来自所属团体的计算任务,所述次要设备服务器用于执行至少一部分来自其他团体的计算任务;所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述设备管理平台维护有各个计算任务的执行优先级信息;所述结束目标团体拥有的任一次要设备服务器中正在执行的来自其他团体的计算任务,包括:

4.根据权利要求3所述的方法,其特征在于,每一设备服务器中包含有物理硬件;所述执行优先级信息与对应计算任务的执行优先程度、已执行时长以及是否由同一设备服务器内的物理硬件执行的相关。

5.根据权利要求2所述的方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述设备管理平台维护有对应任一设备服务器的调用条件和/或调用规则,所述调用规则用于表述所述任一设备服务器所对应的计算资源的调用时长阈值或调用数据量阈值。

7.根据权利要求1所述的方法,其特征在于,所述方法还包括:

8.一种模型训练方法,其特征在于,应用于与设备服务器集群相连的模型训练平台,所述设备服务器集群中的设备服务器分别归属于相应的团体;所述方法包括:

9.一种计算资源的调度装置,其特征在于,应用于与设备服务器集群相连的设备管理平台,所述设备服务器集群中的设备服务器分别归属于相应的团体;所述装置包括:

10.一种模型训练系统,其特征在于,包括:模型训练平台与设备服务器集群,所述模型训练平台与所述设备服务器集群相连,所述设备服务器集群中的设备服务器分别归属于相应的团体;其中:

11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1~8任一所述方法的步骤。

12.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1~8任一所述方法的步骤。

...

【技术特征摘要】

1.一种计算资源的调度方法,其特征在于,应用于与设备服务器集群相连的设备管理平台,所述设备服务器集群中的设备服务器分别归属于相应的团体;所述方法包括:

2.根据权利要求1所述的方法,其特征在于,任一设备服务器为主要设备服务器或次要设备服务器,所述主要设备服务器用于执行来自所属团体的计算任务,所述次要设备服务器用于执行至少一部分来自其他团体的计算任务;所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述设备管理平台维护有各个计算任务的执行优先级信息;所述结束目标团体拥有的任一次要设备服务器中正在执行的来自其他团体的计算任务,包括:

4.根据权利要求3所述的方法,其特征在于,每一设备服务器中包含有物理硬件;所述执行优先级信息与对应计算任务的执行优先程度、已执行时长以及是否由同一设备服务器内的物理硬件执行的相关。

5.根据权利要求2所述的方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述设备管理平台维护有对应任一设备服务器的调用条件和/或调用规则,所述调用规则用...

【专利技术属性】
技术研发人员:孙丽娜李刚
申请(专利权)人:浙江极氪智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1