System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及计算机,尤其涉及一种资源调度方法、装置、设备及存储介质。
技术介绍
1、随着科技的快速发展,人工智能、云计算和大数据等技术的应用愈加广泛。其中,图形处理器(graphics processing unit,gpu)资源作为设备的常见资源,在这些技术的应用中发挥着重要的作用。
2、在实际应用中,可以通过容器管理平台来管理gpu集群,对gpu资源进行调度。其中,容器管理平台,例如是kubernetes(k8s)。但是,当前的资源调度方法易造成资源的严重浪费。
技术实现思路
1、本申请实施例提供了一种资源调度方法、装置、设备及存储介质,以便捷地扩展资源调度单元的规则,避免资源调度单元臃肿,简化调用过程。
2、第一方面,本申请实施例提供了一种资源调度方法,包括:
3、响应于针对图形处理器gpu资源的调度请求,获取所述调度请求包括的第一任务的第一资源需求量;
4、获取gpu卡队列中的第一gpu卡的第一资源剩余量和第二gpu卡的第二资源剩余量;所述第一资源剩余量小于所述第一gpu卡的资源总量,所述第二资源剩余量等于所述第二gpu卡的资源总量;
5、当所述第一资源剩余量大于或等于所述第一资源需求量,将所述第一任务的标识信息和所述第一gpu卡的标识信息发送至容器管理平台,以便所述容器管理平台将所述第一任务分配给所述第一gpu卡;
6、当所述第一资源剩余量小于所述第一资源需求量,且所述第二资源剩余量大于或等于所述第一资
7、可选地,所述方法还包括:
8、当所述第一资源剩余量小于所述第一资源需求量,且所述第二资源剩余量小于所述第一资源需求量,从所述gpu卡队列中确定第三gpu卡;所述第三gpu卡的资源剩余量大于或等于所述第一资源需求量;
9、将所述第一任务的标识信息和所述第三gpu卡的标识信息发送至容器管理平台,以便所述容器管理平台将所述第一任务分配给所述第三gpu卡。
10、可选地,所述调度请求还包括第二任务的第二资源需求量;当所述第一任务由所述容器管理平台分配给所述第一gpu卡之后,所述方法还包括:
11、当所述第一gpu卡的第三资源剩余量大于或等于所述第二资源需求量,将所述第二任务的标识信息和所述第一gpu卡的标识信息发送至所述容器管理平台,以便所述容器管理平台将所述第二任务分配给所述第一gpu卡;所述第三资源剩余量为所述第一资源剩余量和所述第一资源需求量之差;
12、当所述第三资源剩余量小于所述第二资源需求量,且所述第二资源剩余量大于或等于所述第二资源需求量,将所述第二任务的标识信息和所述第二gpu卡的标识信息发送至所述容器管理平台,以便所述容器管理平台将所述第二任务分配给所述第二gpu卡。
13、可选地,当所述第一任务由所述容器管理平台分配给所述第二gpu卡之后,所述方法还包括:
14、当所述第二资源剩余量大于或等于所述第二资源需求量,将所述第二任务的标识信息和所述第一gpu卡的标识信息发送至所述容器管理平台,以便所述容器管理平台将所述第二任务分配给所述第一gpu卡;
15、当所述第二资源剩余量小于所述第二资源需求量,且所述第二gpu卡的第四资源剩余量大于或等于所述第二资源需求量,将所述第二任务的标识信息和所述第二gpu卡的标识信息发送至所述容器管理平台,以便所述容器管理平台将所述第二任务分配给所述第二gpu卡;所述第四资源剩余量为所述第二资源剩余量和所述第一资源需求量之差。
16、可选地,所述方法还包括:
17、当所述调度请求包括的任务均被执行之后,确定所述gpu卡队列中的第四gpu卡;所述第四gpu卡的资源剩余量和所述第四gpu卡的资源总量相等;
18、基于所述第四gpu卡的数量和所述gpu卡队列的gpu卡总数量,确定所述gpu卡队列的剩余整卡分配率。
19、第二方面,本申请实施例提供了一种资源调度装置,包括:
20、第一获取模块,用于响应于针对图形处理器gpu资源的调度请求,获取所述调度请求包括的第一任务的第一资源需求量;
21、第二获取模块,用于获取gpu卡队列中的第一gpu卡的第一资源剩余量和第二gpu卡的第二资源剩余量;所述第一资源剩余量小于所述第一gpu卡的资源总量,所述第二资源剩余量等于所述第二gpu卡的资源总量;
22、第一发送模块,用于当所述第一资源剩余量大于或等于所述第一资源需求量,将所述第一任务的标识信息和所述第一gpu卡的标识信息发送至容器管理平台,以便所述容器管理平台将所述第一任务分配给所述第一gpu卡;
23、第二发送模块,用于当所述第一资源剩余量小于所述第一资源需求量,且所述第二资源剩余量大于或等于所述第一资源需求量,将所述第一任务的标识信息和所述第二gpu卡的标识信息发送至所述容器管理平台,以便所述容器管理平台将所述第一任务分配给所述第二gpu卡。
24、可选地,所述装置还包括:
25、第一确定模块,用于当所述第一资源剩余量小于所述第一资源需求量,且所述第二资源剩余量小于所述第一资源需求量,从所述gpu卡队列中确定第三gpu卡;所述第三gpu卡的资源剩余量大于或等于所述第一资源需求量;
26、第三发送模块,用于将所述第一任务的标识信息和所述第三gpu卡的标识信息发送至容器管理平台,以便所述容器管理平台将所述第一任务分配给所述第三gpu卡。
27、可选地,所述调度请求还包括第二任务的第二资源需求量;所述装置还包括:
28、第四发送模块,用于当所述第一gpu卡的第三资源剩余量大于或等于所述第二资源需求量,将所述第二任务的标识信息和所述第一gpu卡的标识信息发送至所述容器管理平台,以便所述容器管理平台将所述第二任务分配给所述第一gpu卡;所述第三资源剩余量为所述第一资源剩余量和所述第一资源需求量之差;
29、第五发送模块,用于当所述第三资源剩余量小于所述第二资源需求量,且所述第二资源剩余量大于或等于所述第二资源需求量,将所述第二任务的标识信息和所述第二gpu卡的标识信息发送至所述容器管理平台,以便所述容器管理平台将所述第二任务分配给所述第二gpu卡。
30、第三方面,本申请实施例提供了一种资源调度设备,所述设备包括:处理器、存储器、系统总线;
31、所述处理器以及所述存储器通过所述系统总线相连;
32、所述存储器用于存储程序,所述程序包括指令,所述指令当被所述处理器执行时使所述处理器执行上述资源调度方法的任一实现方式。
33、第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在电子设备上运行时,使得所述电本文档来自技高网...
【技术保护点】
1.一种资源调度方法,其特征在于,包括:
2.根据权利要求1所述的资源调度方法,其特征在于,所述方法还包括:
3.根据权利要求1述的资源调度方法,其特征在于,所述调度请求还包括第二任务的第二资源需求量;当所述第一任务由所述容器管理平台分配给所述第一GPU卡之后,所述方法还包括:
4.根据权利要求3所述的资源调度方法,其特征在于,当所述第一任务由所述容器管理平台分配给所述第二GPU卡之后,所述方法还包括:
5.根据权利要求1至4任一项所述的资源调度方法,其特征在于,所述方法还包括:
6.一种资源调度装置,其特征在于,包括:
7.根据权利要求6所述的资源调度装置,其特征在于,所述装置还包括:
8.根据权利要求7所述的资源调度装置,其特征在于,所述调度请求还包括第二任务的第二资源需求量;所述装置还包括:
9.一种资源调度设备,其特征在于,所述设备包括:处理器、存储器、系统总线;
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在电子设备上运
...【技术特征摘要】
1.一种资源调度方法,其特征在于,包括:
2.根据权利要求1所述的资源调度方法,其特征在于,所述方法还包括:
3.根据权利要求1述的资源调度方法,其特征在于,所述调度请求还包括第二任务的第二资源需求量;当所述第一任务由所述容器管理平台分配给所述第一gpu卡之后,所述方法还包括:
4.根据权利要求3所述的资源调度方法,其特征在于,当所述第一任务由所述容器管理平台分配给所述第二gpu卡之后,所述方法还包括:
5.根据权利要求1至4任一项所述的资源调度方法,其特征在于,所述方法还包括...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。