System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种GPU资源调度方法、装置、电子设备及存储介质制造方法及图纸_技高网

一种GPU资源调度方法、装置、电子设备及存储介质制造方法及图纸

技术编号:40588489 阅读:7 留言:0更新日期:2024-03-12 21:48
本发明专利技术公开了一种GPU资源调度方法、装置、电子设备及存储介质。包括:接收待调度服务请求;在节点的第一指标数据满足待调度服务请求对应的资源配额且节点的GPU卡的第二指标数据均不满足待调度服务请求对应的资源配额的情况下,根据待调度服务请求对应的资源配额、第一指标数据、第二指标数据对不满足资源配额的GPU卡执行服务压缩策略和/或滚动腾退策略;确定目标GPU卡,将目标GPU卡对应的节点作为目标调度节点,目标GPU卡为经服务压缩策略和/或滚动腾退策略处理后满足待调度服务请求对应的资源配额的GPU卡。通过本方案实现了根据指标数据对GPU资源的动态调度方法,解决了GPU资源使用率不平衡和利用率差的问题,提高对GPU资源的合理调度,较少资源浪费。

【技术实现步骤摘要】

本专利技术涉及互联网,尤其涉及一种gpu资源调度方法、装置、电子设备及存储介质。


技术介绍

1、人工智能领域发展迅速,机器学习训练和推理的过程需要调度大量gpu(graphicsprocessing unit,图像处理器)资源来完成,能够高效地调度资源是亟待解决的问题,常通过将gpu资源虚拟化,将多个虚拟机或容器分配到一个物理gpu上,从而实现多服务共享gpu资源的目的。

2、kubernetes集群中使用gpu资源进行虚拟化和管理的技术,允许用户在容器中运行需要gpu加速的工作负载,并有效地共享和管理gpu资源。实现kubernetes gpu虚拟化通常依赖于gpu设备插件,插件通过与kubernetes调度器和容器运行时的集成,使得gpu资源可以动态分配和调度给容器。在使用kubernetes gpu虚拟化时,用户可以通过定义gpu资源需求和限制来指定容器对gpu的使用。这样,kubernetes可以根据gpu资源的可用性和调度策略,将合适的gpu资源分配给容器。目前kubernetes的资源调度器是根据节点的资源剩余量进行评分调度的,存在gpu资源使用率不平衡和利用率差的问题。


技术实现思路

1、本专利技术提供了一种gpu资源调度方法、装置、电子设备及存储介质,以解决gpu资源使用率不平衡和利用率差的问题。

2、根据本专利技术的一方面,提供了一种gpu资源调度方法,包括:

3、接收待调度服务请求;

4、在节点的第一指标数据满足待调度服务请求对应的资源配额且节点的gpu卡的第二指标数据均不满足待调度服务请求对应的资源配额的情况下,根据待调度服务请求对应的资源配额、第一指标数据、第二指标数据对不满足资源配额的gpu卡执行服务压缩策略和/或滚动腾退策略;

5、确定目标gpu卡,将目标gpu卡对应的节点作为目标调度节点,目标gpu卡为经服务压缩策略和/或滚动腾退策略处理后满足待调度服务请求对应的资源配额的gpu卡

6、可选的,服务压缩策略包括:

7、遍历节点的gpu卡上的服务,在服务为可压缩服务,且可压缩服务的资源利用量低于可压缩服务的资源配额的情况下,对可压缩服务进行压缩处理;

8、在经过压缩处理后的可压缩服务对应的gpu卡的资源量满足待调度服务请求对应的资源配额的情况下,将gpu卡作为目标gpu卡。

9、可选的,滚动腾退策略包括:

10、在服务为可滚动腾退服务的情况下,确定可滚动腾退服务在执行滚动腾退后的预计资源量;

11、若可滚动腾退服务的预计资源量满足待调度服务请求对应的资源配额,则将可滚动腾退服务对应的gpu卡作为目标gpu卡;

12、若可滚动腾退服务的预计资源量不满足待调度服务请求对应的资源配额,则遍历其他节点,基于其他节点中的可滚动腾退服务确定目标gpu卡。

13、可选的,还包括:对目标gpu卡中的可滚动腾退服务执行滚动腾退,其中,滚动腾退的过程包括:创建新的gpu实例,回收可滚动腾退服务。

14、可选的,在接收待调度服务请求之后,包括:

15、遍历节点和节点的gpu卡,判断每一节点的第一指标数据是否满足待调度服务请求对应的配额,和/或,节点的gpu卡的第二指标数据是否满足待调度服务请求对应的配额。

16、可选的,还包括:

17、在节点的第一指标数据满足待调度服务请求对应的资源配额且节点的gpu卡的第二指标数据均满足待调度服务请求对应的资源配额的情况下,获取预设调度策略配置信息,基于预设调度策略配置信息确定是否开启平均分配原则,若开启平均分配原则,则执行平均分配策略,确定目标gpu卡。

18、可选的,还包括:在遍历集群中所有节点的gpu卡,获取gpu卡的指标数据,确定可调度的服务的资源配额,判断gpu卡的总额度减去可调度的服务的资源配额的差值是否满足待调度服务请求对应的资源配额,若不满足待调度服务请求对应的资源配额,则调度失败。

19、根据本专利技术的另一方面,提供了一种gpu资源调度装置,包括:

20、待调度服务请求接收模块,用于接收待调度服务请求;

21、策略执行模块,用于在节点的第一指标数据满足服务压缩策略和/或待调度服务请求对应的资源配额且服务压缩策略和/或节点的gpu卡的第二指标数据均不满足服务压缩策略和/或待调度服务请求对应的资源配额的情况下,根据服务压缩策略和/或待调度服务请求对应的资源配额、服务压缩策略和/或第一指标数据、服务压缩策略和/或第二指标数据对不满足服务压缩策略和/或资源配额的gpu卡执行服务压缩策略和/或滚动腾退策略;

22、目标gpu卡确定模块,用于确定目标gpu卡,将服务压缩策略和/或目标gpu卡对应的节点作为目标调度节点,服务压缩策略和/或目标gpu卡为经服务压缩策略和/或服务压缩策略和/或服务压缩策略和/或滚动腾退策略处理后满足待调度服务请求对应的资源配额的gpu卡。

23、根据本专利技术的另一方面,提供了一种电子设备,电子设备包括:

24、至少一个处理器;以及

25、与至少一个处理器通信连接的存储器;其中,

26、存储器存储有可被至少一个处理器执行的计算机程序,计算机程序被至少一个处理器执行,以使至少一个处理器能够执行本专利技术任一实施例的gpu资源调度方法。

27、根据本专利技术的另一方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,计算机指令用于使处理器执行时实现本专利技术任一实施例的gpu资源调度方法。

28、本专利技术实施例的技术方案,通过接收待调度服务请求;在节点的第一指标数据满足待调度服务请求对应的资源配额且节点的gpu卡的第二指标数据均不满足待调度服务请求对应的资源配额的情况下,根据待调度服务请求对应的资源配额、第一指标数据、第二指标数据对不满足资源配额的gpu卡执行服务压缩策略和/或滚动腾退策略;确定目标gpu卡,将目标gpu卡对应的节点作为目标调度节点,目标gpu卡为经服务压缩策略和/或滚动腾退策略处理后满足待调度服务请求对应的资源配额的gpu卡。通过本方案实现了根据指标数据对gpu资源的动态调度,解决了gpu资源使用率不平衡和利用率差的问题,提高对gpu资源的动态调度的合理性和高效性,较少资源浪费。

29、应当理解,本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征,也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。

本文档来自技高网...

【技术保护点】

1.一种GPU资源调度方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述服务压缩策略包括:

3.根据权利要求1或2所述的方法,其特征在于,所述滚动腾退策略包括:

4.根据权利要求3所述的方法,其特征在于,还包括:

5.根据权利要求1所述方法,其特征在于,在所述接收待调度服务请求之后,包括:

6.根据权利要求1所述方法,其特征在于,还包括:

7.根据权利要求1所述的方法,其特征在于,还包括:

8.一种GPU资源调度装置,其特征在于,包括:

9.一种电子设备,其特征在于,所述电子设备包括:

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的GPU资源调度方法。

【技术特征摘要】

1.一种gpu资源调度方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述服务压缩策略包括:

3.根据权利要求1或2所述的方法,其特征在于,所述滚动腾退策略包括:

4.根据权利要求3所述的方法,其特征在于,还包括:

5.根据权利要求1所述方法,其特征在于,在所述接收待调度服务请求之后,包括:

6.根据权利要求1所...

【专利技术属性】
技术研发人员:张忠仁段光辉马俊才高立江李树辉李传波陈香甫陈红彪张大伟卢加乐徐庆洲
申请(专利权)人:中邮信息科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1