System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 资源管理方法、装置、系统及存储介质制造方法及图纸_技高网

资源管理方法、装置、系统及存储介质制造方法及图纸

技术编号:40642882 阅读:5 留言:0更新日期:2024-03-13 21:23
本公开涉及计算机技术领域,涉及一种资源管理方法、装置、系统及存储介质,该方法包括:接收资源扩充指令,资源扩充指令用于扩充目标虚拟GPU的计算资源,目标虚拟GPU为第一GPU中配置的多个虚拟GPU中的其中一者;在多个虚拟GPU对应的计算资源总和加上资源扩充指令指示的扩充资源量的值超过第一GPU的计算资源上限的情况下,将目标虚拟GPU迁移至第二GPU;基于资源扩充指令,在第二GPU中扩充目标虚拟GPU的计算资源。由此,当第一GPU的计算资源不足以扩充目标虚拟GPU的计算资源时,可以在不终止计算任务的基础上,将目标虚拟GPU迁移到第二GPU,从而在第二GPU中灵活扩充目标虚拟GPU的计算资源。

【技术实现步骤摘要】

本公开涉及计算机,具体地,涉及一种资源管理方法、装置、系统及存储介质


技术介绍

1、当前,通过gpu(图形处理器,graphics processing unit)虚拟化技术可以将一个物理gpu切分成多个虚拟gpu,由此多个虚拟gpu共享该物理gpu的计算资源。其中,计算资源包括显存资源和算力资源。

2、然而,在将物理gpu切分成多个虚拟gpu后,每个虚拟gpu可以使用的计算资源是固定的。若用户端程序需要扩充所使用的虚拟gpu的计算资源,往往需要重新进行物理gpu的资源划分,并且重启虚拟gpu中正在执行的计算任务。由此可见,相关技术中的这种方式造成对虚拟gpu资源分配的限制,灵活性较低。


技术实现思路

1、本公开的目的是提供一种资源管理方法、装置、系统及存储介质,提高对虚拟gpu资源分配的灵活性。

2、为了实现上述目的,本公开实施例的第一方面提供一种资源管理方法,所述方法包括:

3、接收资源扩充指令,所述资源扩充指令用于扩充目标虚拟gpu的计算资源,所述目标虚拟gpu为第一gpu中配置的多个虚拟gpu中的其中一者;

4、在所述多个虚拟gpu对应的计算资源总和加上所述资源扩充指令指示的扩充资源量的值超过所述第一gpu的计算资源上限的情况下,将所述目标虚拟gpu迁移至第二gpu;

5、基于所述资源扩充指令,在所述第二gpu中扩充所述目标虚拟gpu的计算资源。

6、可选地,所述将所述目标虚拟gpu迁移至第二gpu,包括:

7、将所述目标虚拟gpu的上下文信息打包生成虚拟设备文件,并删除所述第一gpu中的所述目标虚拟gpu;

8、在所述第二gpu中创建新的虚拟gpu;

9、基于所述虚拟设备文件中的上下文信息,将所述新的虚拟gpu配置成所述目标虚拟gpu。

10、可选地,所述基于所述虚拟设备文件中的上下文信息,将所述新的虚拟gpu配置成所述目标虚拟gpu,包括:

11、基于所述虚拟设备文件中的上下文信息,调用预设恢复接口,以将所述新的虚拟gpu配置成所述目标虚拟gpu;

12、其中,所述上下文信息包括表征所述目标虚拟gpu执行操作的操作数据和用于调度所述目标虚拟gpu的地址数据;所述预设恢复接口用于根据所述地址数据为所述新的虚拟gpu分配对应的映射地址,以及根据所述操作数据将所述新的虚拟gpu配置为对应的操作状态。

13、可选地,在将所述目标虚拟gpu迁移至第二gpu之前,所述方法还包括:

14、设置所述目标虚拟gpu的访问状态为不可访问;

15、在将所述目标虚拟gpu迁移至第二gpu之后,所述方法还包括:

16、设置所述目标虚拟gpu的访问状态为可被访问。

17、可选地,所述计算资源包括显存资源和算力资源中的至少一者,所述资源扩充指令指示用于扩充所述显存资源的显存大小,和/或,用于扩充所述算力资源的算力比例大小。

18、可选地,所述计算资源包括算力资源,所述扩充资源量表征所要扩充的算力比例大小;

19、所述在接收资源扩充指令之后,所述方法还包括:

20、在所述多个虚拟gpu对应的正在使用的算力资源总和加上所述资源扩充指令指示的算力比例大小的值未超过所述第一gpu的算力资源上限的情况下,基于所述资源扩充指令,调整所述目标虚拟gpu的设定算力阈值。

21、可选地,所述计算资源包括显存资源,所述扩充资源量表征所要扩充的显存大小;

22、所述在接收资源扩充指令之后,所述方法还包括:

23、在所述多个虚拟gpu对应的显存资源总和加上所述资源扩充指令指示的显存大小的值未超过所述第一gpu的显存资源上限的情况下,基于所述资源扩充指令,调整所述目标虚拟gpu的设定显存总量。

24、本公开实施例的第二方面提供一种资源管理装置,所述资源管理装置,包括:

25、接收模块,用于接收资源扩充指令,所述资源扩充指令用于扩充目标虚拟gpu的计算资源,所述目标虚拟gpu为第一gpu中配置的多个虚拟gpu中的其中一者;

26、迁移模块,用于在所述多个虚拟gpu对应的计算资源总和加上所述资源扩充指令指示的扩充资源量的值超过所述第一gpu的计算资源上限的情况下,将所述目标虚拟gpu迁移至第二gpu;

27、扩充模块,用于基于所述资源扩充指令,在所述第二gpu中扩充所述目标虚拟gpu的计算资源。

28、本公开实施例的第三方面提供一种资源管理系统,所述资源管理系统,包括:

29、虚拟设备管理模块;

30、虚拟gpu,所述虚拟gpu基于第一gpu或者第二gpu的计算资源运行;

31、所述虚拟设备管理模块用于执行第一方面中任一项所提供的资源管理方法。

32、本公开实施例的第四方面提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开第一方面中任一项所提供的资源管理方法的步骤。

33、通过上述技术方案,当第一gpu的计算资源不足以用于扩充有资源扩充需求的目标虚拟gpu的计算资源时,可以在不终止计算任务的基础上,将目标虚拟gpu迁移到第二gpu,并在第二gpu中基于资源扩充指令扩充目标虚拟gpu的计算资源,从而实现对目标虚拟gpu计算资源的灵活扩充。

34、本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。

本文档来自技高网...

【技术保护点】

1.一种资源管理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的资源管理方法,其特征在于,所述将所述目标虚拟GPU迁移至第二GPU,包括:

3.根据权利要求2所述的资源管理方法,其特征在于,所述基于所述虚拟设备文件中的上下文信息,将所述新的虚拟GPU配置成所述目标虚拟GPU,包括:

4.根据权利要求1-3中任一项所述的资源管理方法,其特征在于,在将所述目标虚拟GPU迁移至第二GPU之前,所述方法还包括:

5.根据权利要求1-3中任一项所述的资源管理方法,其特征在于,所述计算资源包括显存资源和算力资源中的至少一者,所述资源扩充指令指示用于扩充所述显存资源的显存大小,和/或,用于扩充所述算力资源的算力比例大小。

6.根据权利要求1-3中任一项所述的资源管理方法,其特征在于,所述计算资源包括算力资源,所述扩充资源量表征所要扩充的算力比例大小;

7.根据权利要求1-3中任一项所述的资源管理方法,其特征在于,所述计算资源包括显存资源,所述扩充资源量表征所要扩充的显存大小;

8.一种资源管理装置,其特征在于,所述资源管理装置包括:

9.一种资源管理系统,其特征在于,包括:

10.根据权利要求9所述的资源管理系统,其特征在于,所述虚拟GPU配置有元数据管理模块、显存控制模块、算力控制模块、操作管理模块、以及虚拟地址管理模块;

11.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-7中任一项所述方法的步骤。

...

【技术特征摘要】

1.一种资源管理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的资源管理方法,其特征在于,所述将所述目标虚拟gpu迁移至第二gpu,包括:

3.根据权利要求2所述的资源管理方法,其特征在于,所述基于所述虚拟设备文件中的上下文信息,将所述新的虚拟gpu配置成所述目标虚拟gpu,包括:

4.根据权利要求1-3中任一项所述的资源管理方法,其特征在于,在将所述目标虚拟gpu迁移至第二gpu之前,所述方法还包括:

5.根据权利要求1-3中任一项所述的资源管理方法,其特征在于,所述计算资源包括显存资源和算力资源中的至少一者,所述资源扩充指令指示用于扩充所述显存资源的显存大小,和/或,用于扩充所述算力资源的算力比例大小。

6.根据权利...

【专利技术属性】
技术研发人员:黄增士王鲲陈飞邹懋
申请(专利权)人:北京趋动智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1