System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种应用于vGPU的智能算力动态调度方法及系统技术方案_技高网

一种应用于vGPU的智能算力动态调度方法及系统技术方案

技术编号:43853204 阅读:13 留言:0更新日期:2024-12-31 18:44
本申请涉及一种应用于vGPU的智能算力动态调度方法及系统,包括当接收到GPU资源请求消息时,从GPU资源请求消息中获取本次GPU资源的申请信息,申请信息包括资源申请量以及访问网络信息;将申请信息发送至预设的访问计算模型,访问计算模型基于资源申请量和访问网络信息,从预设的GPU集群中筛选出与资源申请量匹配且通信开销小于预设开销值的GPU匹配节点;将GPU匹配节点分配至对应所述GPU资源请求消息的容器以运行GPU;记录完成分配的所述GPU匹配节点的分配信息,进行存储记录并更新GPU集群。本申请具有提升基于Kubernetes的GPU资源调度中GPU的资源利用率的效果。

【技术实现步骤摘要】

本申请涉及gpu的,尤其是涉及一种应用于vgpu的智能算力动态调度方法及系统。


技术介绍

1、vgpu在虚拟化环境中分配和共享物理gpu资源,使得多个虚拟机能够同时访问一个物理gpu,从而能够高效地运行图形密集型应用程序和计算任务。

2、目前,普遍通过开源容器编排系统kubernetes来支持nvidia的gpu并行计算,在现有的kubernetesgpu集群上,gpu是最小的资源分配单位。我们使用kubernetes的设备插件框架将物理gpu划分为多个虚拟gpu,形成gpu集群拓扑,并将这些虚拟gpu分配给申请资源的容器。但kubernetes调度gpu时,不同的容器不能共享gpu,这意味着每个容器引擎将独占整个gpu,因此在进行gpu资源的访问调度时的通信开销会增大,gpu的资源没有得到最大化利用,因此需要改进。


技术实现思路

1、为了提升基于kubernetes的gpu资源调度中gpu的资源利用率,本申请提供了一种应用于vgpu的智能算力动态调度方法及系统。

2、本申请的上述专利技术目的一是通过以下技术方案得以实现的:

3、一种应用于vgpu的智能算力动态调度方法,包括步骤:

4、当接收到gpu资源请求消息时,从gpu资源请求消息中获取本次gpu资源的申请信息,申请信息包括资源申请量以及访问网络信息;

5、将申请信息发送至预设的访问计算模型,访问计算模型基于资源申请量和访问网络信息,从预设的gpu集群中筛选出与资源申请量匹配且通信开销小于预设开销值的gpu匹配节点;

6、将gpu匹配节点分配至对应所述gpu资源请求消息的容器以运行gpu;

7、记录完成分配的所述gpu匹配节点的分配信息,进行存储记录并更新gpu集群。

8、通过采用上述技术方案,当接收到gpu资源请求消息时,先识别本次申请所需的资源申请量以及申请端的访问网络信息,其中,根据访问网络信息可获知通信类型,通过通信类型能够使访问计算模型在gpu集群的拓扑结构中找到通信开销小于预设开销值的gpu节点,且通过设置预先完成训练的访问计算模型,对访问申请量以及访问网络信息的识别,能够为当前资源申请量筛选出通信开销小且匹配资源申请量的gpu匹配节点,资源申请量的匹配能够实现gpu资源申请量在gpu集群中填补gpu匹配节点的饱和度,包括大于1和介于0至1之间的不同申请量,根据不同的资源申请量去筛选gpu匹配节点,以使每一个gpu匹配节点都能都被充分的利用,完成筛选后则将gpu匹配节点分配给对应的容器运行,同时记录分配信息,以更新gpu集群的使用情况,以便给后续的容器申请到匹配的gpu运行节点,从而提高gpu集群的利用率。

9、可选的,所述将申请信息发送至预设的访问计算模型,访问计算模型基于资源申请量和访问网络信息,从预设的gpu集群中筛选出与资源申请量匹配且通信开销小于预设开销值的gpu匹配节点;包括:

10、访问计算模型识别资源申请量,并调取预设的申请量阈值;

11、将资源申请量与申请量阈值进行比对;

12、当资源申请量大于或等于申请量阈值时,基于访问网络信息从gpu集群中筛选出与cpu核通信距离最短的第一gpu匹配节点,第一gpu匹配节点为空闲状态且第一gpu匹配节点的通信开销小于预设开销值;

13、当资源申请量小于申请量阈值时,基于访问网络信息从gpu集群中筛选出通信开销小于预设开销值的若干待匹配节点;

14、基于预设的资源填补规则,从若干待匹配节点中筛选出第二gpu匹配节点,所述第二gpu匹配节点已分配部分gpu资源。

15、通过采用上述技术方案,通过预设的申请量阈值,访问计算模型先对本次申请的申请量进行判断,分为大于1和介于0至1之间的不同申请量,在gpu集群上,由于gpu需要频繁地与内存和cpu通信,当申请资源量大于1时,则需要筛选出空闲状态的gpu匹配节点来满足当前资源申请量,同时,在通信开销小于预设开销值的情况下,筛选出与cpu核通信距离最短且满足资源申请量的第一gpu匹配节点。当次元申请量介于0至1之间时,则在通信开销小于预设开销值的基础上,通过资源填补规则,在已经分配出部分gpu资源的待匹配节点中,选出满足当前资源申请量运行的第二gpu匹配节点,从而提高了gpu资源利用率。

16、可选的,所述基于预设的资源填补规则,从若干待匹配节点中筛选出第二gpu匹配节点,所述第二gpu匹配节点已分配部分gpu资源;包括:

17、识别并获取每个待匹配节点中gpu资源的已使用量和总资源量;

18、基于待匹配节点中gpu资源的已使用资源量和总资源量,计算待匹配节点中gpu资源的剩余资源量;

19、将剩余资源量与资源申请量最接近的待匹配节点作为第二gpu匹配节点,且资源申请量小于或等于剩余资源量。

20、通过采用上述技术方案,当调用资源填补规则时,首先是对筛选出的待匹配节点的总资源情况、资源使用情况进行获取收集,进一步计算每个待匹配节点剩余的gpu资源,优选出剩余gpu资源与当前资源申请量最接近的待匹配节点作为第二gpu匹配节点,使得每一个gpu匹配节点都能尽量地被完整利用,从而提升gpu资源利用率。

21、可选的,所述将申请信息发送至预设的访问计算模型,访问计算模型基于资源申请量和访问网络信息,从预设的gpu集群中筛选出与资源申请量匹配且通信开销小于预设开销值的gpu匹配节点;还包括:

22、当所筛选出的gpu匹配节点的数量小于资源申请量时,则基于预设的调整幅度,上调预设开销值;

23、当所筛选出的gpu匹配节点的数量等于或大于资源申请量时,将当前所调整的预设开销值锁定。

24、通过采用上述技术方案,当所筛选出的gpu匹配节点的数量小于资源申请量时,则证明当前gpu集群的使用情况,在当前的通信开销限制下暂时无法满足资源申请量,访问计算模型通过自动上调预设开销值开扩大gpu匹配节点的筛选范围,从而满足资源申请量的分配。

25、可选的,当资源申请量大于或等于申请量阈值时,基于访问网络信息从gpu集群中筛选出与cpu核通信距离最短的第一gpu匹配节点,包括:

26、当资源申请量包括两个及以上时,则基于访问网络信息筛选出与cpu核通信距离最短的第一gpu匹配节点,并将所述第一gpu匹配节点进行标记;

27、将被标记的第一gpu匹配节点进行过滤,再基于访问网络信息从剩余的gpu匹配节点中筛选出与cpu核通信距离最短的第一gpu匹配节点。

28、通过采用上述技术方案,在资源申请量在两个及以上时,需要多个空闲的gpu节点分配给该容器运行,则关于第一gpu匹配节点的筛选,若无法选出两个距离同样属于最短的第一gpu匹配节点的情况下,则先选出一个与cpu核距离最短的空闲状态的第一gpu匹配节点并进行标记和过滤,再在剩余的gpu匹配节点中选出当前距离本文档来自技高网...

【技术保护点】

1.一种应用于vGPU的智能算力动态调度方法,其特征在于:

2.根据权利要求1所述的一种应用于vGPU的智能算力动态调度方法,其特征在于,所述将申请信息发送至预设的访问计算模型,访问计算模型基于资源申请量和访问网络信息,从预设的GPU集群中筛选出与资源申请量匹配且通信开销小于预设开销值的GPU匹配节点;包括:

3.根据权利要求2所述的一种应用于vGPU的智能算力动态调度方法,其特征在于,所述基于预设的资源填补规则,从若干待匹配节点中筛选出第二GPU匹配节点,所述第二GPU匹配节点已分配部分GPU资源;包括:

4.根据权利要求1所述的一种应用于vGPU的智能算力动态调度方法,其特征在于,所述将申请信息发送至预设的访问计算模型,访问计算模型基于资源申请量和访问网络信息,从预设的GPU集群中筛选出与资源申请量匹配且通信开销小于预设开销值的GPU匹配节点;还包括:

5.根据权利要求2所述的一种应用于vGPU的智能算力动态调度方法,其特征在于,当资源申请量大于或等于申请量阈值时,基于访问网络信息从GPU集群中筛选出与CPU核通信距离最短的第一GPU匹配节点,包括:

6.根据权利要求2所述的一种应用于vGPU的智能算力动态调度方法,其特征在于,所述将申请信息发送至预设的访问计算模型,访问计算模型基于资源申请量和访问网络信息,从预设的GPU集群中筛选出与资源申请量匹配且通信开销小于预设开销值的GPU匹配节点;还包括:

7.根据权利要求6所述的一种应用于vGPU的智能算力动态调度方法,其特征在于,所述当所筛选出的GPU匹配节点的数量小于资源申请量时,调用预设的分配拆分策略,将资源申请量进行片段拆分,得到若干片段资源申请量,包括:

8.一种应用于vGPU的智能算力动态调度系统,其特征在于:

9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述一种应用于vGPU的智能算力动态调度方法的步骤。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述一种应用于vGPU的智能算力动态调度方法的步骤。

...

【技术特征摘要】

1.一种应用于vgpu的智能算力动态调度方法,其特征在于:

2.根据权利要求1所述的一种应用于vgpu的智能算力动态调度方法,其特征在于,所述将申请信息发送至预设的访问计算模型,访问计算模型基于资源申请量和访问网络信息,从预设的gpu集群中筛选出与资源申请量匹配且通信开销小于预设开销值的gpu匹配节点;包括:

3.根据权利要求2所述的一种应用于vgpu的智能算力动态调度方法,其特征在于,所述基于预设的资源填补规则,从若干待匹配节点中筛选出第二gpu匹配节点,所述第二gpu匹配节点已分配部分gpu资源;包括:

4.根据权利要求1所述的一种应用于vgpu的智能算力动态调度方法,其特征在于,所述将申请信息发送至预设的访问计算模型,访问计算模型基于资源申请量和访问网络信息,从预设的gpu集群中筛选出与资源申请量匹配且通信开销小于预设开销值的gpu匹配节点;还包括:

5.根据权利要求2所述的一种应用于vgpu的智能算力动态调度方法,其特征在于,当资源申请量大于或等于申请量阈值时,基于访问网络信息从gpu集群中筛选出与cpu核通信距离最短的第一gpu匹配节...

【专利技术属性】
技术研发人员:张磊张博云王尧
申请(专利权)人:广东博成网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1