一种应用于vGPU的智能算力动态调度方法及系统技术方案

技术编号:43853204 阅读:35 留言:0更新日期:2024-12-31 18:44
本申请涉及一种应用于vGPU的智能算力动态调度方法及系统,包括当接收到GPU资源请求消息时,从GPU资源请求消息中获取本次GPU资源的申请信息,申请信息包括资源申请量以及访问网络信息;将申请信息发送至预设的访问计算模型,访问计算模型基于资源申请量和访问网络信息,从预设的GPU集群中筛选出与资源申请量匹配且通信开销小于预设开销值的GPU匹配节点;将GPU匹配节点分配至对应所述GPU资源请求消息的容器以运行GPU;记录完成分配的所述GPU匹配节点的分配信息,进行存储记录并更新GPU集群。本申请具有提升基于Kubernetes的GPU资源调度中GPU的资源利用率的效果。

【技术实现步骤摘要】

本申请涉及gpu的,尤其是涉及一种应用于vgpu的智能算力动态调度方法及系统。


技术介绍

1、vgpu在虚拟化环境中分配和共享物理gpu资源,使得多个虚拟机能够同时访问一个物理gpu,从而能够高效地运行图形密集型应用程序和计算任务。

2、目前,普遍通过开源容器编排系统kubernetes来支持nvidia的gpu并行计算,在现有的kubernetesgpu集群上,gpu是最小的资源分配单位。我们使用kubernetes的设备插件框架将物理gpu划分为多个虚拟gpu,形成gpu集群拓扑,并将这些虚拟gpu分配给申请资源的容器。但kubernetes调度gpu时,不同的容器不能共享gpu,这意味着每个容器引擎将独占整个gpu,因此在进行gpu资源的访问调度时的通信开销会增大,gpu的资源没有得到最大化利用,因此需要改进。


技术实现思路

1、为了提升基于kubernetes的gpu资源调度中gpu的资源利用率,本申请提供了一种应用于vgpu的智能算力动态调度方法及系统。

2、本申请的上述专利本文档来自技高网...

【技术保护点】

1.一种应用于vGPU的智能算力动态调度方法,其特征在于:

2.根据权利要求1所述的一种应用于vGPU的智能算力动态调度方法,其特征在于,所述将申请信息发送至预设的访问计算模型,访问计算模型基于资源申请量和访问网络信息,从预设的GPU集群中筛选出与资源申请量匹配且通信开销小于预设开销值的GPU匹配节点;包括:

3.根据权利要求2所述的一种应用于vGPU的智能算力动态调度方法,其特征在于,所述基于预设的资源填补规则,从若干待匹配节点中筛选出第二GPU匹配节点,所述第二GPU匹配节点已分配部分GPU资源;包括:

4.根据权利要求1所述的一种应用于vGPU的...

【技术特征摘要】

1.一种应用于vgpu的智能算力动态调度方法,其特征在于:

2.根据权利要求1所述的一种应用于vgpu的智能算力动态调度方法,其特征在于,所述将申请信息发送至预设的访问计算模型,访问计算模型基于资源申请量和访问网络信息,从预设的gpu集群中筛选出与资源申请量匹配且通信开销小于预设开销值的gpu匹配节点;包括:

3.根据权利要求2所述的一种应用于vgpu的智能算力动态调度方法,其特征在于,所述基于预设的资源填补规则,从若干待匹配节点中筛选出第二gpu匹配节点,所述第二gpu匹配节点已分配部分gpu资源;包括:

4.根据权利要求1所述的一种应用于vgpu的智能算力动态调度方法,其特征在于,所述将申请信息发送至预设的访问计算模型,访问计算模型基于资源申请量和访问网络信息,从预设的gpu集群中筛选出与资源申请量匹配且通信开销小于预设开销值的gpu匹配节点;还包括:

5.根据权利要求2所述的一种应用于vgpu的智能算力动态调度方法,其特征在于,当资源申请量大于或等于申请量阈值时,基于访问网络信息从gpu集群中筛选出与cpu核通信距离最短的第一gpu匹配节...

【专利技术属性】
技术研发人员:张磊张博云王尧
申请(专利权)人:广东博成网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1