【技术实现步骤摘要】
本申请涉及gpu的,尤其是涉及一种应用于vgpu的智能算力动态调度方法及系统。
技术介绍
1、vgpu在虚拟化环境中分配和共享物理gpu资源,使得多个虚拟机能够同时访问一个物理gpu,从而能够高效地运行图形密集型应用程序和计算任务。
2、目前,普遍通过开源容器编排系统kubernetes来支持nvidia的gpu并行计算,在现有的kubernetesgpu集群上,gpu是最小的资源分配单位。我们使用kubernetes的设备插件框架将物理gpu划分为多个虚拟gpu,形成gpu集群拓扑,并将这些虚拟gpu分配给申请资源的容器。但kubernetes调度gpu时,不同的容器不能共享gpu,这意味着每个容器引擎将独占整个gpu,因此在进行gpu资源的访问调度时的通信开销会增大,gpu的资源没有得到最大化利用,因此需要改进。
技术实现思路
1、为了提升基于kubernetes的gpu资源调度中gpu的资源利用率,本申请提供了一种应用于vgpu的智能算力动态调度方法及系统。
...
【技术保护点】
1.一种应用于vGPU的智能算力动态调度方法,其特征在于:
2.根据权利要求1所述的一种应用于vGPU的智能算力动态调度方法,其特征在于,所述将申请信息发送至预设的访问计算模型,访问计算模型基于资源申请量和访问网络信息,从预设的GPU集群中筛选出与资源申请量匹配且通信开销小于预设开销值的GPU匹配节点;包括:
3.根据权利要求2所述的一种应用于vGPU的智能算力动态调度方法,其特征在于,所述基于预设的资源填补规则,从若干待匹配节点中筛选出第二GPU匹配节点,所述第二GPU匹配节点已分配部分GPU资源;包括:
4.根据权利要求1所述的
...【技术特征摘要】
1.一种应用于vgpu的智能算力动态调度方法,其特征在于:
2.根据权利要求1所述的一种应用于vgpu的智能算力动态调度方法,其特征在于,所述将申请信息发送至预设的访问计算模型,访问计算模型基于资源申请量和访问网络信息,从预设的gpu集群中筛选出与资源申请量匹配且通信开销小于预设开销值的gpu匹配节点;包括:
3.根据权利要求2所述的一种应用于vgpu的智能算力动态调度方法,其特征在于,所述基于预设的资源填补规则,从若干待匹配节点中筛选出第二gpu匹配节点,所述第二gpu匹配节点已分配部分gpu资源;包括:
4.根据权利要求1所述的一种应用于vgpu的智能算力动态调度方法,其特征在于,所述将申请信息发送至预设的访问计算模型,访问计算模型基于资源申请量和访问网络信息,从预设的gpu集群中筛选出与资源申请量匹配且通信开销小于预设开销值的gpu匹配节点;还包括:
5.根据权利要求2所述的一种应用于vgpu的智能算力动态调度方法,其特征在于,当资源申请量大于或等于申请量阈值时,基于访问网络信息从gpu集群中筛选出与cpu核通信距离最短的第一gpu匹配节...
【专利技术属性】
技术研发人员:张磊,张博云,王尧,
申请(专利权)人:广东博成网络科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。