【技术实现步骤摘要】
一种资源分配方法、装置、设备以及存储介质
本申请属于计算机
,尤其涉及一种资源分配方法、资源分配装置、资源分配设备以及存储介质。
技术介绍
随着各行各业的发展,需要构建多种场景的机器学习应用。为了用海量数据训练出性能更好的机器学习模型,需要高效调用、管理大规模的图形处理器(GraphicsProcessingUnit,GPU)。面对这类需求,基于Kubernetes的云原生技术应运而生。kubernetes,简称K8s,是用8代替8个字符“ubernete”而成的缩写。是一个开源的,用于管理云平台中多个主机上的容器化的应用,Kubernetes的目标是让部署容器化的应用简单并且高效,Kubernetes提供了应用部署、规划、更新、维护的一种机制。然而,当前的kubernetes对GPU调度时通常是随机分配GPU卡,导致GPU整体使用率不高、浪费资源。
技术实现思路
有鉴于此,本申请实施例提供了一种资源分配方法、资源分配装置、资源分配设备以及存储介质,以解决传统的资源分配方法随机分配G ...
【技术保护点】
1.一种资源分配方法,其特征在于,包括:/n当获取到需要调度GPU资源的任务请求时,获取可用的GPU节点以及每个可用的GPU节点中已使用的GPU卡的数量;所述任务请求中携带有完成所述任务请求所需的GPU资源数量;/n基于所述可用的GPU节点、所述GPU卡的数量以及每个所述GPU卡对应的拓扑结构,确定每个可用的GPU节点中每个空闲的GPU卡对应的权重值;/n基于所述所需的GPU资源数量以及每个空闲的GPU卡对应的权重值确定所述任务请求对应的分配结果;/n基于所述分配结果为所述任务请求分配GPU卡。/n
【技术特征摘要】
1.一种资源分配方法,其特征在于,包括:
当获取到需要调度GPU资源的任务请求时,获取可用的GPU节点以及每个可用的GPU节点中已使用的GPU卡的数量;所述任务请求中携带有完成所述任务请求所需的GPU资源数量;
基于所述可用的GPU节点、所述GPU卡的数量以及每个所述GPU卡对应的拓扑结构,确定每个可用的GPU节点中每个空闲的GPU卡对应的权重值;
基于所述所需的GPU资源数量以及每个空闲的GPU卡对应的权重值确定所述任务请求对应的分配结果;
基于所述分配结果为所述任务请求分配GPU卡。
2.如权利要求1所述的资源分配方法,其特征在于,所述当获取到需要调度GPU资源的任务请求时,获取可用的GPU节点以及每个可用的GPU节点中已使用的GPU卡的数量,包括:
获取处于登录状态的GPU节点,以及每个GPU节点中空闲的GPU卡数量;
基于每个GPU节点中空闲的GPU卡数量以及所述所需的GPU资源数量确定所述可用的GPU节点;
获取每个可用的GPU节点中已使用的GPU卡的数量。
3.如权利要求1所述的资源分配方法,其特征在于,所述基于所述所需的GPU资源数量以及每个空闲的GPU卡对应的权重值确定所述任务请求对应的分配结果,包括:
对所述权重值进行排序,得到排序结果;
基于所述排序结果以及所述所需的GPU资源数量确定所述分配结果;所述分配结果包括第一标识信息以及第二标识信息;其中,所述第一标识信息用于标识待分配给所述任务请求的目标GPU节点,所述第二标识信息用于标识待分配给所述任务请求的目标GPU卡。
4.如权利要求3所述的资源分配方法,其特征在于,所述基于所述分配结果为所述任务请求分配GPU卡,包括:
基于所述第一标识信息在所述可用的GPU节点中查找所述目标GPU节点;
基于所述第二标识信息在所述目标GPU节点中查找所述目标GPU卡,并将所述目标GPU卡分配给所述任务请求。
5.如权利要求3所述的资...
【专利技术属性】
技术研发人员:李景韬,蒋佳峻,何礼祺,成杰峰,
申请(专利权)人:中国平安人寿保险股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。