【技术实现步骤摘要】
算力资源分配方法、装置、计算机可读存储介质及设备
[0001]本申请涉及计算机
,具体而言,涉及一种算力资源分配方法、算力资源分配装置、计算机可读存储介质及电子设备。
技术介绍
[0002]图形处理器(Graphics Processing Unit,GPU)作为算力容器,可以执行计算任务(如,AI训练任务)。设备中每个GPU设备单机通常为8张卡,用户可以指定8张卡中的任意规格(如,8张卡中的2/4/6张)执行计算任务。但是,这样容易增加GPU中碎片卡的占比,剩余的碎片卡可能属于不同的GPU设备,造成卡总量足够但是无法为用户提供计算服务的问题。因此,如何对算力资源进行合理规划并在算力分配不合理的时对其进行及时调整,避免出现卡总量足够但是无法为用户提供计算服务的情况,成为了当前亟需解决的问题。
[0003]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
[0004]本申请的目的在于提供一种算力资源分配方法、算力资源分配装置、计算机可读存储介质及电子设备,可以对算力资源进行不同类型(如,1卡类型、2卡类型、4卡类型、8卡类型)的分配,使得算力资源合理分布于各类型的资源池中,进而通过对于算力利用结果的分析,在出现不满足于预设条件的算力利用结果时,及时对总算力资源进行重新规划,提升资源调度的及时性,以使得各类型下的算力资源分配合理,避免出现卡总量足够但是无法为用户提供计算服务的情况,提升资源利用 ...
【技术保护点】
【技术特征摘要】
1.一种算力资源分配方法,其特征在于,包括:对总算力资源进行规划,得到多个类型的资源池;其中,各类型的资源池内均包括至少一个资源组,所属资源池相同的资源组对应于相同的算力,所属资源池不同的资源组对应于不同的算力;获取算力容器生成请求对应的目标算力规格,利用满足于所述目标算力规格的资源组的算力生成算力容器;统计各所述资源池对应的算力利用结果;将所述各资源池的算力利用结果中的剩余算力资源按照预设比例划分至缓存资源中;其中,所述总算力资源由所述缓存资源以及所述各资源池划分得到的算力资源构成,所述缓存资源用于为所述各资源池提供补足资源。2.根据权利要求1所述的方法,其特征在于,将所述各资源池的算力利用结果中的剩余算力资源按照预设比例划分至缓存资源中之前,所述方法还包括:基于单位时间对各所述资源池对应的算力利用结果进行剩余算力检测;若检测结果表示所述各资源池的算力利用结果中存在包含剩余算力资源的算力利用结果,则判定存在不满足于所述预设条件的算力利用结果。3.根据权利要求2所述的方法,其特征在于,判定存在不满足于所述预设条件的算力利用结果,包括:若检查到所述剩余算力资源大于所述预设条件中的剩余算力阈值,则判定存在不满足于所述预设条件的算力利用结果。4.根据权利要求2所述的方法,其特征在于,将所述各资源池的算力利用结果中的剩余算力资源按照预设比例划分至缓存资源中,包括:获取所述各资源池对应的预设比例;根据所述各资源池对应的预设比例确定不满足于所述预设条件的算力利用结果所对应的目标预设比例;将不满足于所述预设条件的算力利用结果中的剩余算力资源按照所述目标预设比例划分至所述缓存资源中。5.根据权利要求1所述的方法,其特征在于,对总算力资源进行规划,得到多个类型的资源池,包括:获取用户设置操作,并根据所述用户设置操作的设置参数对总算力资源进行规划,得到多个类型的资源池。6.根据权利要求1所述的方法,其特征在于,将所述各资源池的算力利用结果中的剩余算力资源按照预设比例划分至缓存资源中之后,所述方法还包括:当检测到任务提交请求时,根据重新规划后的总算力资源输出资源选择界面;根据检测到的选择操作从各所述资源池中确定目标资源池;从所述目标资源池中选取至少一个目标资源组;通过所述至少一个目标资源组执行所述任务提交请求对应的计算任务。7.根据权利要求6所述的方法,其特征在于,通过所述至少一个目标资源组执行所述任务提交请求对应的计算任务,包括:根据所述至少一个目标资源组创建目标算力容器;
通过所述目标算力容器执行所述任务提交请求对应的计算任务。8.根据权利要求6所述的方法,其特征在于,从所述目标资源池中选取至少一个目标资源组,包括:从所述资源选择界面中读取设置的资源组数量;若检测到所述目标资源池中的空闲资源组数量不满足所述资源组数量,则从缓存资源中获取预设数量的算力,以使得所述目...
【专利技术属性】
技术研发人员:查冲,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。