算力资源分配方法、装置、计算机可读存储介质及设备制造方法及图纸

技术编号:35585818 阅读:16 留言:0更新日期:2022-11-16 15:00
本申请提供一种算力资源分配方法、算力资源分配装置、计算机可读存储介质及电子设备;涉及计算机技术领域;包括:对总算力资源进行规划,得到多个类型的资源池;获取算力容器生成请求对应的目标算力规格,利用满足于目标算力规格的资源组的算力生成算力容器;统计各资源池对应的算力利用结果;如果存在不满足于预设条件的算力利用结果,则将各资源池的算力利用结果中的剩余算力资源按照预设比例划分至缓存资源中。可见,可以对算力资源进行不同类型的分配并通过分析算力利用结果,在算力分配不满足于当下需求时及时对总算力资源进行重新规划,提升资源调度及时性,避免出现卡总量足够但无法为用户提供计算服务的情况,提升资源利用率。源利用率。源利用率。

【技术实现步骤摘要】
算力资源分配方法、装置、计算机可读存储介质及设备


[0001]本申请涉及计算机
,具体而言,涉及一种算力资源分配方法、算力资源分配装置、计算机可读存储介质及电子设备。

技术介绍

[0002]图形处理器(Graphics Processing Unit,GPU)作为算力容器,可以执行计算任务(如,AI训练任务)。设备中每个GPU设备单机通常为8张卡,用户可以指定8张卡中的任意规格(如,8张卡中的2/4/6张)执行计算任务。但是,这样容易增加GPU中碎片卡的占比,剩余的碎片卡可能属于不同的GPU设备,造成卡总量足够但是无法为用户提供计算服务的问题。因此,如何对算力资源进行合理规划并在算力分配不合理的时对其进行及时调整,避免出现卡总量足够但是无法为用户提供计算服务的情况,成为了当前亟需解决的问题。
[0003]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0004]本申请的目的在于提供一种算力资源分配方法、算力资源分配装置、计算机可读存储介质及电子设备,可以对算力资源进行不同类型(如,1卡类型、2卡类型、4卡类型、8卡类型)的分配,使得算力资源合理分布于各类型的资源池中,进而通过对于算力利用结果的分析,在出现不满足于预设条件的算力利用结果时,及时对总算力资源进行重新规划,提升资源调度的及时性,以使得各类型下的算力资源分配合理,避免出现卡总量足够但是无法为用户提供计算服务的情况,提升资源利用率。
[0005]本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
[0006]根据本申请的一方面,提供一种算力资源分配方法,包括:
[0007]对总算力资源进行规划,得到多个类型的资源池;其中,各类型的资源池内均包括至少一个资源组,所属资源池相同的资源组对应于相同的算力,所属资源池不同的资源组对应于不同的算力;
[0008]获取算力容器生成请求对应的目标算力规格,利用满足于目标算力规格的资源组的算力生成算力容器;
[0009]统计各资源池对应的算力利用结果;
[0010]如果存在不满足于预设条件的算力利用结果,则将各资源池的算力利用结果中的剩余算力资源按照预设比例划分至缓存资源中;其中,总算力资源由缓存资源以及各资源池划分得到的算力资源构成,缓存资源用于为各资源池提供补足资源。
[0011]根据本申请的一方面,提供一种算力资源分配装置,包括:规划结果获取单元、利用结果获取单元以及算力规划单元,其中:
[0012]规划结果获取单元,用于对总算力资源进行规划,得到多个类型的资源池;其中,
各类型的资源池内均包括至少一个资源组,所属资源池相同的资源组对应于相同的算力,所属资源池不同的资源组对应于不同的算力;
[0013]算力分配单元,用于获取算力容器生成请求对应的目标算力规格,利用满足于所述目标算力规格的资源组的算力生成算力容器;
[0014]利用结果获取单元,用于统计各资源池对应的算力利用结果;
[0015]算力规划单元,用于如果存在不满足于预设条件的算力利用结果,将各资源池的算力利用结果中的剩余算力资源按照预设比例划分至缓存资源中;其中,总算力资源由缓存资源以及各资源池划分得到的算力资源构成,缓存资源用于为各资源池提供补足资源。
[0016]在本申请的一种示例性实施例中,上述装置还包括:
[0017]剩余算力检测单元,用于在算力规划单元将所述各资源池的算力利用结果中的剩余算力资源按照预设比例划分至缓存资源中之前,基于单位时间对各资源池对应的算力利用结果进行剩余算力检测;
[0018]判定单元,用于在检测结果表示各资源池的算力利用结果中存在包含剩余算力资源的算力利用结果时,判定存在不满足于预设条件的算力利用结果。
[0019]在本申请的一种示例性实施例中,判定单元判定存在不满足于预设条件的算力利用结果,包括:
[0020]若检查到剩余算力资源大于预设条件中的剩余算力阈值,则判定存在不满足于预设条件的算力利用结果。
[0021]在本申请的一种示例性实施例中,算力规划单元将各资源池的算力利用结果中的剩余算力资源按照预设比例划分至缓存资源中,包括:
[0022]获取各资源池对应的预设比例;
[0023]根据各资源池对应的预设比例确定不满足于预设条件的算力利用结果所对应的目标预设比例;
[0024]将不满足于预设条件的算力利用结果中的剩余算力资源按照目标预设比例划分至缓存资源中。
[0025]在本申请的一种示例性实施例中,规划结果获取单元对总算力资源进行规划,得到多个类型的资源池,包括:
[0026]获取用户设置操作,并根据用户设置操作的设置参数对总算力资源进行规划,得到多个类型的资源池。
[0027]在本申请的一种示例性实施例中,上述装置还包括:
[0028]资源选择界面输出单元,用于算力规划单元将各资源池的算力利用结果中的剩余算力资源按照预设比例划分至缓存资源中之后,当检测到任务提交请求时,根据重新规划后的总算力资源输出资源选择界面;
[0029]资源池确定单元,用于根据检测到的选择操作从各资源池中确定目标资源池;
[0030]资源组选取单元,用于从目标资源池中选取至少一个目标资源组;
[0031]任务执行单元,用于通过至少一个目标资源组执行任务提交请求对应的计算任务。
[0032]在本申请的一种示例性实施例中,任务执行单元通过至少一个目标资源组执行任务提交请求对应的计算任务,包括:
[0033]根据至少一个目标资源组创建目标算力容器;
[0034]通过目标算力容器执行任务提交请求对应的计算任务。
[0035]在本申请的一种示例性实施例中,资源组选取单元从目标资源池中选取至少一个目标资源组,包括:
[0036]从资源选择界面中读取设置的资源组数量;
[0037]若检测到目标资源池中的空闲资源组数量不满足资源组数量,则从缓存资源中获取预设数量的算力,以使得目标资源池中的空闲资源组数量满足资源组数量。
[0038]在本申请的一种示例性实施例中,上述装置还包括:
[0039]硬件数量确定单元,用于在规划结果获取单元对总算力资源进行规划,得到多个类型的资源池之前,确定用于执行计算任务的硬件数量;
[0040]总算力资源确定单元,用于对每个硬件对应的算力资源进行求和,将求和结果确定为总算力资源。
[0041]在本申请的一种示例性实施例中,算力规划单元,还用于根据预设条件确定预设时长内各资源池对应的利用率阈值范围;将各资源池对应的利用率阈值范围分别与各资源池对应的算力利用结果进行比对;确定比对结果中的第一算力利用结果和第二算力利用结果,第一算力利用结果高于相对应的利用率阈值范围的上限值,第二算力利用结果低于相对应的利用率本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种算力资源分配方法,其特征在于,包括:对总算力资源进行规划,得到多个类型的资源池;其中,各类型的资源池内均包括至少一个资源组,所属资源池相同的资源组对应于相同的算力,所属资源池不同的资源组对应于不同的算力;获取算力容器生成请求对应的目标算力规格,利用满足于所述目标算力规格的资源组的算力生成算力容器;统计各所述资源池对应的算力利用结果;将所述各资源池的算力利用结果中的剩余算力资源按照预设比例划分至缓存资源中;其中,所述总算力资源由所述缓存资源以及所述各资源池划分得到的算力资源构成,所述缓存资源用于为所述各资源池提供补足资源。2.根据权利要求1所述的方法,其特征在于,将所述各资源池的算力利用结果中的剩余算力资源按照预设比例划分至缓存资源中之前,所述方法还包括:基于单位时间对各所述资源池对应的算力利用结果进行剩余算力检测;若检测结果表示所述各资源池的算力利用结果中存在包含剩余算力资源的算力利用结果,则判定存在不满足于所述预设条件的算力利用结果。3.根据权利要求2所述的方法,其特征在于,判定存在不满足于所述预设条件的算力利用结果,包括:若检查到所述剩余算力资源大于所述预设条件中的剩余算力阈值,则判定存在不满足于所述预设条件的算力利用结果。4.根据权利要求2所述的方法,其特征在于,将所述各资源池的算力利用结果中的剩余算力资源按照预设比例划分至缓存资源中,包括:获取所述各资源池对应的预设比例;根据所述各资源池对应的预设比例确定不满足于所述预设条件的算力利用结果所对应的目标预设比例;将不满足于所述预设条件的算力利用结果中的剩余算力资源按照所述目标预设比例划分至所述缓存资源中。5.根据权利要求1所述的方法,其特征在于,对总算力资源进行规划,得到多个类型的资源池,包括:获取用户设置操作,并根据所述用户设置操作的设置参数对总算力资源进行规划,得到多个类型的资源池。6.根据权利要求1所述的方法,其特征在于,将所述各资源池的算力利用结果中的剩余算力资源按照预设比例划分至缓存资源中之后,所述方法还包括:当检测到任务提交请求时,根据重新规划后的总算力资源输出资源选择界面;根据检测到的选择操作从各所述资源池中确定目标资源池;从所述目标资源池中选取至少一个目标资源组;通过所述至少一个目标资源组执行所述任务提交请求对应的计算任务。7.根据权利要求6所述的方法,其特征在于,通过所述至少一个目标资源组执行所述任务提交请求对应的计算任务,包括:根据所述至少一个目标资源组创建目标算力容器;
通过所述目标算力容器执行所述任务提交请求对应的计算任务。8.根据权利要求6所述的方法,其特征在于,从所述目标资源池中选取至少一个目标资源组,包括:从所述资源选择界面中读取设置的资源组数量;若检测到所述目标资源池中的空闲资源组数量不满足所述资源组数量,则从缓存资源中获取预设数量的算力,以使得所述目...

【专利技术属性】
技术研发人员:查冲
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1