本发明专利技术公开了一种资源分配方法、装置、电子设备及存储介质;所述方法包括:获取待分配资源的至少一个任务的任务信息,并获取与预设的任务执行需求所相关的配置信息;其中,所述任务信息包括:每个任务的任务类型和需求资源;所述任务执行需求包括:与GPU执行所述至少一个任务时的顺序、功耗和/或时长所相关的需求;响应于所述任务执行需求,根据所述任务信息、所述配置信息以及GPU的未占资源,为所述至少一个任务分配资源。本发明专利技术可以使用配置信息控制任务的执行效果达到用户的期望。
A resource allocation method, device, electronic equipment and storage medium
【技术实现步骤摘要】
一种资源分配方法、装置、电子设备及存储介质
本专利技术属于光学成像领域,具体涉及一种资源分配方法、装置、电子设备及存储介质。
技术介绍
GPU(GraphicsProcessingUnit,图形处理器)是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上做图像和图形相关运算工作的微处理器单元。GPU在工作时,需要为接收的任务分配资源,从而按照分配的资源执行任务。相关技术中,GPU根据自身的未占资源以及任务的需求资源,为任务分配资源。然而,相关技术的资源分配方法在给任务分配资源时,仅考虑了未占资源和任务的需求资源。当用户对任务的执行效果有特殊需求时,相关技术的资源分配方法无法给与相应的支持。
技术实现思路
为了解决现有技术中存在的上述问题,本专利技术实施例提供了一种资源分配方法、装置、电子设备及存储介质。本专利技术要解决的技术问题通过以下技术方案实现:第一方面,本专利技术实施例提供了一种资源分配方法,应用于GPU,所述方法包括:获取待分配资源的至少一个任务的任务信息,并获取与预设的任务执行需求所相关的配置信息;其中,所述任务信息包括:每个任务的任务类型和需求资源;所述任务执行需求包括:与GPU执行所述至少一个任务时的顺序、功耗和/或时长所相关的需求;响应于所述任务执行需求,根据所述任务信息、所述配置信息以及GPU的未占资源,为所述至少一个任务分配资源。在本专利技术的一个实施例中,所述配置信息包括:GPU的已占资源上限;所述已占资源上限,用于限制GPU执行所述至少一个任务时的功耗;所述响应于所述任务执行需求,根据所述任务信息、所述配置信息以及GPU的未占资源,为所述至少一个任务分配资源,包括:当所述任务执行需求为与GPU执行所述至少一个任务时的功耗所相关的需求时,针对所述至少一个任务中的每个任务,判断GPU当前的已占资源加上该任务的需求资源后的值,是否小于所述已占资源上限;如果是,从GPU的未占资源中,获取与该任务的任务类型相匹配的、且与该任务的需求资源相等的资源分配给该任务;如果否,暂停为该任务分配资源,继续为下一个未分配资源的任务分配资源。在本专利技术的一个实施例中,所述配置信息包括:所述至少一个任务的优先级信息;所述优先级信息,用于控制GPU执行所述至少一个任务时的顺序;所述响应于所述任务执行需求,根据所述任务信息、所述配置信息以及GPU的未占资源,为所述至少一个任务分配资源,包括:当所述任务执行需求为与GPU执行所述至少一个任务时的顺序所相关的需求时,根据所述优先级信息,确定为所述至少一个任务分配资源时的分配顺序;根据所述任务信息以及GPU的未占资源,按照所述分配顺序,为所述至少一个任务分配资源。在本专利技术的一个实施例中,每个任务的需求资源为GPU执行该任务时所需的最小资源;所述配置信息包括:所述至少一个任务中的每个任务的资源增量信息;所述至少一个任务的资源增量信息,用于控制GPU执行所述至少一个任务时的时长;所述响应于所述任务执行需求,根据所述任务信息、所述配置信息以及GPU的未占资源,为所述至少一个任务分配资源,包括:当所述任务执行需求为与GPU执行所述至少一个任务时的时长所相关的需求时,针对所述至少一个任务中的每个任务,根据该任务的需求资源以及该任务的资源增量信息,确定该任务的待分配资源;从GPU的未占资源中,获取与该任务的任务类型相匹配的、且与该任务的待分配资源相等的资源分配给该任务。在本专利技术的一个实施例中,所述方法还包括:实时采集GPU的负载信息;当所采集的负载信息中存在异常信息时,根据所述异常信息,调整所述配置信息。在本专利技术的一个实施例中,所述负载信息包括下述信息中的一种或多种:GPU每个任务时的执行时长、GPU执行任务时的任务并行度、GPU的已占资源与未占资源的比值,以及每个任务的任务等待周期占比。在本专利技术的一个实施例中,所述方法还包括:利用为所述至少一个任务中的每个任务所分配的资源,分别执行所述至少一个任务。第二方面,本专利技术实施例提供了一种资源分配装置,应用于GPU,所述装置包括:获取模块,用于获取待分配资源的至少一个任务的任务信息,并获取与预设的任务执行需求所相关的配置信息;其中,所述任务信息包括:每个任务的任务类型和需求资源;所述任务执行需求包括:与GPU执行所述至少一个任务时的顺序、功耗和/或时长所相关的需求;分配模块,用于响应于所述任务执行需求,根据所述任务信息、所述配置信息以及GPU的未占资源,为所述至少一个任务分配资源。在本专利技术的一个实施例中,所述配置信息包括:GPU的已占资源上限;所述已占资源上限,用于限制GPU执行所述至少一个任务时的功耗;所述分配模块,具体用于:当所述任务执行需求为与GPU执行所述至少一个任务时的功耗所相关的需求时,针对所述至少一个任务中的每个任务,判断GPU当前的已占资源加上该任务的需求资源后的值,是否小于所述已占资源上限;如果是,从GPU的未占资源中,获取与该任务的任务类型相匹配的、且与该任务的需求资源相等的资源分配给该任务;如果否,暂停为该任务分配资源,继续为下一个未分配资源的任务分配资源。在本专利技术的一个实施例中,所述配置信息包括:所述至少一个任务的优先级信息;所述优先级信息,用于控制GPU执行所述至少一个任务时的顺序;所述分配模块,具体用于:当所述任务执行需求为与GPU执行所述至少一个任务时的顺序所相关的需求时,根据所述优先级信息,确定为所述至少一个任务分配资源时的分配顺序;根据所述任务信息以及GPU的未占资源,按照所述分配顺序,为所述至少一个任务分配资源。在本专利技术的一个实施例中,每个任务的需求资源为GPU执行该任务时所需的最小资源;所述配置信息包括:所述至少一个任务中的每个任务的资源增量信息;所述至少一个任务的资源增量信息,用于控制GPU执行所述至少一个任务时的时长;所述分配模块,具体用于:当所述任务执行需求为与GPU执行所述至少一个任务时的时长所相关的需求时,针对所述至少一个任务中的每个任务,根据该任务的需求资源以及该任务的资源增量信息,确定该任务的待分配资源;从GPU的未占资源中,获取与该任务的任务类型相匹配的、且与该任务的待分配资源相等的资源分配给该任务。在本专利技术的一个实施例中,所述装置还包括:采集模块和调整模块;所述采集模块,用于实时采集GPU的负载信息;所述调整模块,用于当所采集的负载信息中存在异常信息时,根据所述异常信息,调整所述配置信息。在本专利技术的一个实施例中,所述负载信息包括下述信息中的一种或多种:每个任务的执行时长、GPU执行任务时的任务并行度、GPU的已占资源与未占资源的比值,以及每个任务的任务等待周期占比。在本专利技术的一个实施例中,所述装置还包括本文档来自技高网...
【技术保护点】
1.一种资源分配方法,其特征在于,应用于GPU,所述方法包括:/n获取待分配资源的至少一个任务的任务信息,并获取与预设的任务执行需求所相关的配置信息;其中,所述任务信息包括:每个任务的任务类型和需求资源;所述任务执行需求包括:与GPU执行所述至少一个任务时的顺序、功耗和/或时长所相关的需求;/n响应于所述任务执行需求,根据所述任务信息、所述配置信息以及GPU的未占资源,为所述至少一个任务分配资源。/n
【技术特征摘要】
1.一种资源分配方法,其特征在于,应用于GPU,所述方法包括:
获取待分配资源的至少一个任务的任务信息,并获取与预设的任务执行需求所相关的配置信息;其中,所述任务信息包括:每个任务的任务类型和需求资源;所述任务执行需求包括:与GPU执行所述至少一个任务时的顺序、功耗和/或时长所相关的需求;
响应于所述任务执行需求,根据所述任务信息、所述配置信息以及GPU的未占资源,为所述至少一个任务分配资源。
2.根据权利要求1所述的方法,其特征在于,所述配置信息包括:GPU的已占资源上限;所述已占资源上限,用于限制GPU执行所述至少一个任务时的功耗;
所述响应于所述任务执行需求,根据所述任务信息、所述配置信息以及GPU的未占资源,为所述至少一个任务分配资源,包括:
当所述任务执行需求为与GPU执行所述至少一个任务时的功耗所相关的需求时,针对所述至少一个任务中的每个任务,判断GPU当前的已占资源加上该任务的需求资源后的值,是否小于所述已占资源上限;
如果是,从GPU的未占资源中,获取与该任务的任务类型相匹配的、且与该任务的需求资源相等的资源分配给该任务;
如果否,暂停为该任务分配资源,继续为下一个未分配资源的任务分配资源。
3.根据权利要求1所述的方法,其特征在于,所述配置信息包括:所述至少一个任务的优先级信息;所述优先级信息,用于控制GPU执行所述至少一个任务时的顺序;
所述响应于所述任务执行需求,根据所述任务信息、所述配置信息以及GPU的未占资源,为所述至少一个任务分配资源,包括:
当所述任务执行需求为与GPU执行所述至少一个任务时的顺序所相关的需求时,根据所述优先级信息,确定为所述至少一个任务分配资源时的分配顺序;
根据所述任务信息以及GPU的未占资源,按照所述分配顺序,为所述至少一个任务分配资源。
4.根据权利要求1所述的方法,其特征在于,每个任务的需求资源为GPU执行该任务时所需的最小资源;
所述配置信息包括:所述至少一个任务中的每个任务的资源增量信息;所述至少一个任务的资源增量信息,用于控制GPU执行所述至少一个任务时的时长;
所述响应于所述任务...
【专利技术属性】
技术研发人员:刘红红,张宏伟,孙琳娜,田珍,
申请(专利权)人:西安翔腾微电子科技有限公司,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。