【技术实现步骤摘要】
GPU资源调度方法
[0001]本专利技术涉及计算机
,尤其涉及一种GPU资源调度方法。
技术介绍
[0002]图形处理器(Graphics Processing Unit,简称GPU),又称显示核心、视觉处理器、显示芯片,专为计算密集型、高度并行化的计算而设计。GPU中存在多种资源,在GPU执行任务过程中,如果对任何一种资源的分配不平衡,均可能造成GPU资源的浪费,从而降低GPU资源利用率和GPU的计算性能。因此,在GPU运行过程中,需要尽可能平衡调度每种GPU资源,使得每种GPU资源尽可能处于资源平衡状态,从而使得整个GPU的运行处于资源平衡状态,进而提高GPU的资源利用率和计算性能。
[0003]但是,GPU的资源种类多,数量大,现有技术中,GPU在执行任务时,尤其是在执行复杂的计算任务时,仍然很难实现GPU资源平衡调度,通常需要花费大量的时间来分配资源,且分配结果也无法保证资源平衡,可靠性差。由此可知,如何提供一种高效可靠的GPU资源平衡调度技术,合理为多路任务组分配对应的GPU资源,提高任务处理效率, ...
【技术保护点】
【技术特征摘要】
1.一种GPU资源调度方法,其特征在于,包括步骤A1、获取当前每一任务通道对应的待分发任务组,读取每一待分发任务组的资源需求信息;步骤A2、获取当前GPU中每一执行模块的当前剩余资源信息;步骤A3、将每一待分发任务组的资源需求信息分别与所有执行模块的当前剩余资源信息进行匹配,若存在至少一个执行模块的当前剩余资源信息与待分发任务组的资源需求信息匹配,则将该待分发任务组加入候选任务组集合;步骤A4、从所述候选任务组集合中选取优先级最高的一个待分发任务组作为目标任务组,并从与所述目标任务组匹配的执行模块中选取一个目标执行模块,将所述目标任务组分配至所述目标执行模块中。2.根据权利要求1所述的方法,其特征在于,所述剩余资源信息包括每一种第一类资源对应的最大连续剩余资源数,以及每一种第二类资源对应的最大剩余资源数;其中,所述第一类资源为执行模块中具有连续分配需求的资源,所述第二类资源为执行模块中不具有连续分配需求的资源。3.根据权利要求1所述的方法,其特征在于,每一任务通道设置一个对应的先入先出队列,所述任务通道按照接收到的先后顺序将接收到的任务组逐个存入所述先入先出队列,所述待分发任务组为所述任务组通道的先入先出队列中的队首任务组。4.根据权利要求1所述的方法,其特征在于,所述步骤A4之后还包括:步骤A5、判断当前每一任务通道对应的待分发任务组是否为空,若为空,则结束流程,否则,返回执行步骤A1。5.根据权利要求1所述的方法,其特征在于,每个执行模块中包括Q个执行单元,所述步骤A3包括:步骤A31、将待分发任务组划分Q个wave组,获取每一wave组对应的资源需求信息,以及待分发任务组对于...
【专利技术属性】
技术研发人员:请求不公布姓名,
申请(专利权)人:沐曦集成电路上海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。