【技术实现步骤摘要】
一种任务调度方法、装置、设备及介质
本专利技术实施例涉及数据处理领域,尤其涉及一种任务调度方法、装置、设备及介质。
技术介绍
随着图形处理器(GraphicsProcessingUnit,GPU)技术的不断进步,GPU逐渐成为计算系统中最重要的加速部件之一。目前,基于深度学习技术的学习预测任务,例如,用于疾病分析的神经网络模型预测任务等等,通常基于GPU实现硬件加速,但GPU价格不菲且资源有限,单个GPU硬件设备显存为几G至几十G不等,常用的深度学习模型占用显存从几十M至数百G,如何在有限的GPU硬件资源下,实现多种不同的模型预测,是一个亟待解决的技术问题。
技术实现思路
本专利技术实施例提供了一种任务调度方法、装置、设备及介质,以实现在有限的GPU硬件资源下,实现多种不同的模型预测,提高GPU的硬件使用率。第一方面,本专利技术实施例提供了一种任务调度方法,包括:当任务调度指令被触发时,获取待分配预测任务的任务信息以及待分配图形处理器的处理器信息;根据所述任务信息以及所述处理器信息 ...
【技术保护点】
1.一种任务调度方法,其特征在于,包括:/n当任务调度指令被触发时,获取待分配预测任务的任务信息以及待分配图形处理器的处理器信息;/n根据所述任务信息以及所述处理器信息选取一待分配预测任务作为目标预测任务;/n获取所述目标预测任务对应的目标任务类型,将所述目标任务类型对应的待分配预测任务作为所述待分配图形处理器对应的目标执行任务。/n
【技术特征摘要】
1.一种任务调度方法,其特征在于,包括:
当任务调度指令被触发时,获取待分配预测任务的任务信息以及待分配图形处理器的处理器信息;
根据所述任务信息以及所述处理器信息选取一待分配预测任务作为目标预测任务;
获取所述目标预测任务对应的目标任务类型,将所述目标任务类型对应的待分配预测任务作为所述待分配图形处理器对应的目标执行任务。
2.根据权利要求1所述的方法,其特征在于,所述任务信息包括所述待分配预测任务的任务创建时间以及所述待分配预测任务的任务资源需求,所述处理器信息包括所述待分配图形处理器的硬件资源,所述根据所述任务信息以及所述处理器信息选取一待分配预测任务作为目标预测任务,包括:
根据所述任务创建时间对所述待分配预测任务进行升序排序;
根据任务排序顺序将所述待分配预测任务进行资源匹配,将首个任务资源需求不高于所述硬件资源的待分配预测任务作为所述目标预测任务。
3.根据权利要求1所述的方法,其特征在于,还包括:
当不存在待分配预测任务时,判断是否存在空闲图形处理器;
若存在所述空闲图形处理器,则获取各任务类型对应的模型预测时间,并根据所述模型预测时间对所述任务类型进行逆序排序;
根据类型排序顺序为所述空闲图形处理器分配空闲预测任务。
4.根据权利要求3所述的方法,其特征在于,所述获取各任务类型对应的模型预测时间,包括:
针对每个所述任务类型,根据所述任务类型对应的待预测任务数量、所述任务类型的实例数以及所述任务类型的单个任务预测时间计算所述任务类型对应的模型预测时间。
5.根据权利要求3所述的方法,其特征在于,所述根据类型排序顺序为所述空闲图形处理器分配待分配预测任务,包括:
根据类型排序顺序将所述...
【专利技术属性】
技术研发人员:单亚峰,王征,颜亚军,李超明,翁黄硕羽,李新阳,王少康,陈宽,
申请(专利权)人:北京推想科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。