【技术实现步骤摘要】
调度方法及相关装置
本申请涉及计算机
,具体涉及一种调度方法及相关装置。
技术介绍
神经网络是目前许多人工智能应用的基础,随着神经网络的应用范围的进一步扩大,采用服务器或云计算服务对各种各样的神经网络模型进行存储,并针对用户提交的运算请求进行运算。面对众多的神经网络模型和大批量的请求,如何提高服务器的运算效率是本领域技术人员待解决的技术问题。
技术实现思路
本申请实施例提出了一种调度方法及相关装置,可选取服务器中的计算装置执行运算请求,提高了服务器的运行效率。第一方面,本申请实施例提供了一种调度方法,基于多个计算装置的服务器,所述方法包括:接收M个运算请求;根据所述M个运算请求中每一运算请求的属性信息从所述多个计算装置中选取至少一个目标计算装置,并确定所述至少一个目标计算装置中每一目标计算装置对应的运算指令,所述属性信息包括运算任务和目标神经网络模型;根据所述至少一个目标计算装置中每一目标计算装置对应的运算指令对所述M个运算请求对应的运算数据进行计算,得到M个最终运算结果;将所述M个最终运算结果中每一运算结果发送至对应的电子设备。第二方面,本申请实施例提供了一种服务器,所述服务器包括多个计算装置,其中:接收单元,用于接收M个运算请求;调度单元,用于根据所述M个运算请求中每一运算请求的属性信息从所述多个计算装置中选取至少一个目标计算装置,并确定所述至少一个目标计算装置中每一目标计算装置对应的运算指令,所述属性信息包括运算任务和目标神经网络模型;运算单元,用于根据所述至少一个目标计算装置中每一目标计算装置对应的运算指令对所述M个运算请求对应的运算数据进行计算 ...
【技术保护点】
1.一种调度方法,其特征在于,所述方法基于包含多个计算装置的服务器,所述方法包括:接收M个运算请求,所述M为正整数;根据所述M个运算请求中每一运算请求的属性信息从所述多个计算装置中选取至少一个目标计算装置,并确定所述至少一个目标计算装置中每一目标计算装置对应的运算指令;根据所述至少一个目标计算装置中每一目标计算装置对应的运算指令对所述M个运算请求对应的运算数据进行计算,得到M个最终运算结果;将所述M个最终运算结果中每一最终运算结果发送至对应的电子设备。
【技术特征摘要】
1.一种调度方法,其特征在于,所述方法基于包含多个计算装置的服务器,所述方法包括:接收M个运算请求,所述M为正整数;根据所述M个运算请求中每一运算请求的属性信息从所述多个计算装置中选取至少一个目标计算装置,并确定所述至少一个目标计算装置中每一目标计算装置对应的运算指令;根据所述至少一个目标计算装置中每一目标计算装置对应的运算指令对所述M个运算请求对应的运算数据进行计算,得到M个最终运算结果;将所述M个最终运算结果中每一最终运算结果发送至对应的电子设备。2.根据权利要求1所述的方法,其特征在于,所述属性信息包括目标神经网络模型,所述至少一个目标计算装置为多个并行计算装置和至少一个串行计算装置,所述根据所述M个运算请求中每一运算请求的属性信息从所述多个计算装置中选取至少一个目标计算装置,并确定所述至少一个目标计算装置中每一目标计算装置对应的运算指令,包括:若所述M为1,获取所述运算请求对应的目标神经网络模型的指令流;将所述指令流拆分为多个并行指令和多个串行指令;从所述多个计算装置中选取与所述多个并行指令对应的所述多个并行计算装置和与所述多个串行指令对应的所述至少一个串行计算装置,并确定所述多个并行计算装置中每一并行计算装置的运算指令为对应的并行指令,确定所述至少一个串行计算装置中每一串行计算装置的运算指令为对应的串行指令。3.根据权利要求2所述的方法,其特征在于,所述获取所述运算请求对应的目标神经网络模型的指令流,包括:根据所述目标神经网络模型对应的基本操作序列获取第一指令描述符流;对所述第一指令描述符流进行简化,得到第二指令描述符流;根据所述第二指令描述符流获取所述指令流。4.根据权利要求2或3所述的方法,其特征在于,所述从所述多个计算装置中选取与所述多个串行指令对应的所述至少一个串行计算装置,包括:对所述多个串行指令进行分组,得到至少一组串行指令序列;从所述多个计算装置中选取与所述至少一组串行指令序列中每组串行指令序列对应的计算装置,得到所述至少一个串行计算装置。5.根据权利要求2-4任一项所述的方法,其特征在于,所述从所述多个计算装置中选取与所述多个并行指令对应的所述多个并行计算装置,包括:若所述运算请求为训练任务,基于所述运算请求对应的训练方法对所述运算请求对应的运算数据进行分组,得到多组运算数据;根据所述多组运算数据和所述多个并行指令从所述多个计算装置中选取所述多个并行计算装置。6.根据权利要求1所述的方法,其特征在于,所述属性信息包括目标神经网络模型,所述至少一个目标计算装置为一个目标并行计算装置,所述根据所述M个运算请求中每一运算请求的属性信息从所述多个计算装置中选取至少一个目标计算装置,并确定所述至少一个目标计算装置中每一目标计算装置对应的运算指令,包括:若所述M大于1,且所述M个运算请求对应一个目标神经网络模型,从所述多个计算装置中选取与所述目标神经网络模型对应的所述目标并行计算装置,并确定所述目标并行计算装置的运算指令为并行运算所述M个运算请求。7.根据权利要求1所述的方法,其特征在于,所述属性信息包括目标神经网络模型,所述至少一个目标计算装置为多个目标串行计算装置,所述根据所述M个运算请求中每一运算请求的属性信息从所述多个计算装置中选取至少一个目标计算装置,并确定所述至少一个目标计算装置中每一目标计算装置对应的运算指令,包括:若所述M大于1,且所述M个运算请求对应多个目标神经网络模型,从所述多个计算装置中选取与多个目标神经网络模型中每一目标神经网络模型对应的所述多个目标串行计算装置,并确定所述多个目标串行计算装置中每一目标串行计算装置对应的运算指令为执行该目标串行计算装置对应的目标神经网络模型所对应的运算请求。8.根据权利要求1所述的方法,其特征在于,所述属性信息包括运算任务,所述根据所述M个运算请求中每一运算请求的属性信息从所述多个计算装置中选取至少一个目标计算...
【专利技术属性】
技术研发人员:杜子东,金禄旸,
申请(专利权)人:北京中科寒武纪科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。