【技术实现步骤摘要】
一种处理器及计算设备
[0001]本专利技术涉及处理器领域,具体来说,涉及并行处理任务的处理器领域,更具体地说,涉及一种采用多级运算任务分发处理机制的处理器及计算设备。
技术介绍
[0002]近年来,以深度学习为代表的神经网络算法在诸如智慧城市、电商推荐、大数据分析、自动驾驶、语义识别等各个领域得到了广泛应用,以神经网络为主的图像处理、目标检测、自然语言处理等技术促进了各个领域的发展。其中,深度学习算法具有参数多和并行计算要求高的特点。而通用图形处理器(General Purpose Graph Processing Unit ,简称GPGPU)由于具有众多并行的计算核心和极高的可编程性,成为了加速神经网络算法的首选芯片架构。
[0003]随着半导体工艺的发展,单位面积的芯片可以容纳更多的晶体管。基于此,为了满足大算力的需求,通用图形处理器的计算核心数目逐渐增多,从几个增加到几十,甚至上百。但是大量的计算核心也给计算任务的分配和调度提出了挑战。由于计算核心较多,计算任务分发模块不能及时向每个计算核心分发计算任务,会造 ...
【技术保护点】
【技术特征摘要】
1.一种处理器,其特征在于,所述处理器包括前端控制引擎、第一级命令网络和多个计算集群,所述前端控制引擎包括任务调度模块以及多个第一级任务分发模块,每个所述计算集群中包括多个计算模块;所述任务调度模块被配置为基于预设的调度规则,将计算任务以及计算任务的控制信息发送给空闲的第一级任务分发模块;每个所述第一级任务分发模块用于将接收到的计算任务分解成多个计算子任务,并通过第一级命令网络将分解得到的所述计算子任务发送给所述计算任务的控制信息中指定的一个或多个目标计算集群;每个所述目标计算集群被配置为将接收到的计算子任务分解为多个计算工作组,并将分解得到的所述计算工作组发送给所述目标计算集群中的目标计算模块执行。2.根据权利要求1所述的处理器,其特征在于,所述任务调度模块包括:任务缓存单元,用于存储多个计算任务以及每个计算任务的信息;任务调度单元,用于根据计算任务的信息,从所述任务缓存单元中选取与第一级任务分发模块当前对应的目标计算集群不重叠的计算任务作为待分发计算任务;任务发送单元,用于将所述任务调度单元选取的待分发计算任务,发送给与所述待分发计算任务的目标计算集群不重叠且有空闲的第一级任务分发模块。3.根据权利要求1所述的处理器,其特征在于,所述前端控制引擎还包括多个计算集群资源记录模块,一个计算集群资源记录模块用于记录一个计算集群的计算任务信息存储资源和计算子任务存储资源,并基于计算集群中的计算子任务完成情况更新记录。4.根据权利要求3所述的处理器,其特征在于,所述每个第一级任务分发模块包括:第一级计算任务信息存储单元,用于存储接收到的计算任务信息,所述计算任务信息包括计算任务的描述信息和计算任务的控制信息,其中,所述计算任务的控制信息用于指示计算任务的优先级、目标计算集群和目标计算模块,所述计算任务的描述信息包括计算任务三维结构的长度、计算子任务的大小;计算集群分配单元,用于根据计算任务的控制信息给计算任务分配一个或多个计算集群作为目标计算集群,并将计算任务的控制信息发送给分配的目标计算集群;计算任务分解单元,用于根据计算任务的描述信息中描述的计算任务三维结构的长度以及计算子任务的大小,将计算任务分解为多个计算子任务;计算子任务发送单元,用于查询计算集群资源记录模块的记录,并将所述计算任务分解单元分解后的计算子任务通过所述第一级命令网络发送到已经发送过计算任务控制信息且有剩余资源能够接受新的计算子任务的目标计算集群。5.根据权利要求4所述的处理器,其特征在于,所述计算任务分解单元被配置为:选择计算任务的三维结构中的一个方向为基准方向;以计算任务的描述信息中预设的计算子任务大小为分解单位,沿基准方向按行对计算任务的三维结构进行遍历,得到多个计算子任务的信息,其中,遍历过程中每查找到计算工作组的数量与计算子任务的大小匹配时,确定一个计算子任务,通过所述计算子任...
【专利技术属性】
技术研发人员:马亮,王平,
申请(专利权)人:杭州登临瀚海科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。