The job stealing device contains the determination module. The determination module determines that the first hardware computing unit stealing from the first type is used for a second type second hardware computing unit different from the first type. The work is queued in the first work queue, the first work queue corresponding to the first hardware computing unit, and will be stored in the shared memory shared by the first and second hardware computing units. The synchronous job stealing module steals work by accessing the synchronization memory of the first work queue. Synchronous memory access is synchronized with memory access to the first working queue from the first hardware computing unit.
【技术实现步骤摘要】
版权通告本文包含的是受到版权保护的材料。当它出现在专利和商标局专利文件或记录中时,版权拥有者不反对任何人复制该专利公开,但无论如何在其它方面保留对版权的所有权利。
本文描述的实施例一般涉及异构计算系统。具体地说,本文描述的实施例一般涉及异构计算系统中的工作窃取。
技术介绍
计算机除了部署为中央处理单元(CPU)的通用处理器之外还经常具有一个或多个硬件加速器装置。此类硬件加速器装置的一个广泛使用的示例是图形处理单元(GPU)。GPU传统上已经用作主要驱动一个或多个显示器的图形子系统的一部分。GPU帮助从CPU卸载工作,由此允许CPU资源用于其它任务。CPU通常实现为通用处理器,并且一般将适合于执行各种不同类型的算法(例如一般性质的处理)。相比之下,GPU经常实现为专用处理器或至少更专业化的处理器,其一般更适合于执行有限数量的专业化算法(例如图形相关算法)。GPU经常具有高度并行的计算硬件,其倾向于允许它们快速处理图形数据。近来,已经认识到GPU可用于其它非图形应用。例如,GPU上的通用计算(GPGPU)一般表示利用GPU执行传统上已经预留用于CPU的类型的通用型计算。经常可采用GPU的高度并行计算硬件来显著地加速此类计算。当以这种方式使用时,至少当正确实现时,GPU可帮助显著加速计算密集应用。然而,使用GPU加速非图形应用的一个挑战(例如在GPGPU的情况下)涉及工作调度。为了有效地利用CPU和GPU,重要的是在CPU与GPU之间以有效方式调度和分布工作。在一个可能方法中,CPU可以仅仅向GPU卸载或指配特定任务。CPU然后可等待或执行其它任务,而GPU完成 ...
【技术保护点】
一种异构计算机系统,包括:第一处理器;与所述第一处理器不同的第二处理器,其中所述第二处理器是数字信号处理器(DSP);多个工作队列,用于存储将在所述第一和第二处理器处理的任务;以及工作窃取器逻辑,用于从所述多个队列窃取指定为在所述第一处理器进行处理的第一任务以便在所述第二处理器进行处理,以及从所述多个队列窃取指定为在所述第二处理器进行处理的第二任务以便在所述第一处理器进行处理。
【技术特征摘要】
1.一种异构计算机系统,包括:第一处理器;与所述第一处理器不同的第二处理器,其中所述第二处理器是数字信号处理器(DSP);多个工作队列,用于存储将在所述第一和第二处理器处理的任务;以及工作窃取器逻辑,用于从所述多个队列窃取指定为在所述第一处理器进行处理的第一任务以便在所述第二处理器进行处理,以及从所述多个队列窃取指定为在所述第二处理器进行处理的第二任务以便在所述第一处理器进行处理。2.如权利要求1所述的系统,其中所述多个队列包括第一队列集合与第二队列集合,所述第一队列集合用于对所述第一处理器的任务进行排队,所述第二队列集合用于对所述第二处理器的任务进行排队。3.如权利要求2所述的系统,其中所述工作窃取器逻辑从所述第二队列集合的第一队列窃取第三任务以便在所述第一处理器进行处理。4.如权利要求3所述的系统,其中所述第一处理器包括通用处理器。5.如权利要求4所述的系统,还包括由所述第一处理器和所述第二处理器共享的存储器。6.如权利要求5所述的系统,其中所述多个队列存储在所述存储器中。7.如权利要求5所述的系统,其中所述存储器包括动态随机存取存储器(DRAM)。8.如权利要求6所述的系统,还包括存储器控制器,其耦合到所述第一处理器和所述第二处理器以便控制对所述存储器的访问。9.如权利要求1所述的系统,其中所述第一处理器、所述第二处理器、所述多个工作队列以及所述工作窃取器逻辑安装在集成电路上。10.一种集成电路(IC),包括:第一处理器;与所述第一处理器不同的第二处理器,其中所述第二处理器是数字信号处理器(DSP);多个工作队列,用于存储将在所述第一和第二处理器处理的任务;以及工作窃取器逻辑,用于从所述多个队列窃取指定为在所述第一处理器进行处理的第一任务以便在所述第二处理器进行处理,以及...
【专利技术属性】
技术研发人员:R·白里克,S·A·赫哈特,J·斯里拉姆,T·施佩斯曼,R·L·哈德森,
申请(专利权)人:英特尔公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。