当前位置: 首页 > 专利查询>英特尔公司专利>正文

异构计算系统中的工作窃取技术方案

技术编号:16069204 阅读:243 留言:0更新日期:2017-08-25 09:03
工作窃取器设备包含确定模块。确定模块确定从第一类型的第一硬件计算单元窃取工作用于不同于第一类型的第二类型的第二硬件计算单元。该工作在第一工作队列中排队,第一工作队列对应于第一硬件计算单元并且将被存储在由第一和第二硬件计算单元共享的共享存储器中。同步工作窃取器模块通过对第一工作队列的同步存储器存取来窃取工作。同步存储器存取将相对于对来自第一硬件计算单元的第一工作队列的存储器存取同步。

Job stealing in heterogeneous computing systems

The job stealing device contains the determination module. The determination module determines that the first hardware computing unit stealing from the first type is used for a second type second hardware computing unit different from the first type. The work is queued in the first work queue, the first work queue corresponding to the first hardware computing unit, and will be stored in the shared memory shared by the first and second hardware computing units. The synchronous job stealing module steals work by accessing the synchronization memory of the first work queue. Synchronous memory access is synchronized with memory access to the first working queue from the first hardware computing unit.

【技术实现步骤摘要】
版权通告本文包含的是受到版权保护的材料。当它出现在专利和商标局专利文件或记录中时,版权拥有者不反对任何人复制该专利公开,但无论如何在其它方面保留对版权的所有权利。
本文描述的实施例一般涉及异构计算系统。具体地说,本文描述的实施例一般涉及异构计算系统中的工作窃取
技术介绍
计算机除了部署为中央处理单元(CPU)的通用处理器之外还经常具有一个或多个硬件加速器装置。此类硬件加速器装置的一个广泛使用的示例是图形处理单元(GPU)。GPU传统上已经用作主要驱动一个或多个显示器的图形子系统的一部分。GPU帮助从CPU卸载工作,由此允许CPU资源用于其它任务。CPU通常实现为通用处理器,并且一般将适合于执行各种不同类型的算法(例如一般性质的处理)。相比之下,GPU经常实现为专用处理器或至少更专业化的处理器,其一般更适合于执行有限数量的专业化算法(例如图形相关算法)。GPU经常具有高度并行的计算硬件,其倾向于允许它们快速处理图形数据。近来,已经认识到GPU可用于其它非图形应用。例如,GPU上的通用计算(GPGPU)一般表示利用GPU执行传统上已经预留用于CPU的类型的通用型计算。经常可采用GPU的本文档来自技高网...
异构计算系统中的工作窃取

【技术保护点】
一种异构计算机系统,包括:第一处理器;与所述第一处理器不同的第二处理器,其中所述第二处理器是数字信号处理器(DSP);多个工作队列,用于存储将在所述第一和第二处理器处理的任务;以及工作窃取器逻辑,用于从所述多个队列窃取指定为在所述第一处理器进行处理的第一任务以便在所述第二处理器进行处理,以及从所述多个队列窃取指定为在所述第二处理器进行处理的第二任务以便在所述第一处理器进行处理。

【技术特征摘要】
1.一种异构计算机系统,包括:第一处理器;与所述第一处理器不同的第二处理器,其中所述第二处理器是数字信号处理器(DSP);多个工作队列,用于存储将在所述第一和第二处理器处理的任务;以及工作窃取器逻辑,用于从所述多个队列窃取指定为在所述第一处理器进行处理的第一任务以便在所述第二处理器进行处理,以及从所述多个队列窃取指定为在所述第二处理器进行处理的第二任务以便在所述第一处理器进行处理。2.如权利要求1所述的系统,其中所述多个队列包括第一队列集合与第二队列集合,所述第一队列集合用于对所述第一处理器的任务进行排队,所述第二队列集合用于对所述第二处理器的任务进行排队。3.如权利要求2所述的系统,其中所述工作窃取器逻辑从所述第二队列集合的第一队列窃取第三任务以便在所述第一处理器进行处理。4.如权利要求3所述的系统,其中所述第一处理器包括通用处理器。5.如权利要求4所述的系统,还包括由所述第一处理器和所述第二处理器共享的存储器。6.如权利要求5所述的系统,其中所述多个队列存储在所述存储器中。7.如权利要求5所述的系统,其中所述存储器包括动态随机存取存储器(DRAM)。8.如权利要求6所述的系统,还包括存储器控制器,其耦合到所述第一处理器和所述第二处理器以便控制对所述存储器的访问。9.如权利要求1所述的系统,其中所述第一处理器、所述第二处理器、所述多个工作队列以及所述工作窃取器逻辑安装在集成电路上。10.一种集成电路(IC),包括:第一处理器;与所述第一处理器不同的第二处理器,其中所述第二处理器是数字信号处理器(DSP);多个工作队列,用于存储将在所述第一和第二处理器处理的任务;以及工作窃取器逻辑,用于从所述多个队列窃取指定为在所述第一处理器进行处理的第一任务以便在所述第二处理器进行处理,以及...

【专利技术属性】
技术研发人员:R·白里克S·A·赫哈特J·斯里拉姆T·施佩斯曼R·L·哈德森
申请(专利权)人:英特尔公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1