【技术实现步骤摘要】
【国外来华专利技术】用于工作项同步的方法和系统 专利技术背景专利
[0001 ] 本专利技术大致涉及工作项同步。
技术介绍
图形处理单元(GPU)通常包括理想地适合于在并行数据流上执行相同的指令的多个处理元件,如在单指令多数据(SMD)设备中的情况或在数据并行处理中的。在很多计算模型中,中央处理单元(CPU)起主机或控制处理器的作用,并不干涉其它处理器(例如GPU)的专用函数,例如图形处理。多核CPU(其中每个CPU具有多个处理核心)为与在GPU上可用的那些函数类似的专用函数(例如图形处理)提供处理能力。多核CPU或GPU的一个或多个计算核心可以是同一裸片(例如AMDFusion?)的部分,或可选地在不同的裸片(例如具有NVIDIAGPU的 IntelXeon?)中。最近,具有 CPU 和 GPU(例如 CellSPE?、IntelLarrabee?)两者的特征的混合核心被提出,用于通用GPU(GPGPU)型计算。GPGPU型的计算主张使用CPU来主要执行控制代码并将性能关键数据-并行代码卸载到GPU。GPU主要用作加速器。多核CPU和GPGPU计算模型的组合包括CPU核心和作为加速器目标的GPU核心两者。很多多核CPU核心具有在很多领域中与GPU可比较的性能。为具有CPU和GPU的异构计算平台开发了几个框架。这些框架包括斯坦福大学的BrookGPU.NVIDIA的计算统一设备架构(CUDA)和被称为科纳斯组织的行业协会的OpenCL。OpenCL框架提供用户可创建用于GPU的应用的C型开发环境。OpenCL使用户能够例如指定用于将一些计算(例如数据-并行计算)卸载到G ...
【技术保护点】
一种使一个或多个处理器上的一组工作项同步的方法,其包括:通过来自所述组的第一工作项执行屏障跳越指令;以及响应于所述执行的屏障跳越指令,重新配置屏障以使来自所述组的其它工作项在序列中的多个点上同步,而不要求所述第一工作项在所述多个点中的任一个上到达所述屏障。
【技术特征摘要】
【国外来华专利技术】2011.11.03 US 13/288,8331.一种使一个或多个处理器上的一组工作项同步的方法,其包括: 通过来自所述组的第一工作项执行屏障跳越指令;以及 响应于所述执行的屏障跳越指令,重新配置屏障以使来自所述组的其它工作项在序列中的多个点上同步,而不要求所述第一工作项在所述多个点中的任一个上到达所述屏障。2.如权利要求1所述的方法,其还包括: 配置所述屏障以在一序列同步点处使所述组同步,其中所述序列包括所述多个点。3.如权利要求1所述的方法,其中重新配置所述屏障以使其它工作项同步包括: 使与所述屏障相关的跳越计数递增,其中所述跳越计数在确定来自所述组的所有工作项是否到达所述屏障时被使用。4.如权利要求1所述的方法,其还包括: 使所述其它工作项在所述多个点中的第一点和第二点处同步,其中所述第一工作项在所述第一点和所述第二点处不到达所述屏障。5.如权利要求4所述的方法,其中使所述其它工作项同步包括: 对于到达所述屏障的所述其它工作项中的每个,确定它是否是所述其它工作项中的最后一个;以及 当所述其它工作项中的所述最后一个到达所述屏障时,将所有所述其它工作项解锁以重新开始处理。6.如权利要求5所述的方法,其中确定它是否是所述其它工作项中的最后一个包括: 比较跳越计数和访问计数的和与释放阈值,其中当所述跳越指令被执行时所述跳越计数递增,其中当工作项到达所述屏障时所述访问计数递增,且其中所述释放阈值对应于所述组中的工作项的数量。7.如权利要求4所述的方法,其中使所述其它工作项同步包括: 在所述第一点处使所述其它工作项同步; 部分重置所述屏障以仅使所述其它工作项同步;以及 在部分重置所述屏障以仅使所述其它工作项同步之后在所述第二点处使所述其它工作项同步。8.如权利要求7所述的方法,其中部分重置所述屏障以仅使所述其它工作项同步包括: 将与所述屏障相关的访问计数设置到指示没有工作项到达所述屏障的初始值,其中所述访问计数代表到达所述屏障的工作项的数量;以及 使跳越计数的值持久,其中当工作项发布屏障跳越指令时,所述跳越计数递增。9.如权利要求1所述的方法,其还包括: 通过来自所述组的任何工作项执行屏障重置指令;以及 响应于所述屏障重置指令,进一步重新配置所述屏障以要求来自所述组的所有工作项到达所述屏障,以便使所述...
【专利技术属性】
技术研发人员:李·W·豪斯,本尼迪克特·R·盖斯特,迈克尔·C·休斯顿,迈克尔·曼特,马克·莱瑟,诺曼·拉宾,布赖恩·D·恩柏林,
申请(专利权)人:超威半导体公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。