【技术实现步骤摘要】
时间确定性编译器
本公开涉及在包括多个瓦片(tile)的处理器中同步多个不同瓦片的工作量,每个瓦片包括具有本地存储器的处理单元。具体地,本公开涉及批量同步并行(BSP)计算协议,其中瓦片组中的每一个必须在该组中的任何瓦片可以继续交换阶段之前完成计算阶段。
技术介绍
计算中的并行性(parallelism)采取不同的形式。程序片段可以被组织为并发地执行(其中它们在时间上重叠但可以共享执行资源)或者并行地执行,其中它们可能同时在不同资源上执行。计算中的并行性可以以多种方式来实现,诸如借助多个互连处理器瓦片的阵列,或者多线程处理单元,或者其中每个瓦片包括多线程处理单元的多瓦片阵列。当借助于包括在同一芯片(或在相同集成电路封装中的芯片)上的多瓦片阵列的处理器实现并行性时,每个瓦片包括其自己的单独的相应处理单元,其具有本地存储器(包括程序存储器和数据存储器)。因此,程序代码的单独部分可以在不同的瓦片上并发运行。这些瓦片经由片上互连(on-chipinterconnect)而连接在一起,这使得在不同瓦片上运行的代码能够在瓦片之间进行通信。在一些情况下,每个瓦片上的处理单元可以采取桶形线程处理单元(或其他多线程处理单元)的形式。每个瓦片可以具有上下文组和执行流水线,使得每个瓦片可以并发地运行多个交错线程。通常,在阵列中的不同瓦片上运行的程序的各部分之间可以存在依赖性。因此,需要一种技术来防止一个瓦片上的一段代码在它所依赖于的数据被另一瓦片上的另一段代码使其可用之前运行。存在许多用于实现此目的的可能方案,但是本文中感兴趣的方案被称为“批量同步并行”(BSP)。根据BSP, ...
【技术保护点】
1.一种计算机实现的生成多个程序以递送计算机化功能的方法,每个程序在计算机的处理单元中被执行,所述计算机包括:多个处理单元,每个处理单元具有用于保存本地程序的指令存储、用于执行所述本地程序的执行单元和用于保存数据的数据存储;连接到每个处理单元的输出接口并且可通过每个处理单元可控制的切换电路连接到每个处理单元的输入接口的切换结构;以及可操作以生成同步信号的同步模块,所述方法包括:为每个处理单元生成包括可执行指令序列的本地程序;为每个处理单元确定执行每个本地程序的指令的相对时间,由此分配给一个处理单元的本地程序被调度为以相对于同步信号的预定延迟执行发送指令以在相对于所述同步信号的预定发射时间发射至少一个数据包,所述至少一个数据包的目的地为接收处理单元但没有目的地标识符,并且分配给所述接收处理单元的本地程序被调度为在预定切换时间执行切换控制指令以控制所述切换电路将其处理单元线连接到所述切换结构以在接收时间接收所述数据包。
【技术特征摘要】
2017.10.20 GB 1717304.81.一种计算机实现的生成多个程序以递送计算机化功能的方法,每个程序在计算机的处理单元中被执行,所述计算机包括:多个处理单元,每个处理单元具有用于保存本地程序的指令存储、用于执行所述本地程序的执行单元和用于保存数据的数据存储;连接到每个处理单元的输出接口并且可通过每个处理单元可控制的切换电路连接到每个处理单元的输入接口的切换结构;以及可操作以生成同步信号的同步模块,所述方法包括:为每个处理单元生成包括可执行指令序列的本地程序;为每个处理单元确定执行每个本地程序的指令的相对时间,由此分配给一个处理单元的本地程序被调度为以相对于同步信号的预定延迟执行发送指令以在相对于所述同步信号的预定发射时间发射至少一个数据包,所述至少一个数据包的目的地为接收处理单元但没有目的地标识符,并且分配给所述接收处理单元的本地程序被调度为在预定切换时间执行切换控制指令以控制所述切换电路将其处理单元线连接到所述切换结构以在接收时间接收所述数据包。2.根据权利要求1所述的方法,其中,所述处理单元相对于彼此具有固定的位置关系,并且所述确定步骤包括基于所述计算机中的每对处理单元之间的位置关系确定固定延迟。3.根据权利要求2所述的方法,其中,所述固定的位置关系包括行和列的阵列,其中每个处理单元具有标识符,所述标识符标识其在所述阵列中的位置。4.根据权利要求1至3中任一项所述的方法,其中,所述切换电路包括多路复用器,所述多路复用器具有连接到其处理单元的输出线组,以及可连接到所述切换结构的多组输入线,所述多路复用器在所述计算机上相对于其处理单元位于预定的物理位置处,并且其中所述确定步骤包括确定来自所述多路复用器的输出数据包到达其处理单元的所述输入接口和所述切换控制指令到达所述多路复用器的固定延迟。5.根据权利要求1至3中任一项所述的方法,包括在每个程序中提供同步指令的步骤,所述同步指令向所述同步模块指示在所述处理单元处的计算阶段已经完成。6.根据权利要求5所述的方法,其中,所述确定步骤包括为每个处理单元确定所述芯片上的同步事件和在所述处理单元处接收到关于同步事件已经发生的确认之间的固定延迟。7.根据权利要求1至3中任一项所述的方法,其中,所述确定步骤包括为每个处理单元确定所述芯片上的同步事件和在所述处理单元处接收到关于同步事件已经发生的确认之间的固定延迟。8.根据权利要求1至3中任一项所述的方法,其中,所述确定步骤包括访问查找表,所述查找表保存关于使得能够确定所述预定发射时间和预定切换时间的延迟的信息。9.根据权利要求1至3中任一项...
【专利技术属性】
技术研发人员:西蒙·克里斯蒂安·诺尔斯,丹尼尔·约翰·佩勒姆·威尔金森,理查德·卢克·索斯维尔·奥斯本,艾伦·格雷汉姆·亚历山大,斯蒂芬·菲利克斯,乔纳森·曼格纳尔,大卫·莱西,
申请(专利权)人:图核有限公司,
类型:发明
国别省市:英国,GB
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。