用于仿真共享内存架构中的长延迟操作的架构制造技术

技术编号：13834553 阅读：75 留言：0更新日期：2016-10-14 19:16

用于仿真共享内存(ESM)架构的处理器架构布置，包括若干多线程处理器，优选地多个多线程处理器，每个多线程处理器设置有交错的线程间流水线，其中流水线包括多个串联布置的用于对数据执行算数、逻辑以及可选地其它操作的多个功能单元，其中较低延迟的一个或多个功能单元被放置在所述流水线中位于内存访问区段之前，并且用于执行与较长延迟相关联的较复杂操作的一个或多个长延迟单元(LLU)被放置成操作上与内存访问区段并行。在一些实施方案中，流水线可以包含与内存访问区段并行的多个分支，每个分支包含至少一个长延迟单元。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术总体上涉及计算机科学和计算机架构。具体而言，本专利技术涉及与仿真共享内存架构有关的长延迟操作的执行。
技术介绍
在SMA(共享内存架构)中，数据和程序分区通常通过将需要多线程处理的数据放进共享内存并且将程序更加独立地划分给处理器来实现，由此使得与消息传递(MPA)架构相比而言编程更容易，在消息传递架构中，处理始终在本地发生并且程序员相应地负责将数据四处移动。遗憾地是，大多数SMA使用由多个互联的处理器-缓存器对组成的分布式共享内存架构，这使得缓存器一致性(以及延时容许度)和同步性维护非常昂贵。这甚至可能破坏它们在通信密集型问题方面的表现。为解决例如上述问题，已经引入了仿真共享内存(ESM)或共享内存仿真、架构。它们包括经由高吞吐互通网络连接到通常一致且同步可访问的共享内存的一组多线程处理器。通过重叠的正在进行的内存引用隐藏了内存系统延时，并且建立了保证机器指令级的同步性的特殊的低成本同步机制。虽然实际的硬件架构包括物理分布式内存，但是ESM系统为用户提供了理想的共享内存感知。从理论的角度看，这些架构试图模拟抽象的并行随机存取机(PRAM)，该并行随机存取机由于它的简单性和表现力而通常被用作用于描述和分析计算问题的内在并行性以及执行并行算数的性能和成本的模型。PRAM模型通常指的是一组在相同时钟下工作的处理器以及与处理器连接的统一单步可访问的共享内存。因此，ESM是一种解决关于片上多处理器(CMP)的可编程性和性能可扩展性问题的可行技术，因为ESM产生了在机器指令的执行中隐含的同步性、有效的延时隐藏技术以及足够的带宽来路由即使具有大量随机和并发访...

【技术保护点】
一种用于仿真共享内存(ESM)架构的处理器架构布置，包括：若干个多线程处理器，优选地多个多线程处理器，每个多线程处理器设置有交错的线程间流水线(400、500)，其中所述流水线(400、500)包括多个串联布置的用于对数据执行算数、逻辑以及可选地其它操作的多个功能单元(402、402b、402c、502a)，其中较低延迟的一个或多个功能单元(402)被放置在所述流水线中位于内存访问区段(412)之前，并且用于执行与较长延迟相关联的较复杂操作的一个或多个长延迟单元(402b、502a)被放置为操作上与所述内存访问区段(412)并行。

【技术特征摘要】
【国外来华专利技术】2013.12.19 EP 13198516.01.一种用于仿真共享内存(ESM)架构的处理器架构布置，包括：若干个多线程处理器，优选地多个多线程处理器，每个多线程处理器设置有交错的线程间流水线(400、500)，其中所述流水线(400、500)包括多个串联布置的用于对数据执行算数、逻辑以及可选地其它操作的多个功能单元(402、402b、402c、502a)，其中较低延迟的一个或多个功能单元(402)被放置在所述流水线中位于内存访问区段(412)之前，并且用于执行与较长延迟相关联的较复杂操作的一个或多个长延迟单元(402b、502a)被放置为操作上与所述内存访问区段(412)并行。2.根据权利要求1所述的处理器架构布置，其中，若干功能单元(402c)功能上被放置在所述流水线中位于所述内存访问区段(412)之后。3.根据前述权利要求任一项所述的处理器架构布置，其中，至少两个长延迟单元链接在一起，其中，一长延迟单元被配置成将操作结果作为操作数传递至链中的后续单元。4.根据前述权利要求任一项所述的处理器架构布置，其中，较低延迟的一个或多个功能单元包括至少一个ALU用于整数算数。5.根据前述权利要求任一项所述的处理器架构布置，其中，所述流水线包括至少两个并行分支(500a、500b)，每个分支包括与所述内存访问区段(412)并行...

【专利技术属性】
技术研发人员：马尔蒂·佛塞尔，
申请(专利权)人：芬兰国家技术研究中心股份公司，
类型：发明
国别省市：芬兰;FI

全部详细技术资料下载我是这个专利的主人