对载明并行和依赖运算的指令矩阵进行处理的装置和方法制造方法及图纸

技术编号:9794513 阅读:152 留言:0更新日期:2014-03-21 18:59
执行块的矩阵形成多行和多列。多行支持指令的并行执行,多列支持依赖指令的执行。执行块矩阵处理载明并行指令和依赖指令的单个指令块。

【技术实现步骤摘要】
本申请是2008年11月12日进入中国国家阶段的国家申请号为200780017317.4的PCT国际申请(国际申请日为2007年4月12日并且国际申请号为PCT/US2007/066536)的分案申请,这里以引用的方式结合该申请的全部内容。
本专利技术主要涉及计算机体系结构。更具体地,本专利技术涉及一种用于处理指定并行运算和依赖运算的矩阵指令的计算机体系结构。
技术介绍
改善计算机体系结构性能是一个很困难的任务。已经通过频率变标(frequencyscaling)、单指令多数据(SMD)、超长指令字(VLIW)、多线程和多处理器技术来寻求上述的性能改善。这些方法着重于改善程序执行的吞吐量。上述技术中的很大一部分要求软件显式(explicitly)地呈现出并行性。与此不同的是,频率变标在改善吞吐量和延迟的同时无需软件显式地标记并行性。近来,频率变标面临着功耗壁垒(power wall)问题,所以很难通过频率变标进行改进。因此,除非表示出大规模的显式软件并行(explicit softwareparallelization),否则很难增加吞吐量。鉴于上述问题,人们期望在不依赖本文档来自技高网...

【技术保护点】
一种处理器,包括:执行单元矩阵,包括第一行执行单元和第二行执行单元,其中,所述第一行执行单元并行地操作并且所述第二行执行单元并行地且依赖于所述第一行执行单元进行操作;具有多个寄存器分段的寄存器文件,用于存储指令矩阵结果,用于由所述执行单元矩阵进行随后处理,其中,所述指令矩阵的每一个指令矩阵包括由所述第一行执行单元的执行单元的子集并行执行的第一行指令以及由所述第二行执行单元的执行单元的子集执行的第二行指令,其中,所述寄存器文件对于不同的执行模式可配置,所述寄存器文件包括:形成单个寄存器文件的所述多个寄存器分段,其中,每一个寄存器分段存储形成超级指令矩阵的多个指令矩阵的单指令多数据(SIMD)指令...

【技术特征摘要】
2006.04.12 US 60/791,782;2006.04.12 US 60/791,6491.一种处理器,包括: 执行单元矩阵,包括第一行执行单元和第二行执行单元,其中,所述第一行执行单元并行地操作并且所述第二行执行单元并行地且依赖于所述第一行执行单元进行操作; 具有多个寄存器分段的寄存器文件,用于存储指令矩阵结果,用于由所述执行单元矩阵进行随后处理,其中,所述指令矩阵的每一个指令矩阵包括由所述第一行执行单元的执行单元的子集并行执行的第一行指令以及由所述第二行执行单元的执行单元的子集执行的第二行指令,其中,所述寄存器文件对于不同的执行模式可配置,所述寄存器文件包括: 形成单个寄存器文件的所述多个寄存器分段,其中,每一个寄存器分段存储形成超级指令矩阵的多个指令矩阵的单指令多数据(SIMD)指令或多指令多数据(MIMD)指令的源和结果的一个字的段; 形成具有单独的寄存器状态的单独的独立寄存器文件的所述多个寄存器分段,用于支持分离的线程的同时处理,其中,每一个指令矩阵与分离的线程和分离的寄存器文件分段相关联;并且 形成单个线程寄存器文件的所述多个寄存器分段,其中,在所述寄存器文件的多个分段中复制寄存器分段,以存储从单个线程指令序列动态发出的同时执行的非依赖的指令矩阵的结果。2.如权利要求1所述的处理器,其中,所述指令矩阵由运行时系统形成。3.如权利要求1所述的处理器,其中,所述指令矩阵由硬件形成。4.如权利要求1所述的处理...

【专利技术属性】
技术研发人员:M·A·阿卜杜拉
申请(专利权)人:索夫特机械公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1