对载明并行和依赖运算的指令矩阵进行处理的装置和方法制造方法及图纸

技术编号：2913402 阅读：178 留言：0更新日期：2012-04-11 18:40

执行块的矩阵形成多行和多列。多行支持指令的并行执行，多列支持依赖指令的执行。执行块矩阵处理载明并行指令和依赖指令的单个指令块。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
[0001]本专利技术主要涉及计算机体系结构。更具体地，本专利技术涉及一种用于处理指定并行运算和依赖运算的矩阵指令的计算机体系结构。
技术介绍
[0002]改善计算机体系结构性能是一个很困难的任务。已经通过频率变标(frequency scaling)、单指令多数据(SIMD)、超长指令字(VLIW)、多线程和多处理器技术来寻求上述的性能改善。这些方法着重于改善程序执行的吞吐量。上述技术中的很大一部分要求软件显式(explicitly)地呈现出并行性。与此不同的是，频率变标在改善吞吐量和延迟的同时无需软件显式地标记并行性。近来，频率变标面临着功耗壁垒(power wall)问题，所以很难通过频率变标进行改进。因此，除非表示出大规模的显式软件并行(explicitsoftware parallelization)，否则很难增加吞吐量。[0003]鉴于上述问题，人们期望在不依赖于频率变标和大规模的显式软件并行的前提下改善计算机体系结构的性能。
技术实现思路
[0004]执行块矩阵形成多行和多列。多行支持指令的并行执行，而多列支持依赖指令的执行。执行块矩阵处理载明并行指令和依赖指令的单个指令矩阵。附图说明[0005]参考详细说明并结合附图，本专利技术将得到更完整地阐释，在附图中：[0006]图1表示按照本专利技术实施例的支持执行并行指令和依赖指令的体系结构；[0007]图2A表示映射串行指令以在本专利技术的执行矩阵中产生并行和依赖-->运算；[0008]图2B表示对本专利技术执行矩阵进行的运算映射；[0009]图3表示按照本专利技术实施例可能用到的一行执行块；[0...

【技术保护点】
一种装置，包括：　形成多行和多列的执行块矩阵，其中所述多行支持指令的并行执行，以及所述多列支持依赖指令的执行，其中所述执行块矩阵处理载明并行指令和依赖指令的单个指令块。

【技术特征摘要】
【国外来华专利技术】US 2006-4-12 60/791,782;US 2006-4-12 60/791,649;US1.一种装置，包括：形成多行和多列的执行块矩阵，其中所述多行支持指令的并行执行，以及所述多列支持依赖指令的执行，其中所述执行块矩阵处理载明并行指令和依赖指令的单个指令块。2.权利要求1的装置，其中所述执行块矩阵形成单处理器流水线的一部分。3.权利要求2的装置，其中所述单处理器流水线包括提取阶段、分支处理阶段、解码阶段、调度阶段、执行阶段和提交阶段。4.权利要求3的装置，其中所述提取阶段提取所述单个指令块，并且根据所述指令块的大小增加程序计数器的计数值。5.权利要求4的装置，其中所述分支处理阶段支持其他指令块的分支。6.权利要求3的装置，其中所述调度阶段使用块寄存器参考。7.权利要求3的装置，还包括支持并行块写入的寄存器文件。8.权利要求1的装置，其中所述执行块支持浮点运算、整数运算、单指令多数据(SIMD)运算和多指令多数据(MIMD)运算。9.权利要求1的装置，其中所述执行块矩阵形成延时切片体系结构，从而在单个时钟周期内处理并行指令和依赖指令。10.权利要求9的装置，其中所...

【专利技术属性】
技术研发人员：MA阿卜杜拉，
申请(专利权)人：索夫特机械公司，
类型：发明
国别省市：US[美国]

全部详细技术资料下载我是这个专利的主人