可重配置指令单元阵列的串行配置制造技术

技术编号:14622643 阅读:264 留言:0更新日期:2017-02-10 14:05
一种可重配置指令单元阵列(RICA)包括多个开关盒。每个开关盒包括可根据存储在每个开关盒中的配置字来配置的指令单元以及开关织构。开关盒排列成串行加载集以使得每个串行加载集中的开关盒被配置成形成用于串行地移位相应配置字的多位移位寄存器链。

【技术实现步骤摘要】
【国外来华专利技术】相关申请的交叉引用本申请要求于2013年9月12日提交的美国非临时申请No.14/025,646的优先权,其全部内容通过援引纳入于此。
本申请涉及可重配置计算,且尤其涉及被配置成串行地接收其配置数据的指令单元阵列。背景尽管处理器速度已经逐渐提高,但对提高的计算能力的需求仍然未减弱。例如,智能电话现在使其处理器负担令人困惑的各种任务。但单核处理器在给定时间只能容适这么多的指令。因此,现在通常提供能并行地处理指令集的多核或多线程处理器。但此类基于指令的架构始终必须对抗由管芯空间、功耗、以及关于增加指令处理时间的复杂性所施加的限制。与使用可编程处理核相比,存在能够在专用硬件中被更高效地处理的许多算法。例如,图像处理涉及显著并行性以及通过处理步骤的流水线的对像素的成群处理。如果算法随后被映射到硬件,则该实现利用该对称性和并行性。但设计专用硬件是昂贵的且也是麻烦的,因为如果算法被修改,则专用硬件必须被重新设计。为了提供基于指令的架构与专用硬件办法之间的高效折衷,已经开发出可重配置指令单元阵列(RICA)架构。图1A解说了具有可重配置核1的示例RICA系统50。在RICA50中,多个指令单元2(诸如加法器(ADD)、乘法器(MUL)、寄存器(REG)、逻辑运算移位器(SHIFT)、除法器(DIV)、数据比较器(COMP)、逻辑门(LOGIC)、以及逻辑跳转单元(JUMP))通过可编程开关织构4来互连。指令单元2关于它们实现的其逻辑功能或指令的配置可以在必要时被重编程以实现给定算法或功能。开关织构4也将被相应地重编程。指令单元2包括存储器接口单元12,这些存储器接口单元12对接其余指令单元2的(如被检索或加载到数据存储器8中的)数据。指令单元2的结果所得的处理根据从配置RAM6获得的配置指令10来发生。解码模块11解码指令10以便不仅获取用于指令单元2的配置数据,而且还获取用于开关织构4的配置数据。RICA50通过I/O端口16以及专用指令单元寄存器14来与外部系统对接。图1A中所示的附加特征在于2006年4月28日提交的美国专利公开No.2010/0122105中描述,该公开的内容藉此通过援引整体纳入于此。可重配置阵列中的指令单元可按行和列来布置。每个指令单元、任何相关联的寄存器、以及用于指令单元的相关联的输入和输出开关织构可被认为是驻留在开关盒内。图1B示出了按行和列排列的示例开关盒阵列。在所选开关盒之间形成的数据路径被承载在来自多个通道之中的所选通道上。该多个通道也按行和列排列以与开关盒的行和列相匹配。每个通道具有特定位宽。行方向可被认为是东西走向的,而列方向是南北走向的。开始于初始开关盒100中的指令单元的数据路径在向东行方向上的输出通道101上路由。该数据路径从后续开关盒的路由在恰适的向东/向西行方向或向北/向南列方向上,以使得到达在某个所选行和列位置处的最终开关盒105。在该示例数据路径中,两个指令单元被配置为算术逻辑单元(ALU)110。其余开关盒中的指令单元为了解说清楚而未示出。每个开关盒包括两个开关矩阵或织构:输入开关织构,用于选择去往其指令单元的通道输入;以及还有输出开关织构,用于选择从该开关盒离开的通道输出。用于指令单元的这些开关织构在图1A中被共同示为开关织构4。与指令单元形成对比,现场可编程门阵列(FPGA)中的逻辑块使用查找表(LUT)。例如,设想在经配置FPGA中执行的逻辑运算中需要AND(与)门。相应LUT将以用于AND门逻辑功能的真值表来编程。但指令单元“粗粒度”得多,因为它包含专用逻辑门。例如,ALU指令单元将包括各色专用逻辑门。ALU指令单元的功能是可配置的——其原语逻辑门是专用门并因此是不可配置的。例如,常规CMOS反相器是一种类型的专用逻辑门。关于此种反相器是没什么可供配置的,该反相器不需要任何配置位。但FPGA可编程逻辑块中的反相器功能的实例化则改为通过LUT的真值表的相应编程来执行。因此,如本文所使用的,术语“指令单元”指的是包括专用逻辑门的可配置逻辑元件。ALU指令单元对一个或多个操作数执行其逻辑功能。本上下文中的操作数是接收到的通道输入。取决于其配置位,ALU指令单元被配置成执行相应的逻辑运算。例如,第一开关盒可包括被配置成将对应于两个通道输入的两个操作数相加的ALU指令单元。但相同的ALU指令单元稍后可被更新为将这两个操作数相减。该指令单元内的逻辑运算所产生的操作数可能在另一指令单元中被需要。因此,第一开关盒中的输出开关织构将被配置成通过相应的通道输出将结果所得的操作数驱离第一开关盒。与之形成对比,FPGA的LUT产生位,这些LUT不生成字。因此FPGA中的开关结构根本上不同于RICA中的开关结构,因为FPGA的开关结构被配置成对来自FPGA的LUT的位进行路由。与之形成对比,RICA中的开关盒之间的路由被配置成作为输入通道和输出通道两者来路由字。例如,开关盒阵列可被配置成路由20个通道。这一实施例中的开关盒因此可以从所有四个方向接收20个输入通道并在这四个方向上驱动20个输出通道。注意,RICA的优点在于:由于指令单元包括专用逻辑门,因此必需的配置数据量显著地少于用于相当的FPGA的配置数据。开关盒因此可以在相对较短的延迟上被容易地重配置,以使得重配置对于伴随处理器而言实际上是实时的。与之形成对比,用于FPGA的相对巨量的配置数据需要相当长的延迟以用于其重配置。与传统处理器中的基于软件的实现相比,RICA还具有处理速度优势。例如,算法(诸如涉及通过管线化处理方案处理多个像素的图像处理)能够以仿效专用硬件办法的方式被映射到指令单元。但无需设计专用硬件。取而代之,可以只在必要时配置指令单元以及开关织构。因此,如果必须重新设计算法,则无需重新设计硬件,而是用户可以仅改变配置数据。这相对于传统的基于指令的计算办法而言是相当有优势的。尽管RICA因此提供了稳健的优点,但其实现中仍然有挑战。例如,对于每个开关盒内的可配置元件需要数个配置位,诸如用于指令单元和开关织构的配置。每个开关盒因此需要用于存储其配置位的存储元件或单元。在一个示例实施例中,二十行和二十列的阵列(结果有400个开关盒)需要77千位用于其配置。用于加载这么多配置位的电路系统消耗宝贵的管芯空间和功率。另外,RICA需要最小等待时间来加载配置位。就此,指令单元在RICA中不是被静态编程的——例如指令单元可本文档来自技高网...

【技术保护点】
一种可重配置指令单元阵列(RICA),包括:组织成多个串联加载集的开关盒阵列,其中对于每个串行加载集,相应开关盒被排列为从第一开关盒到最后开关盒,每个开关盒包括可编程指令单元和开关织构,所述可编程指令单元和开关织构两者能够根据相应的配置字来配置,每个开关盒包括被配置成存储相应配置字的n位寄存器,其中每个配置字包括多个n个配置位,n为复数整数;以及其中用于每个串行加载集的n位寄存器排列为形成n位移位寄存器,所述n位移位寄存器被配置成响应于RICA时钟的循环而在所述串行加载集中串行地移位配置字。

【技术特征摘要】
【国外来华专利技术】2013.09.12 US 14/025,6461.一种可重配置指令单元阵列(RICA),包括:
组织成多个串联加载集的开关盒阵列,其中对于每个串行加载集,相应开
关盒被排列为从第一开关盒到最后开关盒,每个开关盒包括可编程指令单元和开关
织构,所述可编程指令单元和开关织构两者能够根据相应的配置字来配置,每个开
关盒包括被配置成存储相应配置字的n位寄存器,其中每个配置字包括多个n个配
置位,n为复数整数;以及
其中用于每个串行加载集的n位寄存器排列为形成n位移位寄存器,所述n
位移位寄存器被配置成响应于RICA时钟的循环而在所述串行加载集中串行地移
位配置字。
2.如权利要求1所述的RICA,其特征在于,所述开关盒被排列成行和列,并
且其中所述串行加载集中的第一多个串行加载集中的串行加载集包括每一列的上
半部分,且其中所述串行加载集中的第二多个串行加载集中的串行加载集包括每一
列的下半部分。
3.如权利要求2所述的RICA,其特征在于,进一步包括:
用于存储用于所述串行加载集中的所述第一多个串行加载集的配置字的第一
存储器;以及
用于存储用于所述串行加载集中的所述第二多个串行加载集的配置字的第二
存储器。
4.如权利要求3所述的RICA,其特征在于,所述第一存储器和所述第二存储
器各自被配置成响应于所述RICA时钟的循环而将其存储的配置字驱动到相应的
多个串行加载集中。
5.如权利要求1所述的RICA,其特征在于,进一步包括:
对应于所述多个串行加载集的多个配置总线,每个配置总线包括对应于多个

\t配置位的多个配置位导体,每个配置位导体被配置成传导相应配置位,其中对于每
个串行加载集,相应的配置总线被耦合至所述串行加载集的第一开关盒中的n位寄
存器的数据输入端子。
6.如权利要求5所述的RICA,其特征在于,进一步包括被配置成响应于所述
RICA时钟的循环而将所述配置字驱动到所述多个配置总线中的配置存储器。
7.如权利要求6所述的RICA,其特征在于,所述配置存储器被配置成响应于
芯片选择信号和地址信号来驱动所述配置字。
8.如权利要求1所述的RICA,其特征在于,所述n位移位寄存器被配置成串
行地移位下一状态配置字,每个开关盒进一步包括被配置成响应于更新信号的断言
而将下一状态配置字存储为当前状态配置字的n位锁存器阵列。
9.如权利要求8所述的RICA,其特征在于,对于每个串行加载集,所述n位
...

【专利技术属性】
技术研发人员:H·劳I·诺西亚斯S·赫瓦姆
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1