当前位置: 首页 > 专利查询>复旦大学专利>正文

一种适用于2.5D多核系统的融合存储器的片外加速器技术方案

技术编号:10420905 阅读:167 留言:0更新日期:2014-09-12 11:48
本发明专利技术属于多核处理器设计技术领域,具体为一种适用于2.5D多核系统的融合存储器的片外加速器。该片外加速器包括:逻辑控制电路(包括指令译码器、状态寄存器)、存储器(以阵列方式组织)、加速器、可配置互连网络。逻辑控制电路从处理器端接收配置包,经过解析,对相应的链路进行配置,决定存储器的输出数据是否经过加速逻辑返回处理器。本发明专利技术结构适用于面向特定应用的2.5D多核处理系统,可以降低由于片间访存延时较大而引起的性能损失,存储器输出数据可以选择经过不同的加速单元进行计算和输出,具有一定的灵活性。

【技术实现步骤摘要】
一种适用于2.5D多核系统的融合存储器的片外加速器
本专利技术属于多核处理器
,具体涉及面向特定应用的融合存储器的片外加速器结构。
技术介绍
近年来,为了解决单芯片设计越来越复杂的问题,人们逐渐把目光转移到2.5D和3D电路的设计实现上,常见的一种形式就是把处理器、存储器和加速器分别在不同的芯片上实现。但是对于多媒体这种具有存储密集和重复计算性质的应用来说,从存储器到处理器和加速器的数据通信需要经过芯片的I/O口、芯片间的互连通道才能到达目的芯片,然后沿着相同的路径返回至存储器,有时甚至会出现跨越多个芯片的数据通信。这种情况下,在实现过程中,会出现两个主要的影响性能瓶颈。第一,通过层次化的存储器进行通信,会有一个比较明显的延时,主要是由于处理器和存储器间日益扩大的“存储墙”造成的。第二,连接处理器和存储器的总线带宽受到芯片和板级互连的限制。这两个因素极大的影响了芯片间的通信效率,尤其是对于多媒体、通信这种数据密集型的应用,影响尤其明显。
技术实现思路
本专利技术的目的在于,针对2.5D多核系统中存在的芯片间通信延时大、通信效率低的问题,提出一种适用于2.5D多核系统的融合存储器的片外加速器的实现方案,以降低功耗、提高性能。本专利技术提出的适用于2.5D多核系统的融合存储器的片外加速器结构,通过高度集成的方式实现在一块芯片上。通过互连方式将存储器和加速器以一定的耦合方式连接在一起,处理器发送配置包来配置存储器和加速器之间的数据通路,存储器中的数据可以直接选择不经过任何处理返回处理器,也可以直接进入某种加速器,实现特定功能的计算后返回给处理器,避免了芯片之间因为多次通信来实现加速所造成的性能和功耗损失。本专利技术提出的一种适用于2.5D多核系统的融合存储器的片外加速器,具体包括:逻辑控制电路(包括指令译码器、状态寄存器)、存储器(以阵列方式组织)、加速器、可配置互连网络。其中:所述逻辑控制电路是整个片外芯片的控制中心,逻辑控制电路接收处理器发送的配置包,配置存储器和加速器以及加速器和加速器之间的网络接口,选择存储器的输出数据是否要经过加速器的计算再返回处理器。逻辑控制电路接收到处理器发送的配置包后,首先从配置包中解析出相应的信息,利用该信息控制相应的状态寄存器,此状态寄存器的状态能够控制切换存储器和加速器的接口。具体来说,当多核系统的处理器发送一条控制指令时,该指令首先进入该逻辑控制电路,经过逻辑控制电路中指令译码器的译码,得到配置字,该配置字被写进状态寄存器中得以保持,直至下一个指令字到达、解码和重新写入。状态寄存器中的配置字被传到互连网络中,控制互连网络中各个多路选择器的状态。当路径配置成功后,处理器端发送有效的访存数据,包括地址和数据进入存储器,整个片外存储器具有比较大的容量,是一种阵列的方式的组织的,由不同的bank组成,整个存储器是放在片外的,对于多核处理器来说,它是共享的,每个处理器都可以访问存储器,这同时也使得和存储器互连的加速器同样可以被多个核所共享,这种实现方式在保证了一定的灵活性时,同时保证了资源的共享性。所述存储器的输出通过互连网络连接到加速器,存储器完成数据的读取后,根据前面的路径配置,数据可以直接返回处理器作为lw的结果,也可以经过另一条路径进入加速器完成特定功能的加速目的。在加速器中,可以选择面对特定应用的加速器,选择合理的粒度大小,包含数据缓存和逻辑计算等模块,根据配置字从存储器中接收数据,进行相应的计算后,返回输出结果。例如,加速器可选择多媒体中的dct、zigzag等,也可以选择一些常用的加速模块,例如复数乘法。此外,为了保证整个系统的性能,在有限的芯片面积上充分利用计算的并行性是至关重要的,因此,计算逻辑还可以引入SIMD计算单元。存储器的输出通过互连网络连接到加速器,但是访存速度并不会太明显的受到影响,数据进入加速器之前,会在输入口进入数据缓存级,这是由寄存器组成的,并不会增加访存的关键路径。加速器的设计面向特定应用,选择合理的粒度大小,包含数据缓存和逻辑计算等模块,根据配置字从存储器中接收数据,进行相应的计算后,返回输出结果。任务被划分在不同的加速器上是通过一个可编程的可配置的互连网络实现,整个互连网络是由一系列的多路选择器级联组成的,而多路选择器的开关由状态寄存器中的配置字决定,从而引导数据的流向。这些互连网络在存储器和加速器之间共享,从而实现加速器能够对任何从存储器输出的数据进行加速,由于加速器是面向特定应用的固定模式,并不会出现数据在加速器之间的传递(这种情况下会要求更复杂的控制模式),因此避免了复杂的片上网络的设计,对于对性能有极大影响的存储器来说,简化设计是有必要的。对于比较复杂的加速器来说,可以单独放在一块独立的芯片上,这也是2.5D的一个优势,减少单芯片的设计复杂度。本专利技术中,根据处理器的配置指令,整个片外逻辑既可以作为单独的存储器使用,也可以将存储器中的数据加速之后再返回,而根据配置字又可以选择不同加速器来使用,避免了多次跨芯片级的通信,提高了性能。本专利技术提出了一种面向特定应用的加速器和存储器融合的方案,将计算单元和存储单元集成在一块芯片上,使得具有明显加速比的加速单元直接在存储器内执行,避免了存储器和处理器、加速器之间由于数据通信造成的性能和功耗损失。为了充分利用这种结构的优势,加速器和存储器并不只是简单的分别实现在同一块芯片上,而是要高度的集成在一起,最大限度的开发计算的并行性和资源的共享性,这体现在内部逻辑的互连网络实现方式上。总之,本专利技术为2.5D的多核系统中硬件资源的高利用率和共享性、低功耗、实时运行和计算的并行性提供了实现的可能。附图说明图1是融合存储器的片外加速器的结构图。图2是逻辑控制电路结构图。图3是面向多媒体的一种加速单元(dct|dht)结构图。图4是一种实现调用多种加速器的复数乘法结构图。图5是可编程的互连网络的结构图。图6一维反变换算法图示。具体实施方式以下结合附图对本专利技术的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本专利技术,并不限于本专利技术。根据专利技术中的方案,如图1-图5所示,提供了一种适用于2.5D多核系统的融合存储器的片外加速器设计架构,考虑到芯片间互连的延时,如果加速器的粒度太小,则会在芯片间的通信上浪费掉大量的时间,所以单独的片外加速器要有合适的粒度,大粒度的加速器可以放在一块芯片上,小粒度的加速器则可以和存储器合并在一起,本方案提出的目的即基于此,都是一些加速效果明显,但粒度又不是很大的模块。本方案提供的加速器既有部分是面向的针对多媒体的关键模块的硬件实现,例如dct、zigzag扫描等,又有部分是面向的各种应用中的通用加速模块,例如加法器、乘法器,二者又可以通过资源复用组成针对复数乘法等一些复杂的计算功能,还有其它的一些4点的fft单元和cordic运算单元。下面结合结构图进一步说明本设计的具体实施方式:如图1所示,本专利技术提出的融合加速器和存储器的结构,通过高度集成的方式实现在一块芯片上。通过互连方式将存储器和加速器以一定的耦合方式连接在一起,处理器发送数据、地址和配置包经过芯片间的互连通道到达控制逻辑,控制逻辑根据指令中的信息解码出配置字,配置字会立即被写入状态寄存器中进行保存,在整个计本文档来自技高网...
一种适用于2.5D多核系统的融合存储器的片外加速器

【技术保护点】
一种适用于2.5D多核系统的融合存储器的片外加速器,其特征在于具体包括:逻辑控制电路、存储器、加速器、可配置互连网络;逻辑控制电路包括指令译码器、状态寄存器;所述逻辑控制电路是整个片外芯片的控制中心,当多核系统的处理器发送一条控制指令时,该指令首先进入逻辑控制电路,经过逻辑控制电路中指令译码器的译码,得到配置字,该配置字被写进状态寄存器中得以保持,直至下一个指令字到达、解码和重新写入;状态寄存器中的配置字被传到互连网络中,控制互连网络中各个多路选择器的状态;所述存储器以阵列方式组织,由不同的bank组成,整个存储器放在片外;当路径配置成功后,处理器端发送有效的访存数据,进入存储器;对于多核处理器来说,存储器是共享的,每个处理器都可以访问存储器,同时,和存储器互连的加速器同样可以被多个核所共享; 存储器的输出通过互连网络连接到所述加速器,当存储器完成数据的读取后,根据前面的路径配置,数据直接返回处理器作为lw的结果,或者经过另一条路径进入加速器完成特定功能的加速;任务被划分在不同的加速器上通过可编程、可配置的互连网路实现,整个互连网络由一系列的多路选择器级联组成,而多路选择器的开关由状态寄存器中的配置字决定,从而引导数据的流向;这些互连网络在存储器和加速器之间共享,实现加速器能够对任何从存储器输出的数据进行加速。...

【技术特征摘要】
1.一种适用于2.5D多核系统的融合存储器的片外加速器,其特征在于具体包括:逻辑控制电路、存储器、加速器、可配置互连网络;逻辑控制电路包括指令译码器、状态寄存器;所述逻辑控制电路是整个片外芯片的控制中心,当多核系统的处理器发送一条控制指令时,该指令首先进入逻辑控制电路,经过逻辑控制电路中指令译码器的译码,得到配置字,该配置字被写进状态寄存器中得以保持,直至下一个指令字到达、解码和重新写入;状态寄存器中的配置字被传到互连网络中,控制互连网络中各个多路选择器的状态;所述存储器以阵列方式组织,由不同的bank组成,整个存储器放在片外;当路径配置成功后,处理器端发送有效的访存数据,进入存储器;对于多核处理器来说,存储器是共享的,每个处理器都可以访问存储器,同时,和存储器互连的加速器...

【专利技术属性】
技术研发人员:虞志益朱世凯林杰周炜周力君
申请(专利权)人:复旦大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1