GPDSP中多层次协同与共享的存储装置和访存方法制造方法及图纸

技术编号:11603530 阅读:161 留言:0更新日期:2015-06-15 17:14
本发明专利技术公开一种面向GPDSP的多层次协同与共享存储装置和访存方法,该装置包括多个DSP核以及用于缓存片外存储数据的全局共享缓存单元,各DSP核分别通过片上网络连接全局共享缓存单元;每个DSP核均包括并行的标量存储单元、向量阵列存储单元,各DSP核通过各自的标量存储单元、向量阵列存储单元进行核内数据访存,以及通过全局共享缓存单元共享数据;该方法通过对标量存储单元、向量阵列存储单元统一编址,根据访问数据类型配置标量存储单元执行访存。本发明专利技术能够实现GPDSP中单核内数据高效访存、以及核间数据的高效共享,具有访问效率高、硬件开销小且配置灵活的优点。

【技术实现步骤摘要】

本专利技术涉及通用计算数字信号处理器(General-Purpose Digital Signal Processor,GPDSP)
,尤其涉及一种GPDSP中多层次协同与共享的存储装置和访存方法
技术介绍
随着集成电路工艺发展越来越接近晶体管的物理极限,单纯依靠提高主频来提升微处理器性能的方法将面临着无法逾越的功耗墙问题,因而微处理器转而向单片集成多核的方向发展。GPDSP作为一种高性能多核通用数字信号处理器,能高效地实现各类嵌入式应用和通用科学计算应用领域中大量数字信号处理,特别是对高数据密集性、并行性、局部性特点的一类应用,其具有很高的峰值计算性能。GPDSP片上集成了大量的具有较高峰值运算能力的DSP内核,由于需要很高的数据访存带宽才能发挥峰值运算效能,因而也面临着存储墙问题。目前的多核微处理器存储系统中,通常是采用多级缓存结构来缓解对片外访存带宽的压力,例如采用每个DSP内核拥有私有的一级指令和数据缓存Cache、共享的或私有的二级或三级缓存Cache的结构,捕获更多的时空局部性,以尽量减小存储器的平均访问延迟。在多核结构中,随着晶体管尺寸的缩小和芯片面积的增大,片上缓存容量越来越大,使得存储缓存布局从单核的集中式向分布式转化,但这种分布式缓存共享存储架构具有以下特点:1)由于同一微处理器核到不同存储体的距离存在的巨大差异,导致产生不同的数据访问延迟;2)多个微处理器核对同一地址空间的访问可能具有不同的延迟;3)多核微处理器中,各内核通过片上网络互连,访存延迟除了访问距离长短,还取决于片上互连网络的带宽速度,因而访存延迟长,且存在不确定性;4)共享存储器成为数据访问瓶颈,需要复杂的硬件结构维护多核多层次缓存的数据一致性,影响了多核共享存储的可伸缩性。综上所述,目前的分布式共享存储器不利于GPDSP实时高效地完成数字信号处理,难以发挥其峰值运算性能。
技术实现思路
本专利技术要解决的技术问题就在于:针对现有技术存在的技术问题,本专利技术提供一种结构简单紧凑、能够实现GPDSP中单核内数据高效访存以及核间数据高效共享,且硬件开销小的GPDSP中多层次协同与共享的存储装置和访存方法。为解决上述技术问题,本专利技术提出的技术方案为:一种面向GPDSP的多层次协同与共享存储装置,包括多个DSP核以及用于缓存片外存储数据的全局共享缓存单元,各DSP核分别通过片上网络连接所述全局共享缓存单元;每个所述DSP核均包括并行的标量存储单元、向量阵列存储单元,各所述DSP核通过各自的标量存储单元、向量阵列存储单元进行核内数据访存,以及各所述DSP核通过所述全局共享缓存单元共享数据。作为本专利技术装置的进一步改进:还包括用于将各DSP核间数据进行同步的硬件同步单元,所述硬件同步单元与所述片上网络连接。作为本专利技术装置的进一步改进:所述硬件同步单元包括多个相同结构的同步子体,每个同步子体包括依次连接的第二输入缓冲模块、仲裁调度模块、同步锁实例槽模块以及返回数据选择与缓存模块;所述第二输入缓冲模块用于缓存同步请求,并发送至仲裁调度模块进行仲裁,所述仲裁调度模块将同步请求中用于保持访存数据不被修改的同步锁请求发送至同步锁实例槽模块进行处理、将同步请求中用于保持访存顺序的同步栅栏请求发送至同步栅栏实例槽模块进行处理,返回数据选择与缓存模块接收所述同步锁实例槽模块、同步栅栏实例槽模块的输出请求,选择最终输出请求并缓冲未选择的请求。作为本专利技术装置的进一步改进:所述全局共享缓存单元包括多个相同结构的Cache子体控制器,每个Cache子体控制器包括请求输入缓冲模块、第一访存流水线、第二访存流水线、输出缓冲模块、数据返回缓存模块以及返回数据选择模块;所述第一输入缓冲模块接收多个访问请求,并根据访问请求类型发送至第一访存流水线、第二访存流水线进行处理或直接发送至输出缓冲模块,所述数据返回缓存模块接收返回的数据并按照数据类型将接收到的所述返回数据输出至对应的缓冲,通过返回数据选择模块选择最终的返回数据。作为本专利技术装置的进一步改进:所述向量阵列存储单元为全局编址的向量阵列存储器;所述标量存储单元配置为私有一级Cache或全局编址的标量存储器;当所述标量存储单元配置为私有一级Cache时,所述标量存储单元通过所述全局共享缓存单元访问片外存储数据;当所述标量存储单元配置为全局编址的标量存储器时,所述标量存储单元通过片上网络执行与其余地址标量存储单元之间标量访存操作、DMA读请求以及DMA写请求的并行访问 。    作为本专利技术装置的进一步改进:所述标量存储单元包括依次连接的标量译码与地址计算模块、标量访存控制器、标量存储体;所述标量译码与地址计算模块用于对标量访存指令进行译码,并根据译码得到的寻址方式计算得到访存地址;所述标量访存控制器用于根据访存地址发送访存请求;所述标量存储体用于根据访存请求设置为一级数据存储体或SRAM。作为本专利技术装置的进一步改进:所述向量阵列存储单元包括依次连接的向量译码与地址计算模块、向量访存控制单元以及存储阵列,所述向量译码与地址计算模块对向量访存指令进行译码,并根据译码得到的寻址方式计算得到访存地址,通过向量访存控制单元根据访存地址控制两个向量读写请求、DMA读请求、DMA写请求并行访问存储阵列。一种利用上述多层次协同与共享存储装置的访存方法,步骤包括:1)将各DSP核的所述向量阵列存储单元进行全局编址,若访存数据为多核共享数据,配置各DSP核的所述标量存储单元为全局编址的标量存储器,转入执行步骤3);若访存数据为单核私有数据,配置各DSP核的所述标量存储单元为私有一级Cache,转入执行步骤2);2)各DSP核的所述向量阵列存储单元通过片上网络进行数据交换,各DSP核的所述标量存储单元通过全局共享缓存单元对片外存储器数据进行访问;3)各DSP核的所述标量存储单元通过片上网络与其他DSP核的标量存储单元进行数据交换。作为本专利技术方法的进一步改进,所述步骤2)中还包括使私有一级Cache与全局共享缓存单元数据一致性的配置步骤,具体实施方法为:采用将私有一级Cache与全局共享缓存单元均配置为写回的第一配置方式、或采用将私有一级Cache配置为写旁路的第二配置方式、或采用将全局共享缓存单元配置为写旁路的第三配置方式、或采用将私有一级Cache与全局共享缓存单元均配置为写旁路的第四配置方式;所述第一配置方式为根据访存的先后顺序,将待访问数据块依次在私有一级Cache、全局共享缓存单元中缺失,并在调入待访问数据块后依次缓存进全局共享缓存单元、私有一级Cache;所述第二配置方式为将待访问数据块直接写入全局共享缓存单元中;所述第三配置方式为将待访问数据块仅在私有一级Cache中缓存;所述第四配置方式为将待访问数据块直接写入片外存储器。作为本专利技术方法的进一步改进,所述步骤3)还包括多核共享数据同步步骤,具体实施方法为:当目标DSP核的标量存储单元通过片上网络访问共享存储空间时,先访问硬件同步单元,通过硬件同步单元对所操作的目本文档来自技高网
...
GPDSP中多层次协同与共享的存储装置和访存方法

【技术保护点】
一种面向GPDSP的多层次协同与共享存储装置,其特征在于:包括多个DSP核(1)以及用于缓存片外存储数据的全局共享缓存单元(2),各DSP核(1)分别通过片上网络(4)连接所述全局共享缓存单元(2);每个所述DSP核(1)均包括并行的标量存储单元(11)、向量阵列存储单元(12),各所述DSP核(1)通过各自的标量存储单元(11)、向量阵列存储单元(12)进行核内数据访存,以及各所述DSP核(1)通过所述全局共享缓存单元(2)共享数据。

【技术特征摘要】
1.一种面向GPDSP的多层次协同与共享存储装置,其特征在于:包括多个DSP核(1)以及用于缓存片外存储数据的全局共享缓存单元(2),各DSP核(1)分别通过片上网络(4)连接所述全局共享缓存单元(2);每个所述DSP核(1)均包括并行的标量存储单元(11)、向量阵列存储单元(12),各所述DSP核(1)通过各自的标量存储单元(11)、向量阵列存储单元(12)进行核内数据访存,以及各所述DSP核(1)通过所述全局共享缓存单元(2)共享数据。
2.根据权利要求1所述的面向GPDSP的多层次协同与共享存储装置,其特征在于,还包括用于将各DSP核(1)间数据进行同步的硬件同步单元(3),所述硬件同步单元(3)与所述片上网络(4)连接。
3.根据权利要求2所述的面向GPDSP的多层次协同与共享存储装置,其特征在于:所述硬件同步单元(3)包括多个相同结构的同步子体,每个同步子体包括依次连接的第二输入缓冲模块(31)、仲裁调度模块(32)、同步锁实例槽模块(33)以及返回数据选择与缓存模块(35);所述第二输入缓冲模块(31)用于缓存同步请求,并发送至仲裁调度模块(32)进行仲裁,所述仲裁调度模块(32)将同步请求中用于保持访存数据不被修改的同步锁请求发送至同步锁实例槽模块(33)进行处理、将同步请求中用于保持访存顺序的同步栅栏请求发送至同步栅栏实例槽模块(34)进行处理,返回数据选择与缓存模块(35)接收所述同步锁实例槽模块(33)、同步栅栏实例槽模块(34)的输出请求,选择最终输出请求并缓冲未选择的请求。
4.根据权利要求3所述的面向GPDSP的多层次协同与共享存储装置,其特征在于:所述全局共享缓存单元(2)包括多个相同结构的Cache子体控制器,每个Cache子体控制器包括请求第一输入缓冲模块(21)、第一访存流水线(22)、第二访存流水线(23)、输出缓冲模块(24)、数据返回缓存模块(25)以及返回数据选择模块(26);所述第一输入缓冲模块(21)接收多个访问请求,并根据访问请求类型发送至第一访存流水线(22)、第二访存流水线(23)进行处理或直接发送至输出缓冲模块(24),所述数据返回缓存模块(25)接收返回的数据并按照数据类型将接收到的所述返回数据输出至对应的缓冲,通过返回数据选择模块(26)选择最终的返回数据。
5.根据权利要求1~4中任意一项所述的面向GPDSP的多层次协同与共享存储装置,其特征在于:所述向量阵列存储单元(12)为全局编址的向量阵列存储器;所述标量存储单元(11)配置为私有一级Cache或全局编址的标量存储器;当所述标量存储单元(11)配置为私有一级Cache时,所述标量存储单元(11)通过所述全局共享缓存单元(2)访问片外存储数据;当所述标量存储单元(11)配置为全局编址的标量存储器时,所述标量存储单元(11)通过片上网络(4)执行与其余地址标量存储单元(11)之间标量访存操作、DMA读请求以及DMA写请求的并行访问。
6.根据权利要求5所述的面向GPDSP的多层次协同与共享存储装置,其特征在于,所述标量存储单元(11)包括依次连接...

【专利技术属性】
技术研发人员:陈书明陈海燕刘胜郭阳万江华陈俊杰陈胜刚刘仲王耀华杜鹏
申请(专利权)人:中国人民解放军国防科学技术大学
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1