当前位置: 首页 > 专利查询>东南大学专利>正文

一种面向大规模粗粒度可重构系统存储系统的实现方法技术方案

技术编号:8161490 阅读:250 留言:0更新日期:2013-01-07 19:30
本发明专利技术公开了一种面向大规模粗粒度可重构系统存储系统的实现方法,其中粗粒度可重构系统包括一个以上RPU、与RPU相应的块缓存和外部存储器,块缓存内设有带控制逻辑的存储器,用于从外部存储器中预取MB;当RPU需访问的MB位于块缓存内时,可直接从块缓存中读取MB。本发明专利技术通过在粗粒度可重构系统中增加了一个块缓存,使得在H.264/MPEG2等多媒体算法中的帧数据在传输时可以按块传输到RPU中,极大的提高了数据传输效率;通过将MB及其周围数据预取到二级块缓存进行缓存,避免了直接从SDRAM/DDR中读取帧数据,提高了整个可重构系统的效率,增加了可重构系统的收益率。

【技术实现步骤摘要】

本专利技术涉及嵌入式可重构设计领域,尤其涉及,对面向媒体处理类粗粒度可重构系统的数据通路进行优化,通过块缓存的方式减少访问片外存储器的次数,使得可重构系统对数据的访问更为高效、性能更闻。
技术介绍
可重构计算的概念产生自上世纪60年代,加州大学洛杉矶分校G. Estrin教授在其里程碑式的文章中首先谈到这一概念,即计算机可以通过一个主处理器加上一组可重构硬件来组成。主处理器负责控制可重构硬件的行为,可重构硬件可以剪裁、重组,执行某一特定的任务。在可重构硬件上执行的任务结束以后,这部分硬件又被重新配置,从而可以执行其它任务。由于这个先进的概念远远超前于当时的技术水平,直到上世纪90年代之后,这一研究领域才重新获得人们的重视,各种不同的可重构计算技术层出不穷。人们从不同的研究和应用角度出发,对可重构计算体系结构的理解也不尽相同。比较公认的定义是由加州大学伯克利分校的可重构技术研究中心于1999年提出的一种广义的定义,将可重构计算体系结构视为一类计算机组织结构,具有区别于其它组织结构的两类突出特点1、制造后芯片的可重构能力(区别于ASIC (Application Specific Integrated Circuit的简称,专用集成电路);2、能实现很大程度的算法到计算引擎的空间映射(区别于GPP (GeneralPurpose Processor的简称,通用处理器)。凡具备以上两个特点的计算方式都属于可重构计算的范畴。可重构媒体处理软硬件架构正是符合上了上面的特点。除此以外,可重构媒体处理软硬件架构的特征还包括1、算法的控制流与数据流分离数据流由可重构计算引擎处理,处理器执行控制流并负责可重构计算引擎的重构;2、可重构计算引擎多采用PE(Process Element的简称,处理单元)阵列的结构实现。这种结构具有动态配置的特性,并且能实现算法指令、数据多个层次上的并行度。可重构系统通过其中所包含的若干计算单元,并行地执行应用软件中的多个运算,获得了可以比拟专用集成电路的执行性能。但是随着处理器速度与存储器访问速度的差距不断增大,面向应用的SoC (System on Chip的简称,系统级芯片)芯片中存储子系统的访问延迟已经成为可重构系统性能、功耗和成本的瓶颈,很大程度上限制了整体性能的提升。如何优化可重构系统存储子系统,成为可重构系统研究的关键。存储子系统主要包括片上和片外两个部分,片上存储器通常由高速SRAM (StaticRAM的简称,静态随机存取存储器)构成。基于成本方面的考虑,嵌入式系统中通常以DRAM(Dynamic RAM的简称,动态随机存取存储器)芯片作为片外存储器,这其中又以SDRAM(Synchronous DRAM的简称,同步动态随机存储器)/DDR (Double Data Rate的简称,双倍速率同步动态随机存储器)芯片使用最为广泛。传统的片外存储器SDRAM/DDR的物理组织结构上来看,它具有两个方面特点1、它由Bank、Page (页)和Column (列)这三个基本单元构成,其中Page (页)又称Row (行);2、它支持以Burst方式(粹发方式)进行连续读写。在EMI (External Memory Interface的简称,外部存储接口)设计中,可以充分利用这两个特性来提高SDRAM/DDR芯片的性能。本质上,芯片并不能称为随机访问设备,因为它的三维组织结构使得内部不同存储单元的访问时间也不同。这主要是由Bank预充电(Precharge)和激活(Activation)延迟造成的。对数据读取要在敏感放大器中进行,将要读取的Page (页)内容存放在敏感放大器的过程称为激活(Active)。每个Bank只有一个敏感放大器,也就是只能有一页数据处于被激活状态。对其他页数据读取时,需要进页预充电(Precharge),将敏感放大器的内容写回到SDRAM/DDR中,再激活需要读取的页数据。因此,SDRAM/DDR芯片进页访问时,EMI必须根据当前操作地址对应Bank的状态来发出不同的命令如果该Bank中没有页处于激活状态,则首先激活当前操作地址对应的页;然后对当前操作地址对应的列进页读写操作;如果该Bank中有页处于激活状态(每个Bank只可能有一个页激活),则如果已经激活的页就是当前操作地址对应的页,则对当前操作地址对应的列进页读写操作;如果已经激活的页不是当前操作地址对应的页,则对该Bank进页预充电,将已经激活的页关闭;接下来激活当前操作地址对应的页;最后对当前操作地址对应的列进页读写操作。由此可见,SDRAM/DDR的这种页组织特性使得访问不同页的存储单元时,由于需要进页预充电(Precharge)和激活(Ac t i vat i on )的换页操作,造成了存储单元访问时间不同,换页过程带来的延时可能是读取时间的几倍至几十倍,其延时会导致性能的降低。而对于有海量运算能力的可重构系统,其需要有与其相对应的数据存储能力,其中一个很重要的存储单元是RPU(ReconfigurableProcessing Unit的简称,可重构处理单元)内部的存储单元,当RPU在执行计算时,可以同时将下一次要计算的内容预取到内部存储单元。然而,SDRAM/DDR的行组织特性不利于面向媒体算法的MB (Macro Block的简称,宏块)预取。一般而言,媒体算法,如H. 264 (由ITU-T视频编码专家组(VCEG)和IS0/IEC动态图像专家组(MPEG)联合组成的联合视频组(JVT,Joint Video Team)提出的高度压缩数字视频编解码器标准)、MPEG4 (MPEG-4是为在国际互联网络上或移动通信设备(例如移动电话)上实时传输音/视频讯号而制定的最新MPEG标准)等,其图像是按帧(Frame)存放,每一帧图像按照光栅扫描方式存放在SDRAM/DDR中。由于媒体算法按MB处理,而MB中上下两行数据在地址空间中不连续,因此读取MB时可能会弓I起多次换行。例如,假设DDR每行存储1024Byte数据,媒体像素数据大小为IByte,则对于分辨率为IOSOp即包含1920*1080像素的帧数据,由于帧内每行数据都分布在不同的DDR行中,因此当读取帧内MB时需要多次换行。可见,SDRAM/DDR的行组织结构使得从SDRAM/DDR到内部存储单元的块访问效率不高,由此造成的数据访问延迟极大的限制了可重构系统的性能。多媒体应用的粗粒度可重构系统块数据预取是在RPU进行运算时已经将需要的数据预取出来,当进行下次数据运算时,数据则已经准备好,由此隐藏了数据传输时间,且MB数据在块缓存中按照块存储,RPU取数据也按照块进行,因此减少了 SDRAM/DDR中的换页时间,极大的提高了系统性能,使得可重构系统速度更快。
技术实现思路
专利技术目的为了克服现有技术中存在的不足,本专利技术提供,快速高效地完成粗粒度可重构系统中对外部存储器中数据的读取,通过提高粗粒度可重构系统的访问效率,从而提升粗粒度可重构系统的整体性倉泛。技术方案为实现上述目的,本专利技术采用的技术方案为,针对的是具有一个以上RPU的粗粒度可重构系统,RPU作为主要的计算系统,具有海量的计算能力,因而需要该粗粒度可重构系统具有与RPU计本文档来自技高网
...

【技术保护点】
一种面向大规模粗粒度可重构系统存储系统的实现方法,其特征在于:所述粗粒度可重构系统包括一个以上RPU、与RPU相应的块缓存和外部存储器,所述块缓存内设有带控制逻辑的存储器,用于从外部存储器中预取MB,该实现方法包括如下步骤:(1)当RPU需要访问外部存储器中目标MB时,首先判断目标MB是否完全位于块缓存的存储器中;(2)若步骤(1)中的判断结果为是,则RPU直接从块缓存中读取目标MB;(3)若步骤(1)中的判断结果为否,则块缓存从外部存储器中预取包括目标MB及其周围数据的预取数据,返回步骤(2);其中,RPU表示可重构处理单元,MB表示宏块。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:曹鹏梅晨蒋辉雁齐志杨军
申请(专利权)人:东南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1