流处理器中降低数据访问延迟的方法技术

技术编号：2846860 阅读：234 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种流处理器中降低数据访问延迟的方法，要解决的技术问题是降低流处理器的数据访问延迟。技术方案是改进流处理器的第一级存储层次，将标量ＤＲＡＭ和流ＤＲＡＭ合并为由标量处理器和流处理器共享的片外共享存储器，并采用新的方法来完成数据流在片外共享ＤＲＡＭ与流寄存器文件ＳＲＦ之间的传输，且采用同步机制解决ＲＡＷ相关。标量处理器和流处理器要访问片外数据时，都直接向总线发送请求，获得总线使用权后，将访存地址传送给ＤＲＡＭ控制器，ＤＲＡＭ控制器访问片外ＤＲＡＭ，获得ＤＲＡＭ中的数据后再将数据返回给标量处理器或流处理器。采用本发明专利技术可以有效避免由于流过长或数目太多导致的ＳＲＦ溢出，从而避免了一次访存请求导致的数据多次在存储空间的转移，降低了数据访问延迟。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及，尤其是面向密集计算的。
技术介绍
基于流体系结构的流处理器是新一代面向密集计算的高性能微处理器的典型代表，专门面向流应用。流，是不间断的、连续的、移动的数据队列，队列长度可以是定长或不定长的。流应用主要分为两类一类是媒体应用；另一类是科学计算。流应用具有以下几个主要特征计算密集性，与传统的桌面应用相比，流式应用对每次从内存取出的数据都要进行大量的算术运算；并行性，以数据级并行为主，同时存在指令级和任务级并行；局域性，是指应用中的数据重用局域性。流应用程序通常包含kernel级程序和流级程序两部分流级程序负责组织输入和输出数据，kernel程序是运算的核心，负责对这些数据进行运算。由于流应用有大量的数据并行性和局域性，因此数据访问延迟较大。为了降低数据访问延迟，现有的流体系结构采用三级存储层次，即处理器芯片外部的DRAM、处理器片上SRF(流寄存器文件，Stream Register File)和LRF(分布式本地寄存器文件，LocalDistribute Register File)。DRAM是第一级，提供2GB/s的带宽；SRF是第二级，具有25.6GB/s的带宽；运算单元内部的LRF是第三级，提供高达436GB/s的带宽。这种存储层次降低了计算密集型应用在流处理器上运行时的数据访问延迟临时性的数据被存放在运算器内部即第三级，保证它能被频繁的快速存取；同kernel计算相关的输入数据流和输出数据流以及中间数据，都被存放在处理器芯片上的SRF中即第二级，保证它能够在处理器内部循环利用而不产生存储器访问；因为初始输入、最终输出和其它的全局...

【技术保护点】
一种流处理器中降低数据访问延迟的方法，其特征在于：第一步，改进流处理器的第一级存储层次，将标量ＤＲＡＭ和流ＤＲＡＭ合并为由标量处理器和流处理器共享的片外共享存储器，具体方法是：片外共享存储器由多个片外共享ＤＲＡＭ组成，每个片外共享ＤＲＡＭ分别通过一个ＤＲＡＭ控制器与片上通用总线相连；片上通用总线分别与标量处理器和流处理器相连，使得标量处理器和流处理器可以通过任一ＤＲＡＭ控制器访问对应的片外ＤＲＡＭ；标量处理器和流处理器都作为总线主设备，ＤＲＡＭ控制器作为总线从设备；处理器接口部件作为从设备挂在片上通用总线上，它只传输标量处理器和流处理器之间的数据，不再传输片外存储器到标量处理器或流处理器的数据；标量处理器和流处理器要访问片外数据时，都直接向总线发送请求，获得总线使用权后，将访存地址通过总线传送给ＤＲＡＭ控制器，ＤＲＡＭ控制器访问片外ＤＲＡＭ，获得ＤＲＡＭ中的数据后再将数据通过片上通用总线返回给标量处理器或流处理器；第二步，采用新的方法来完成数据流在片外共享ＤＲＡＭ与流寄存器文件ＳＲＦ之间的传输，具体过程是：１．１将数据流从片外共享ＤＲＡＭ...

【技术特征摘要】
1.一种流处理器中降低数据访问延迟的方法，其特征在于第一步，改进流处理器的第一级存储层次，将标量DRAM和流DRAM合并为由标量处理器和流处理器共享的片外共享存储器，具体方法是片外共享存储器由多个片外共享DRAM组成，每个片外共享DRAM分别通过一个DRAM控制器与片上通用总线相连；片上通用总线分别与标量处理器和流处理器相连，使得标量处理器和流处理器可以通过任一DRAM控制器访问对应的片外DRAM；标量处理器和流处理器都作为总线主设备，DRAM控制器作为总线从设备；处理器接口部件作为从设备挂在片上通用总线上，它只传输标量处理器和流处理器之间的数据，不再传输片外存储器到标量处理器或流处理器的数据；标量处理器和流处理器要访问片外数据时，都直接向总线发送请求，获得总线使用权后，将访存地址通过总线传送给DRAM控制器，DRAM控制器访问片外DRAM，获得DRAM中的数据后再将数据通过片上通用总线返回给标量处理器或流处理器；第二步，采用新的方法来完成数据流在片外共享DRAM与流寄存器文件SRF之间的传输，具体过程是1.1将数据流从片外共享DRAM加载到SRF存在正常加载，溢出，长流加载，索引四种情况1.1.1正常加载数据通过片上通用总线从片外共享DRAM加载到SRF；1.1.2溢出指目前从片外共享DRAM中加载的数据流A在SRF中所在的空间将被后面加载的数据流B替换掉，并且目前的数据流A在被替换掉后还会再次被kernel使用，由于数据流A存储在片外共享DRAM中，因此无论首次还是再次使用数据流A，都只需要将数据加载至SRF；1.1.3长流加载需要加载的流长超过SRF的剩余容量时，采用双缓冲方法...

【专利技术属性】
技术研发人员：文梅，伍楠，张春元，任巨，何义，荀长庆，杨乾明，管茂林，
申请(专利权)人：中国人民解放军国防科学技术大学，
类型：发明
国别省市：43[中国|湖南]

全部详细技术资料下载我是这个专利的主人