支持向量条件访存的方法和装置制造方法及图纸

技术编号:7662585 阅读:230 留言:0更新日期:2012-08-09 07:09
一种支持向量条件访存的方法和装置,方法的步骤为:(1)在向量条件访问单元VCAU中设置两个可编程的寄存器:N位的VPE条件访问寄存器和N位的VB条件写回寄存器;(2)指令译码单元接收指令派发部件发出的向量访存指令进行指令译码,译出指令中的访存信息;(3)地址计算单元根据访存信息产生访问N个VB的访问请求vr及地址并送到VCAU;(4)VCAU对所有访存信息进行条件整理和数据对齐;(5)将各VB访存流水线的写回信息打入向量条件写回单元VCWBU进行整理。该装置由包括访存指令译码单元、地址计算单元、向量存储体VB、向量条件访问单元VCAU、向量条件写回单元VCWBU组成的向量存储器VM。本发明专利技术可提高访存操作灵活性,有效提高向量存储器的利用率和访存效率。

【技术实现步骤摘要】

本专利技术主要涉及到计算机体系结构的设计领域,特指一种面向无线通信等数据密集型应用的向量处理器中向量数据的访存控制方法和装置,能更好地支持按单指令流多数据流(Single Instruction Multiple Data, SIMD)方式操作的向量处理单兀(VectorProcessing Elements, VPEs)对向量存储器(Vector Memory, VM)的多种条件访问操作。
技术介绍
随着计算机技术和集成电路工艺的发展,微处理器的主频越来越高,中央处理单元(CPU)计算能力的增长远远超过了存储器性能的增加,CPU与存储器之间性能差异的“存储墙”问题已成为制约微处理器整体性能进一步提高的瓶颈。而在面向无线通信、图像处理等流媒体应用的向量处理器中,存储墙的问题尤为严重。无线通信、图形图像处理等流媒体应用具有典型的高数据密集性特点,其数据缺乏局部性和可重用性,同时数据处理又具有较强的实时性需求,使得片内向量存储器由于其访问延时的确定性在向量处理器中得到了广泛应用。向量处理器通常采用超长指令字(VLIW)结构,片内集成多个并行的向量处理单元(VPE),以SMD方式进行运算操作,以开发更多的指令级和数据级并行性。如何为向量处理器中的向量处理单元提供更为灵活和高效的向量数据访存方式成为向量存储系统设计中面临的重要问题。为了满足VPE的高带宽访存需求,向量存储器VM—般采用与VPE —一对应的多路向量存储体(Vector BANK, VB)低位地址交叉编址组织结构,支持多个VPE的并行访存请求。目前一般的向量访存方式存在以下问题(1)为了实现访存的方便快捷,只支持向量处理单元与向量存储器中的向量存储体一一对应的访存方式,即各个VPE只能一起访问其对应VB内的数据,不能按条件访问其他VB中的数据;(2) VPE不能对向量处理器进行标量数据访问,即不直接支持多个VPE对向量处理器中某一标量数据的读写访问操作,此类数据访问只能通过VPE之间的混洗、打包、解包等额外操作或在存储器中保存同一数据的多份拷贝来实现,这将增加代码密度或降低向量存储器存储空间的利用率,降低了访存装置的效率和灵活性;(3) —般的向量存储器实现字节或半字连续的访问往往需要用字节(8位)位宽的存储体来组织存储器,造成存储体过多,存储体的组织和编址复杂,从而访存状态机较为复杂。
技术实现思路
本专利技术要解决的技术问题就在于针对现有技术存在的技术问题,提供一种可支持VPE对向量存储器进行各种条件访问的访存方法和装置,采用压缩字节和半字粒度访问请求和数据的方法,大幅提高了向量存储器访存操作的灵活性,有效提高向量存储器的利 用率和访存效率,加速了相关算法。本专利技术采用以下技术方案 一种支持向量条件访存的方法,其步骤为(I)在向量条件访问单元VCAU中设置一个可编程的N位的VPE条件访问寄存器VCon_AcessBit 和N位的VB条件写回寄存器VCon_CopyBit ;对应N个VPE的访存条件执行位,为I时表示执行,为O表示不执行;其中,VCon_AcessBit控制对应VB是否执行访存操作,VCon_CopyBit 只在标量读访问时控制对应VB是否执行数据写回操作; (2 )指令译码单元接收指令派发部件发出的向量访存指令进行指令译码,译出指令中的访存信息;若为写指令还要向VPU的向量寄存器发出读使能,读出向量寄存器的数据,并将以上访存信息发给执行站; (3)执行站中地址计算单元根据所述访存信息产生访问N个VB的地址和初步的访问请求vr ; (4)VCAU将执行站接收到的向量条件访问寄存器VCoruAcessBit、流水线中的访问请求vr进行整理,若向量条件访问寄存器VCon_AceSsBit=0,则将其对应的VPEi请求vr置无效,如果向量条件访问寄存器VCon_AceSsBit=l,则VPEi对应的访问请求 vr有效;将访问数据进行整理,形成访问N个VB的N套访存请求和数据的访存信息,然后将加工后的访问请求Reqi、数据和步骤(3)中计算出的VB地址分别加入到步骤(2)得到的访存信息中,再访问VM; (5)将各VB访存流水线的写回信息打入向量条件写回单元VCWBU进行整理,若VB访存流水线传递过来的向量写回寄存器VCon_CopyBit =0,则只需将VCoruAcessBit =1时读出的数据写回VPU即可;若此时为标量访问且访存流水线中的VCon_CopyBit=l,则将VCon_AcessBit =1时读出的数据复制N份,然后将VCon_CopyBit =1对应的数据写回 VPU0本专利技术进一步提供一种支持向量条件访存的装置,它包括向量存储器VM,由N个向量存储体VBci VBim、访存指令译码单元、地址计算单元、向量条件访问单元VCAU和向量条件写回单元VCWBU组成,每个向量存储体VB拥有自己的访存流水控制器;所述访存指令译码单元用来接收指令派发部件发送的向量条件访存指令并译码出指令中的访存信息;所述地址计算单元负责产生访问VM的地址和初步的请求vr ;所述向量条件访问单元VCAU负责将流水线中的条件访问寄存器VCon_AcessBit 和访问请求vr 进行整理生成向量条件访问请求和字节使能,同时对数据进行整理,并传递给N个VB的访存流水线;所述向量条件写回单元VCWBU根据访存流水线中的访问请求、字节使能和写回访问寄存器生成写回使能信号,同时对写回数据进行整理,并根据向量处理部件VPU的忙闲状态选择是否写回对应的VPEi ;所述向量存储器VM通过向量条件访问单元VCAU和向量条件写回单元VCWBU实现N个向量处理单元VPE对向量存储器VM中向量数据的条件读写访问。与现有技术相比,本专利技术的优点在于 I.本专利技术中,VM用字位宽的存储体组织结构实现了连续字节、半字或字粒度的访存请求,支持按字(W位)对齐方式的多种数据粒度的向量数据访问。按字节和半字粒度访问时利用压缩数据、请求和增加字节使能的控制方法提高了存储空间的利用率,不需要用字节(8位)位宽的存储体来组织VM,避免了存储体过多导致的组织和编址复杂的问题,从而简化了向量存储体的组织结构及其访存请求仲裁状态机。2.本专利技术支持向量存储器条件访问,增强了向量数据访问的灵活性,通过合理调控N个VB相对应的访存请求,屏蔽掉不需访问的VB访存请求,从而降低了访存功耗。3.本专利技术为向量数据访问提供了标量数据的向量条件访问方式,节省了数据存储空间,提高了存储器空间的有效利用率和向量访存的灵活性,可大幅减少应用算法中常数加载次数和混洗次数,降低了功耗,減少了指令密度,提高了访存效率,加速了相关算法。 4.本专利技术向量条件访问对图像过滤、自动频率控制(AFC, Auto FrequencyControl)、多输入多输出(ΜΙΜΟ, Mult iple Input Multiple Output)均衡等数据密集型算法的向量化处理提供了较大的灵活性,提高了此类算法在向量处理器上的执行效率。使用者可通过编程配置向量条件访问寄存器和向量条件写回寄存器来控制向量条件访存,根据算法需要将向量条件为真的值原样输出,为假的值维持不变,从而得到过滤的数据。综上所述,本专利技术中的支持向量条件访存的方本文档来自技高网
...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:陈海燕陈书明刘衡竹黄远广刘宗林刘仲彭元喜万江华陈胜刚刘胜
申请(专利权)人:中国人民解放军国防科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1