一种基于掩码的图形处理器像素Cache缺失请求合并系统及方法技术方案

技术编号:35744640 阅读:24 留言:0更新日期:2022-11-26 18:48
本发明专利技术涉及一种基于掩码的图形处理器像素Cache缺失请求合并系统及方法。本发明专利技术的系统包括缺失请求的待合并信息的检测和排序模块、读掩码缺失合并处理模块、读TAG缺失合并处理模块和写缺失合并处理模块,缺失请求的待合并信息的检测和排序模块分别与读掩码缺失合并处理模块、读TAG缺失合并处理模块、写缺失合并处理模块连接,缺失请求的待合并信息的检测和排序模块用于缺失请求的待合并信息的检测和排序,读掩码缺失合并处理模块用于读掩码缺失的合并处理,读TAG缺失合并处理模块用于读TAG缺失的合并处理,写缺失合并处理模块用于写缺失的合并处理。本发明专利技术能够减少缺失替换率,减少DDR带宽,并且在流水的情况下最快可达到一个时钟周期一个请求,很好的提高GPU绘制性能。性能。性能。

【技术实现步骤摘要】
一种基于掩码的图形处理器像素Cache缺失请求合并系统及方法


[0001]本专利技术涉及计算机硬件
,尤其是一种基于掩码的图形处理器像素Cache缺失请求合并系统及方法。

技术介绍

[0002]图形处理器(Graphic Processing Unit,GPU)中包含多个颜色缓冲区,这些颜色缓冲区的数据由于数据量的大小,不可能采用片上SRAM进行存储,因此将颜色缓冲区存储于片外的DDR存储器中,并通过内部的像素Cache进行缓冲。
[0003]像素Cache是GPU中一个重要单元,一般的Cache已经无法满足GPU带宽的需求,因而针对Cache写回操作进行了一定修改,提出了带掩码的像素Cache,并在缺失时对缺失请求进行合并处理,则会大大减少与DDR的交互,从而提高GPU的绘制性能。

技术实现思路

[0004]为解决
技术介绍
中存在的技术问题,本专利技术提供一种基于掩码的图形处理器像素Cache缺失请求合并系统及方法,能够减少缺失替换率,减少DDR带宽,并且在流水的情况下最快可达到一个时钟周期一个请求,很好的提高GP本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于掩码的图形处理器像素Cache缺失请求合并系统,其特征在于:所述系统包括缺失请求的待合并信息的检测和排序模块、读掩码缺失合并处理模块、读TAG缺失合并处理模块和写缺失合并处理模块,所述缺失请求的待合并信息的检测和排序模块分别与读掩码缺失合并处理模块、读TAG缺失合并处理模块、写缺失合并处理模块连接,所述缺失请求的待合并信息的检测和排序模块用于缺失请求的待合并信息的检测和排序,所述读掩码缺失合并处理模块用于读掩码缺失的合并处理,所述读TAG缺失合并处理模块用于读TAG缺失的合并处理,所述写缺失合并处理模块用于写缺失的合并处理。2.根据权利要求1所述的基于掩码的图形处理器像素Cache缺失请求合并系统,其特征在于:所述缺失请求的待合并信息的检测和排序模块排序之前需要将PCache的流水线上排空,并且不再接收新的请求;排序功能是指在一个时钟周期内完成存储在MSHR中的相同Block的缺失请求按照地址映射关系的排序功能。3.根据权利要求1所述的基于掩码的图形处理器像素Cache缺失请求合并系统,其特征在于:所述读掩码缺失合并处理模块中,由于读掩码缺失是在TAG命中的基础上的掩码发生缺失的,因此待合并中的缺失请求不会存在写缺失或者读TAG缺失;合并处理需要流水完成数据从DDR中读取数据的缓存读取和从Cache中存储的对应数据的合并处理,合并处理时根据掩码将数据更新为最新的数据,并流水将数据写入到Cache的数据存储中。4.根据权利要求1所述的基于掩码的图形处理器像素Cache缺失请求合并系统,其特征在于:所述读TAG缺失合并处理模块中,MSHR中与当前处理的读TAG缺失相同Block的待合并的缺失请求分为两类,一类是读TAG缺失,一类是写缺失;为了减少更新处理占用的时间,将替换Block有脏位的写回、数据的更新、读缺失的合并以及写缺失的合并同步进行处理,在处理过程中,只需逐一将Cache数据存储中一个Block的数据先读出再写入,读比写早一个时钟周期即可。5.根据权利要求1所述的基于掩码的图形处理器像素Cache缺失请求合并系统,其特征在于:所述写缺失合并处理模块中,MSHR中与当前处理的写缺失相同Block的待合并的缺失请求分为两类,一类是读TAG缺失,一类是写缺失;果有待合并的读缺失,则需要特殊处理;因为像素Cache的写缺失并不进行替换操作,是直接带掩码将数据写入,因此当前写缺失Block的读缺失的数据有可能就不在Cache数据存储中,就会导致读不出数据或者读出的数据时不完整的;为了保证数据的正确性,在写缺失后有读缺失的情况下,将写合并的数据写入DDR中,再将MSHR中待合并的读缺失待合并标记清除,重新下发一次即可;同时在没有写后读的情况下,为了减少在替换Block有脏位的回写和写合并占用的时间,将一个Block的数据读出所需要的时钟周期最多减少为一半个时钟周期,一次读取相邻两个数据。6.一种实现权利要求1所述的基于掩码的图形处理器像素Cache缺失请求合并系统的方法,其特征在于:该方法包括以下步骤:1)缺失请求的待合并信息的检测和排序;2)读掩码缺失的合并处理;3)读TAG缺失的合并处理;4)写缺失的合并处理。7.根据权利要求6所述的基于掩码的图形处理器像素Cache缺失请求合并方法,其特征在于:所述步骤1)的具体方法如下:
1.1)排序之前需要将PCache的流水线上排空,并且不再接收新的请求,排序功能在一个时钟周期内完成;1.2)将32组MSHR中的缺失地址寄存器与当前更新处理的缺失地址进行相同Block的比较,产生一个32bits的掩码缺失标记寄存器、一个32bits的读TAG缺失标记寄存器和一个写缺失标记寄存器;1.3)根据标记寄存器的标记,从对应MSHR缺失地址中取...

【专利技术属性】
技术研发人员:王维田泽郑新建张淑杜琴琴
申请(专利权)人:西安翔腾微电子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1