一种统一染色图形处理器共享寄存器文件分组映射的冲突检测与排队方法技术

技术编号:35744697 阅读:32 留言:0更新日期:2022-11-26 18:48
本发明专利技术涉及一种统一染色图形处理器共享寄存器文件分组映射的冲突检测与排队方法。本发明专利技术的方法包括以下步骤:1)物理存储单元被划分为8个Bank,每个Warp会分配16个读操作数地址和8个写操作数地址用于操作数收集,这16个读操作数地址与8个写操作数地址会经过译码后被映射到8个Bank;2)采用建立流水线的分级分组地址映射方法,通过将每组的16个读操作数地址和8个写操作数地址分组并建立流水线进行映射。本发明专利技术主要针对寄存器文件的访问过程,提供了一种冲突检测与排队机制,用于解决实际传输中可能出现的Bank冲突问题。输中可能出现的Bank冲突问题。输中可能出现的Bank冲突问题。

【技术实现步骤摘要】
一种统一染色图形处理器共享寄存器文件分组映射的冲突检测与排队方法


[0001]本专利技术属于统一染色图形处理器
,具体涉及一种共享寄存器文件分组映射的冲突检测与排队机制。

技术介绍

[0002]随着近些年来数据挖掘、机器学习、高清视频图像处理和大数据等研究及应用方向的逐渐火热,计算机中传统的CPU性能的提升已无法满足这些应用对计算机计算需求的增长。在这种环境下,各种各样的计算加速器被提出来,包括图形处理器(Graphics Processing Units,GPU)和现场可编程门阵列(Field Programmable Gate Array,FPGA)等。毋庸置疑,其中应用最为广泛的就是GPU,对于某些特定应用,相比于CPU而言,使用GPU可以达到数百倍的加速效果。随着计算需求的增长和GPU线程级并行性的增加,GPU也开始被用在通用计算领域,进而演化出了通用图形处理器General Purpose Computing on Graphics Processing Units,GPGPU。现在的图形处理器已经不仅仅指的是专用的图形加速芯片本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种统一染色图形处理器共享寄存器文件分组映射的冲突检测与排队方法,其特征在于:该方法包括以下步骤:1)物理存储单元被划分为8个Bank,每个Warp会分配16个读操作数地址和8个写操作数地址用于操作数收集,这16个读操作数地址与8个写操作数地址会经过译码后被映射到8个Bank;2)采用建立流水线的分级分组地址映射方法,通过将每组的16个读操作数地址和8个写操作数地址分组并建立流水线进行映射。2.根据权利要求1所述的统一染色图形处理器共享寄存器文件分组映射的冲突检测与排队方法,其特征在于:所述步骤1)中每个Bank有2个读地址接口和1个写地址接口,最多可同时接受2个读操作数地址和1个写操作数地址。3.根据权利要求1所述的统一染色图形处理器共享寄存器文件分组映射的冲突检测与排队方法,其特征在于:所述步骤2)的具体步骤如下:2.1)对16个读操作数地址、8个写操作数地址进行了分组,每4个地址为一个Group,并规定读写映射操作中每一级寄存器组的优先级;2.2)根据优先级关系分析映射模式并列出了真值表,进一步根据真值表推导出其逻辑表达式并画出每一级的映射组合逻辑图;2.3)基于流水线的性能,分析了写操作映射过程中,读写有效信号的生成方式,并通过其真值表推导出组合逻辑公式,进一步得到其组合逻辑图;2.4)将读操作和写操作分开进行,其中读操作需要经过三级分组映射,写操作只需要两级分组映射。4.根据权利要求1所述的统一染色图形处理器共享寄存器文件分组映射的冲突检测与排队方法,其特征在于:所述步骤2)中读操作时,流程如下:3.1)先将16个读操作数地址分为4个group,其中addr_0、addr_1、addr_8、addr_9为group_0;addr_2、addr_3、addr_10、addr_11为group_1;addr_4、addr_5、addr_12、addr_13为group_2;addr_6、addr_7、addr_14、addr_15为group_3;3.2)每个地址都会经过一个译码单元,译码得到该地址对应的Bank并产生一个有效信号,这些有效信号经过一个映射模块Allocate_Logic_0后被送往第0级读有效信息寄存器组Reg_rd_level_0中,Reg_rd_level_0中存放的数据再经过另一个映射模块Allocate_Logic_1后被送往第1级读有效信息寄存器组Reg_rd_level_1中,Reg_rd_level_1中存放的数据经过最后一个映射模块Allocate_Logic_2后被送往Bank中执行读操作,同时送往第2级读有效信息寄存器组Reg_rd_level_2中暂存,用于读操作数重排序;同时需要判断Reg_rd_level_1中剩余地址信息数量,用于决定流水线暂停或发送新的rdena信号,最终,Reg_rd_level_2中的地址被送往Bank进行相应操作。5.根据权利要求4所述的统一染色图形处理器共享寄存器文件分组映射的冲突检测与排队方法,其特征在于:所述步骤3.2)的具体步骤如下:3.2.1)对16个读操作数地址中3bit位宽的Bank判断位进行译码,得到该地址对应的Bank号并产生一个有效信号valid_i_bj,其中i表示地址号,j表示Bank号;3.2.2)每个地址i都有映射到所有Bank的连线。每一个Group都包含4个valid_i_bj,根据valid_i_bj的值判断读地址是否有效,并映射到Reg_rd_level_0的4个寄存器中,产生相
应的有效信号;规定地址编号越小优先级越高;3.2.3)寄存器组Reg_rd_level_0中存放的数据,将再经过另一个映射模块Allocate_Logic_Level_1后被送往Reg_rd_level_1中,Reg_rd_level_1共分为2组,每组包含8个位宽为4bit的寄存器及其有效信号valid,用于存放相应的由上一级送来的地址信息;Reg_rd_level_0的每个寄存器都有一个与之对应的valid位,若valid位为1则表示该寄存器内的信息有效,需要被映射到Reg_rd_level_1,若为0则无效,不需要映射;当有Reg_rd_level_0中的信息被映射到Reg_rd_level_1的某个寄存器时,Reg_rd_level_1中相应的寄存器的valid置1;3.2.4)Reg_rd_level_1中的数据经过最后一个映射模块Allocate_Logic_Level...

【专利技术属性】
技术研发人员:田泽王党辉岳琛
申请(专利权)人:西安翔腾微电子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1