【技术实现步骤摘要】
本专利技术涉及计算机,尤其涉及一种共享内存访问方法、单元、图形处理器及通用图形处理器。
技术介绍
1、在图形处理器(graphics processing unit,gpu)或通用图形处理器(general-purpose computing on graphics processing units,gpgpu)中,共享内存(sharedmemory,sm)能够为算术逻辑运算单元(arithmetic andlogic unit,alu)提供快速读写,共享内存的读写延迟应尽可能的短。在通用图形处理器的并行计算中,同一个工作组(work group)的工作项(work item)可对同一共享内存空间进行访问。传统的共享内存访问方法,每个工作项独立对共享内存的存储库(bank)进行访问。对于多个工作项且通道数据格式(bits per channel,bpc)小于共享内存的存储库宽度(bankwidth),访问效率极低,并且易出现存储库冲突(bank conflict)。
2、对于同一工作组中的工作项可对同一共享内存空间进行访问。
...【技术保护点】
1.一种共享内存访问方法,其特征在于,所述方法包括:
2.根据权利要求1所述的共享内存访问方法,其特征在于,所述地址解析的过程包括:
3.根据权利要求1所述的共享内存访问方法,其特征在于,所述写请求地址信息表的构造过程包括:基于当前访问的共享内存的配置信息,按照存储库宽度2n字节和存储库个数m,针对每个字节构造一张m×m的写请求信息空白表,所述写请求信息空白表的数量为2n张;
4.根据权利要求1所述的共享内存访问方法,其特征在于,所述读请求地址信息表的构造过程包括:基于当前访问的共享内存的配置信息,按照存储库个数m,构造一张m×m的
...【技术特征摘要】
1.一种共享内存访问方法,其特征在于,所述方法包括:
2.根据权利要求1所述的共享内存访问方法,其特征在于,所述地址解析的过程包括:
3.根据权利要求1所述的共享内存访问方法,其特征在于,所述写请求地址信息表的构造过程包括:基于当前访问的共享内存的配置信息,按照存储库宽度2n字节和存储库个数m,针对每个字节构造一张m×m的写请求信息空白表,所述写请求信息空白表的数量为2n张;
4.根据权利要求1所述的共享内存访问方法,其特征在于,所述读请求地址信息表的构造过程包括:基于当前访问的共享内存的配置信息,按照存储库个数m,构造一张m×m的读请求信息空白表;
5.根据权利要求1所述的共享内存访问方法,其特征在于,所述共享内存写操作的过程包括:
6.根据权利要求5所述的共享内存访问方法,其特征在于,所述写请求通道掩码的更新规则为:
7.根据权利要求5所述的共享内存访问方法,其特征在于,所述写请求通道的字节数据合并规则为:针对写请求通道掩码为1的有效写请求通道,对于行编号为i的当前写请求通道lane i的第k个字节,判断地址信息表行row[i]是否为0;
8.根据权利要求5所述的共享内存访问方法,其特征在于,所述写请求通道的写字节掩码更新规则为:针对写请求通道掩码为1的有效写请求通道,对于行编号为i的当前写请求通道lane i的第k个字节,判断地址信息表行row[i]是否不为0;
9.根...
【专利技术属性】
技术研发人员:陶中玉,虞韫之,张淮声,
申请(专利权)人:格兰菲智能科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。