共享内存访问方法、单元、图形处理器及通用图形处理器技术

技术编号:42375820 阅读:15 留言:0更新日期:2024-08-16 15:00
本发明专利技术公开了一种共享内存访问方法、单元、图形处理器及通用图形处理器,获取共享内存的配置信息,并接收待处理工作项的读写请求信息;对收到的读写请求信息进行地址解析,得到对应的地址信息;根据地址信息分别构造读请求地址信息表和写请求地址信息表;根据读请求地址信息表和写请求地址信息表,访问共享内存进行读写操作。本发明专利技术的技术方案能够根据共享内存请求地址信息,通过构造模块,构造读、写地址信息表;根据地址信息表,对相同地址的请求进行合并,减少相同地址访问共享内存的次数,减少存储库冲突,提高共享内存访问效率。

【技术实现步骤摘要】

本专利技术涉及计算机,尤其涉及一种共享内存访问方法、单元、图形处理器及通用图形处理器


技术介绍

1、在图形处理器(graphics processing unit,gpu)或通用图形处理器(general-purpose computing on graphics processing units,gpgpu)中,共享内存(sharedmemory,sm)能够为算术逻辑运算单元(arithmetic andlogic unit,alu)提供快速读写,共享内存的读写延迟应尽可能的短。在通用图形处理器的并行计算中,同一个工作组(work group)的工作项(work item)可对同一共享内存空间进行访问。传统的共享内存访问方法,每个工作项独立对共享内存的存储库(bank)进行访问。对于多个工作项且通道数据格式(bits per channel,bpc)小于共享内存的存储库宽度(bankwidth),访问效率极低,并且易出现存储库冲突(bank conflict)。

2、对于同一工作组中的工作项可对同一共享内存空间进行访问。共享内存可以根据(m本文档来自技高网...

【技术保护点】

1.一种共享内存访问方法,其特征在于,所述方法包括:

2.根据权利要求1所述的共享内存访问方法,其特征在于,所述地址解析的过程包括:

3.根据权利要求1所述的共享内存访问方法,其特征在于,所述写请求地址信息表的构造过程包括:基于当前访问的共享内存的配置信息,按照存储库宽度2n字节和存储库个数m,针对每个字节构造一张m×m的写请求信息空白表,所述写请求信息空白表的数量为2n张;

4.根据权利要求1所述的共享内存访问方法,其特征在于,所述读请求地址信息表的构造过程包括:基于当前访问的共享内存的配置信息,按照存储库个数m,构造一张m×m的读请求信息空白表;<...

【技术特征摘要】

1.一种共享内存访问方法,其特征在于,所述方法包括:

2.根据权利要求1所述的共享内存访问方法,其特征在于,所述地址解析的过程包括:

3.根据权利要求1所述的共享内存访问方法,其特征在于,所述写请求地址信息表的构造过程包括:基于当前访问的共享内存的配置信息,按照存储库宽度2n字节和存储库个数m,针对每个字节构造一张m×m的写请求信息空白表,所述写请求信息空白表的数量为2n张;

4.根据权利要求1所述的共享内存访问方法,其特征在于,所述读请求地址信息表的构造过程包括:基于当前访问的共享内存的配置信息,按照存储库个数m,构造一张m×m的读请求信息空白表;

5.根据权利要求1所述的共享内存访问方法,其特征在于,所述共享内存写操作的过程包括:

6.根据权利要求5所述的共享内存访问方法,其特征在于,所述写请求通道掩码的更新规则为:

7.根据权利要求5所述的共享内存访问方法,其特征在于,所述写请求通道的字节数据合并规则为:针对写请求通道掩码为1的有效写请求通道,对于行编号为i的当前写请求通道lane i的第k个字节,判断地址信息表行row[i]是否为0;

8.根据权利要求5所述的共享内存访问方法,其特征在于,所述写请求通道的写字节掩码更新规则为:针对写请求通道掩码为1的有效写请求通道,对于行编号为i的当前写请求通道lane i的第k个字节,判断地址信息表行row[i]是否不为0;

9.根...

【专利技术属性】
技术研发人员:陶中玉虞韫之张淮声
申请(专利权)人:格兰菲智能科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1