【技术实现步骤摘要】
本专利技术涉及图形处理器,特别是涉及一种gpu多功能直接内存访问方法及相应的gpu。
技术介绍
1、在图形处理器(graphics processing unit,简写为gpu)中,通常有几种类型的内存,包括全局内存(global memory)、纹理内存(texture memory)和寄存器(registers)等,全局内存是最常用的,因为它可以被所有线程访问,但针对全局内存进行直接内存访问的访问速度相对较慢。
2、且在gpu对全局内存进行直接内存访问的过程中,一个线程块是计算核心(compute unit,简写为cu)中的基本执行单元,一个线程块中的所有的线程(例如,32个线程)是并行执行的,但是其中每个线程之间又是相互独立的。
3、由于gpu应用场景日益增加,尤其是人工智能(artificial intelligence,简写为ai)模型的飞速发展,对全局内存中的块数据进行直接内存访问已成为gpu的主要应用场景,极大地影响gpu进行ai计算的性能。
4、现有技术中传统的、只面向渲染与通用计算应
...【技术保护点】
1.一种GPU多功能直接内存访问方法,其特征在于,包括:
2.根据权利要求1所述的GPU多功能直接内存访问方法,其特征在于,所述当待访问数据的数据类型为块数据时,根据单元线程总数,在空间上将块数据均分,以确定用于访问所述块数据的线程,并得到所述块数据的全局内存地址包括:
3.根据权利要求2所述的GPU多功能直接内存访问方法,其特征在于,至少一个用于访问所述块数据的线程组成线程块;
4.根据权利要求2所述的GPU多功能直接内存访问方法,其特征在于,在所述当待访问数据的数据类型为块数据时,根据单元线程总数,在空间上将块数据均分,以确定用
...【技术特征摘要】
1.一种gpu多功能直接内存访问方法,其特征在于,包括:
2.根据权利要求1所述的gpu多功能直接内存访问方法,其特征在于,所述当待访问数据的数据类型为块数据时,根据单元线程总数,在空间上将块数据均分,以确定用于访问所述块数据的线程,并得到所述块数据的全局内存地址包括:
3.根据权利要求2所述的gpu多功能直接内存访问方法,其特征在于,至少一个用于访问所述块数据的线程组成线程块;
4.根据权利要求2所述的gpu多功能直接内存访问方法,其特征在于,在所述当待访问数据的数据类型为块数据时,根据单元线程总数,在空间上将块数据均分,以确定用于访问所述块数据的线程,并得到所述块数据的全局内存地址之前,还包括:
5.根据权利要求4所述的gpu多功能直接内存访问方法,其特征在于,在所述解析统一dma指令之前,还包括:
6.根据权利要求1所述的gpu多功能直接内存访问方法,其特征在于...
【专利技术属性】
技术研发人员:金济芳,殷亚云,
申请(专利权)人:芯动微电子科技武汉有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。