一种GPU多功能直接内存访问方法及相应的GPU技术

技术编号:46623972 阅读:1 留言:0更新日期:2025-10-14 21:19
本发明专利技术涉及图形处理器技术领域,提供了一种GPU多功能直接内存访问方法及相应的GPU。在本发明专利技术中,当待访问数据的数据类型为块数据时,根据单元线程总数,在空间上将块数据均分,以确定用于访问所述块数据的线程,并得到所述块数据的全局内存地址;根据用于访问所述块数据的线程及全局内存地址,生成所述块数据的直接内存访问请求,以对所述块数据进行直接内存访问,进而大幅提高GPU对块数据进行直接内存访问的性能,解决了现有技术通过复用向量数据的逻辑通路处理块数据时,必须额外引入计算指令导致GPU性能大幅降低的问题。

【技术实现步骤摘要】

本专利技术涉及图形处理器,特别是涉及一种gpu多功能直接内存访问方法及相应的gpu。


技术介绍

1、在图形处理器(graphics processing unit,简写为gpu)中,通常有几种类型的内存,包括全局内存(global memory)、纹理内存(texture memory)和寄存器(registers)等,全局内存是最常用的,因为它可以被所有线程访问,但针对全局内存进行直接内存访问的访问速度相对较慢。

2、且在gpu对全局内存进行直接内存访问的过程中,一个线程块是计算核心(compute unit,简写为cu)中的基本执行单元,一个线程块中的所有的线程(例如,32个线程)是并行执行的,但是其中每个线程之间又是相互独立的。

3、由于gpu应用场景日益增加,尤其是人工智能(artificial intelligence,简写为ai)模型的飞速发展,对全局内存中的块数据进行直接内存访问已成为gpu的主要应用场景,极大地影响gpu进行ai计算的性能。

4、现有技术中传统的、只面向渲染与通用计算应用的gpu,仅支持常本文档来自技高网...

【技术保护点】

1.一种GPU多功能直接内存访问方法,其特征在于,包括:

2.根据权利要求1所述的GPU多功能直接内存访问方法,其特征在于,所述当待访问数据的数据类型为块数据时,根据单元线程总数,在空间上将块数据均分,以确定用于访问所述块数据的线程,并得到所述块数据的全局内存地址包括:

3.根据权利要求2所述的GPU多功能直接内存访问方法,其特征在于,至少一个用于访问所述块数据的线程组成线程块;

4.根据权利要求2所述的GPU多功能直接内存访问方法,其特征在于,在所述当待访问数据的数据类型为块数据时,根据单元线程总数,在空间上将块数据均分,以确定用于访问所述块数据的线...

【技术特征摘要】

1.一种gpu多功能直接内存访问方法,其特征在于,包括:

2.根据权利要求1所述的gpu多功能直接内存访问方法,其特征在于,所述当待访问数据的数据类型为块数据时,根据单元线程总数,在空间上将块数据均分,以确定用于访问所述块数据的线程,并得到所述块数据的全局内存地址包括:

3.根据权利要求2所述的gpu多功能直接内存访问方法,其特征在于,至少一个用于访问所述块数据的线程组成线程块;

4.根据权利要求2所述的gpu多功能直接内存访问方法,其特征在于,在所述当待访问数据的数据类型为块数据时,根据单元线程总数,在空间上将块数据均分,以确定用于访问所述块数据的线程,并得到所述块数据的全局内存地址之前,还包括:

5.根据权利要求4所述的gpu多功能直接内存访问方法,其特征在于,在所述解析统一dma指令之前,还包括:

6.根据权利要求1所述的gpu多功能直接内存访问方法,其特征在于...

【专利技术属性】
技术研发人员:金济芳殷亚云
申请(专利权)人:芯动微电子科技武汉有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1