System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于在高速缓存存储器、本地数据存储装置以及寄存器文件之间共享存储的处理设备和方法制造方法及图纸_技高网

用于在高速缓存存储器、本地数据存储装置以及寄存器文件之间共享存储的处理设备和方法制造方法及图纸

技术编号:40915745 阅读:4 留言:0更新日期:2024-04-18 14:42
提供了一种加速处理设备,该加速处理设备包括多个计算单元,每个计算单元包括多个SIMD单元,并且每个SIMD单元包括寄存器文件。该加速处理设备还包括与这些SIMD单元中的每个SIMD单元通信的LDS。该加速处理设备还包括与这些SIMD单元中的每个SIMD单元通信的第一部分高速缓存存储器和由这些计算单元共享的第二部分高速缓存存储器。这些计算单元被配置为执行程序,其中SIMD单元的该寄存器文件、该第一部分高速缓存存储器和该LDS中的至少一者的存储部分被保留为该寄存器文件、该第一部分高速缓存存储器和该LDS中的另一者的一部分。

【技术实现步骤摘要】
【国外来华专利技术】


技术介绍

1、加速处理设备(apd),诸如图形处理单元(gpu)、人工智能处理器和计算处理器,用于对非常适合并行处理的操作(例如,图形操作)的处理进行加速。gpu包括多个处理器内核(例如,计算单元(cu)),这些处理器内核根据单指令多数据(simd)范式以并行方式执行操作。


技术实现思路

【技术保护点】

1.一种加速处理设备,所述加速处理设备包括:

2.根据权利要求1所述的处理设备,其中通过在编译所述程序时实例化所述存储部分将所述存储部分保留为所述寄存器文件、所述第一部分高速缓存存储器和所述LDS中的所述另一者的一部分。

3.根据权利要求1所述的处理设备,其中所述加速处理设备是GPU、计算处理器和人工智能处理器中的一者。

4.根据权利要求1所述的处理设备,其中基于被执行的所述程序确定被保留为所述寄存器文件、所述第一部分高速缓存存储器和所述LDS中的另一者的一部分的所述存储部分。

5.根据权利要求1所述的处理设备,其中所述寄存器文件的所述存储部分被保留为所述第一部分高速缓存存储器的一部分,并且

6.根据权利要求5所述的处理设备,其中所述程序的所述第一部分和所述程序的所述第二部分是波前。

7.根据权利要求5所述的处理设备,其中所述寄存器文件的所述存储部分由所述计算单元的其他SIMD单元共享。

8.根据权利要求5所述的处理设备,其中所述存储部分是所述寄存器文件的静态随机存取存储器SRAM的一部分。>

9.根据权利要求1所述的处理设备,其中所述寄存器文件包括寄存器组,并且

10.一种执行程序的方法,所述方法包括:

11.根据权利要求10所述的方法,所述方法还包括在所述计算单元的第一单指令多数据SIMD单元中执行所述程序的所述第一部分和所述程序的所述第二部分。

12.根据权利要求10所述的方法,其中所述程序的所述第一部分和所述程序的所述第二部分是波前。

13.根据权利要求10所述的方法,其中所述寄存器文件的所述第二部分在编译时被实例化为所述第一层级高速缓存存储器的一部分。

14.根据权利要求10所述的方法,其中所述寄存器文件是计算单元的单指令多数据SIMD单元的一部分,并且

15.根据权利要求14所述的方法,所述方法还包括将来自所述寄存器文件的所述第二部分的数据载入到所述其他SIMD单元中的一个SIMD单元的寄存器文件。

16.一种处理设备,所述处理设备包括:

17.根据权利要求16所述的处理设备,其中所述寄存器文件的所述存储部分被保留为所述第一层级高速缓存存储器的一部分,并且

18.根据权利要求17所述的处理设备,其中所述寄存器文件的所述存储部分和所述寄存器文件的所述另一存储部分之间的第一带宽大于所述寄存器文件和所述第二层级高速缓存存储器之间的第二带宽。

19.根据权利要求16所述的处理设备,所述处理设备还包括将来自所述寄存器文件的所述第二部分的数据载入到其他SIMD单元中的一个SIMD单元的寄存器文件。

20.根据权利要求19所述的处理设备,所述处理设备还包括中央处理单元CPU,所述中央处理单元CPU基于待执行的所述程序确定被保留为所述寄存器文件、所述第一层级高速缓存存储器和所述LDS中的所述另一者的一部分的所述存储部分的量。

...

【技术特征摘要】
【国外来华专利技术】

1.一种加速处理设备,所述加速处理设备包括:

2.根据权利要求1所述的处理设备,其中通过在编译所述程序时实例化所述存储部分将所述存储部分保留为所述寄存器文件、所述第一部分高速缓存存储器和所述lds中的所述另一者的一部分。

3.根据权利要求1所述的处理设备,其中所述加速处理设备是gpu、计算处理器和人工智能处理器中的一者。

4.根据权利要求1所述的处理设备,其中基于被执行的所述程序确定被保留为所述寄存器文件、所述第一部分高速缓存存储器和所述lds中的另一者的一部分的所述存储部分。

5.根据权利要求1所述的处理设备,其中所述寄存器文件的所述存储部分被保留为所述第一部分高速缓存存储器的一部分,并且

6.根据权利要求5所述的处理设备,其中所述程序的所述第一部分和所述程序的所述第二部分是波前。

7.根据权利要求5所述的处理设备,其中所述寄存器文件的所述存储部分由所述计算单元的其他simd单元共享。

8.根据权利要求5所述的处理设备,其中所述存储部分是所述寄存器文件的静态随机存取存储器sram的一部分。

9.根据权利要求1所述的处理设备,其中所述寄存器文件包括寄存器组,并且

10.一种执行程序的方法,所述方法包括:

11.根据权利要求10所述的方法,所述方法还包括在所述计算单元的第一单指令多数据simd单元中执行所述程序的所述第一部分和所述程序的所述第二部分。

...

【专利技术属性】
技术研发人员:马克西姆·V·卡扎科夫
申请(专利权)人:超威半导体公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1