System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 卷积神经网络运算制造技术_技高网

卷积神经网络运算制造技术

技术编号:41382771 阅读:4 留言:0更新日期:2024-05-20 10:23
公开了用于在单指令多数据(SIMD)单元上执行运算的方法和系统。所公开的技术在一个计算机循环期间对输入数据执行点积运算,该点积运算包括对该输入数据进行卷积、生成中间数据、以及对该中间数据应用一个或多个过渡运算以生成输出数据。描述了多个方面,其中该输入数据是到卷积神经网络的层的输入,并且所生成的输出数据是该层的输出。

【技术实现步骤摘要】
【国外来华专利技术】


技术介绍

1、各种计算任务涉及在多个阶段中处理多维数据。例如,卷积神经网络(cnn)通常按多层架构布置。在每一层中,可以对层的输入应用计算运算,诸如对输入图像的卷积运算。在这种情况下,所得的卷积图像(或中间图像)可以通过过渡运算进一步处理以生成层的输出。过渡运算可包括重新格式化、修正和/或夹紧中间图像以使其准备好供下一层处理。然而,相对于执行计算运算本身(例如,卷积)所花费的时间,这些过渡运算消耗大量的时间。需要提高由多层处理架构采用的过渡运算的执行效率的技术。


技术实现思路

【技术保护点】

1.一种用于在单指令多数据(SIMD)单元上执行运算的方法,所述方法包括:

2.根据权利要求1所述的方法,所述方法还包括:

3.根据权利要求1所述的方法,其中所述一个或多个过渡运算是重新格式化运算、修正运算或夹紧运算中的一者。

4.根据权利要求1所述的方法,其中所述输入数据是到卷积神经网络的层的输入,并且所述输出数据是所述层的输出。

5.根据权利要求1所述的方法,其中:

6.根据权利要求5所述的方法,其中当所述像素块的第一部分存储在所述通道的所述VGPR中并且所述像素块的第二部分存储在所述波中的另一个通道的VGPR中时,所述通道从所述另一个通道的所述VGPR访问所述第二部分。

7.根据权利要求5所述的方法,其中当所述像素块的第一部分存储在所述通道的所述VGPR中并且所述像素块的第二部分未存储在所述通道的所述VGPR中时,来自所述第二部分的数据被来自所述第一部分的数据替换。

8.根据权利要求7所述的方法,其中所生成的输出数据被由第二波的通道生成的输出数据替换。

9.根据权利要求1所述的方法,其中:

10.一种用于在SIMD单元上执行运算的电路,所述电路包括:

11.根据权利要求10所述的电路,所述电路还包括指令,所述指令使得所述电路:

12.根据权利要求10所述的电路,其中所述一个或多个过渡运算是重新格式化运算、修正运算或夹紧运算中的一者。

13.根据权利要求10所述的电路,其中所述输入数据是到卷积神经网络的层的输入,并且所述输出数据是所述层的输出。

14.根据权利要求10所述的电路,其中:

15.根据权利要求14所述的电路,其中当所述像素块的第一部分存储在所述通道的所述VGPR中并且所述像素块的第二部分存储在所述波中的另一个通道的VGPR中时,所述通道从所述另一个通道的所述VGPR访问所述第二部分。

16.根据权利要求14所述的电路,其中当所述像素块的第一部分存储在所述通道的所述VGPR中并且所述像素块的第二部分未存储在所述通道的所述VGPR中时,来自所述第二部分的数据被来自所述第一部分的数据替换。

17.根据权利要求16所述的电路,其中所生成的输出数据被由第二波的通道生成的输出数据替换。

18.根据权利要求10所述的电路,其中:

19.一种非暂态计算机可读介质,所述非暂态计算机可读介质包括能够由至少一个处理器执行以执行用于在SIMD单元上执行运算的方法的指令,所述方法包括:

20.根据权利要求19所述的介质,所述介质还包括:

...

【技术特征摘要】
【国外来华专利技术】

1.一种用于在单指令多数据(simd)单元上执行运算的方法,所述方法包括:

2.根据权利要求1所述的方法,所述方法还包括:

3.根据权利要求1所述的方法,其中所述一个或多个过渡运算是重新格式化运算、修正运算或夹紧运算中的一者。

4.根据权利要求1所述的方法,其中所述输入数据是到卷积神经网络的层的输入,并且所述输出数据是所述层的输出。

5.根据权利要求1所述的方法,其中:

6.根据权利要求5所述的方法,其中当所述像素块的第一部分存储在所述通道的所述vgpr中并且所述像素块的第二部分存储在所述波中的另一个通道的vgpr中时,所述通道从所述另一个通道的所述vgpr访问所述第二部分。

7.根据权利要求5所述的方法,其中当所述像素块的第一部分存储在所述通道的所述vgpr中并且所述像素块的第二部分未存储在所述通道的所述vgpr中时,来自所述第二部分的数据被来自所述第一部分的数据替换。

8.根据权利要求7所述的方法,其中所生成的输出数据被由第二波的通道生成的输出数据替换。

9.根据权利要求1所述的方法,其中:

10.一种用于在simd单元上执行运算的电路,所述电路包括:

11.根据权利要求10所述的电路,所述电路还包括指令,...

【专利技术属性】
技术研发人员:布莱恩·恩贝林迈克尔·曼特迈克尔·Y·乔何斌
申请(专利权)人:超威半导体公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1