System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于逐深度可分离卷积的存储器内计算架构和数据流制造技术_技高网

用于逐深度可分离卷积的存储器内计算架构和数据流制造技术

技术编号:40439819 阅读:3 留言:0更新日期:2024-02-22 23:03
本公开的某些方面提供了一种方法,包括:在CIM阵列的第一一列或多列中存储逐深度卷积内核;在该CIM阵列的第二一列或多列中存储经融合卷积内核;在与该CIM阵列的多行相关联的一个或多个输入数据缓冲器中存储预激活;利用该逐深度卷积内核处理预激活,以便生成逐深度输出;基于该逐深度输出来修改预激活中的一者或多者以生成经修改的预激活;以及利用经融合卷积内核处理经修改的预激活以生成经融合输出。

【技术实现步骤摘要】
【国外来华专利技术】


技术介绍


技术实现思路

【技术保护点】

1.一种装置,包括:

2.如权利要求1所述的装置,进一步包括:

3.如权利要求1所述的装置,其中:

4.如权利要求1所述的装置,其中为了基于所述逐深度输出修改所述预激活中的一者或多者,所述CIM阵列被进一步配置成将一个或多个预激活值设置为零。

5.如权利要求1所述的装置,其中所述CIM阵列被进一步配置成禁用所述CIM阵列中与所述经修改的预激活相关联的一行或多行。

6.如权利要求1所述的装置,进一步包括融合块,所述融合块被配置成融合所述逐深度卷积内核和逐点卷积内核,以便生成所述经融合卷积内核。

7.如权利要求1所述的装置,进一步包括:

8.如权利要求1所述的装置,进一步包括:

9.如权利要求8所述的装置,进一步包括缩放块,所述缩放块被配置成在将从所述ADC输出的所述数字数据提供给所述非线性运算块之前,将所述数字数据从第一位宽缩放到第二位宽。

10.如权利要求1所述的装置,其中所述CIM阵列包括多个静态随机存取存储器(SRAM)位单元。

11.一种方法,包括:>

12.如权利要求11所述的方法,进一步包括:

13.如权利要求11所述的方法,其中修改所述预激活中的一者或多者包括禁用所述CIM阵列中与所述预激活中的所述一者或多者相关联的行。

14.如权利要求11所述的方法,其中所述预激活包括多个预激活的逐通道群中的一个预激活的逐通道群。

15.如权利要求14所述的方法,其中在所述逐深度卷积内核处理了所述多个预激活的逐通道群中的每个预激活的逐通道群之后,执行用所述经融合卷积内核处理所述经修改的预激活以生成经融合输出。

16.如权利要求11所述的方法,进一步包括:经由模数转换器(ADC)将所述经融合输出转换为数字输出数据。

17.如权利要求16所述的方法,进一步包括:利用非线性运算处理所述数字输出数据以生成激活数据。

18.如权利要求17所述的方法,进一步包括将所述激活数据提供给主机处理系统。

19.如权利要求17所述的方法,进一步包括将所述激活数据提供给激活缓冲器以用于使用所述CIM阵列处理模型的另一层。

20.如权利要求17所述的方法,进一步包括在利用所述非线性运算处理所述数字输出数据之前缩放所述数字输出数据。

21.如权利要求11所述的方法,进一步包括:融合所述逐深度卷积内核和逐点卷积内核,以便生成所述经融合卷积内核。

22.如权利要求11所述的方法,其中所述CIM阵列包括多个静态随机存取存储器(SRAM)位单元。

23.如权利要求12所述的方法,进一步包括:缩放所述预激活中的一者或多者以减少所述经融合输出的量程压缩。

24.如权利要求23的方法,其中缩放仅对所述预激活中具有大于所述阈值的逐深度输出的一者或多者执行。

25.一种包括指令的非瞬态计算机可读介质,所述指令在由处理系统的处理器执行时使所述处理系统执行一种方法,所述方法包括:

26.如权利要求25所述的非瞬态计算机可读介质,其中所述方法进一步包括:

27.如权利要求25所述的非瞬态计算机可读介质,其中修改所述预激活中的一者或多者包括禁用所述CIM阵列中与所述预激活中的所述一者或多者相关联的行。

28.如权利要求25所述的非瞬态计算机可读介质,其中所述预激活包括多个预激活的逐通道群中的一个预激活的逐通道群。

29.如权利要求28所述的非瞬态计算机可读介质,其中在所述逐深度卷积内核处理了所述多个预激活的逐通道群中的每个预激活的逐通道群之后,执行用所述经融合卷积内核处理所述经修改的预激活以生成经融合输出。

30.一种处理系统,包括:

...

【技术特征摘要】
【国外来华专利技术】

1.一种装置,包括:

2.如权利要求1所述的装置,进一步包括:

3.如权利要求1所述的装置,其中:

4.如权利要求1所述的装置,其中为了基于所述逐深度输出修改所述预激活中的一者或多者,所述cim阵列被进一步配置成将一个或多个预激活值设置为零。

5.如权利要求1所述的装置,其中所述cim阵列被进一步配置成禁用所述cim阵列中与所述经修改的预激活相关联的一行或多行。

6.如权利要求1所述的装置,进一步包括融合块,所述融合块被配置成融合所述逐深度卷积内核和逐点卷积内核,以便生成所述经融合卷积内核。

7.如权利要求1所述的装置,进一步包括:

8.如权利要求1所述的装置,进一步包括:

9.如权利要求8所述的装置,进一步包括缩放块,所述缩放块被配置成在将从所述adc输出的所述数字数据提供给所述非线性运算块之前,将所述数字数据从第一位宽缩放到第二位宽。

10.如权利要求1所述的装置,其中所述cim阵列包括多个静态随机存取存储器(sram)位单元。

11.一种方法,包括:

12.如权利要求11所述的方法,进一步包括:

13.如权利要求11所述的方法,其中修改所述预激活中的一者或多者包括禁用所述cim阵列中与所述预激活中的所述一者或多者相关联的行。

14.如权利要求11所述的方法,其中所述预激活包括多个预激活的逐通道群中的一个预激活的逐通道群。

15.如权利要求14所述的方法,其中在所述逐深度卷积内核处理了所述多个预激活的逐通道群中的每个预激活的逐通道群之后,执行用所述经融合卷积内核处理所述经修改的预激活以生成经融合输出。

16.如权利要求11所述的方法,进一步包括:经由模数转换器(adc)将所述经融合输出转换为数字输出数据。

17.如权利要...

【专利技术属性】
技术研发人员:R·李
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1