卷积计算方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号:44325879 阅读:12 留言:0更新日期:2025-02-18 20:34
本申请公开了一种卷积计算方法、装置、电子设备及计算机可读存储介质,其方法包括:对特征图数据进行切分,获得多个子图像块;对多组权重数据组中的权重数据进行切分,获得子权重块;基于时钟周期,获取对应的第一目标元素,获取对应的第二目标元素;将第一目标元素广播给对应计算阵列中对应行的所有计算单元,并将第二目标元素广播给计算阵列中对应列的所有计算单元;基于所述当前卷积计算结果,输出目标特征图。本申请通过根据计算阵列的参数对特征图数据进行切分,以实现同一特征图方向上各个图像块的卷积计算结果在计算单元内进行累加,无需消耗额外的中间结果存储资源以及对存储的中间结果进行处理的芯片资源,可有效降低芯片的面积。

【技术实现步骤摘要】

本申请涉及计算机,尤其涉及一种卷积计算方法、装置、电子设备及计算机可读存储介质


技术介绍

1、近年来,ai(artificial intelligence,人工智能)技术得到了迅猛发展,也取得了显著的成果,特别是在图像检测和识别以及语言识别等方向上,人工智能的识别率超过了人类。而神经网络处理是实现人工智能的重要处理技术。目前,卷积计算过程是将卷积核权重(weight)与输入特征图(input feature map)中的元素进行对应的乘法和累加操作,得到目标特征图(output feature map)的一个元素,然后根据步长(stride)移动计算窗口,并重复上述卷积计算操作,直到算出目标特征图的全部元素。

2、由于卷积计算的数据量大以及硬件电路限制,在进行卷积计算时会将输入特征图和卷积核权重进行切分,或者转成矩阵后再切分,切成和硬件算力大小匹配的块进行循环计算。然而,每次卷积计算的中间结果需要进行存储,以便于进行累加获得卷积计算结果,需要消耗大量面积资源。

3、对于ai芯片,面积就是算力,面积就是成本,芯片低面积设计一直都是芯本文档来自技高网...

【技术保护点】

1.一种卷积计算方法,其特征在于,包括:

2.如权利要求1所述的卷积计算方法,其特征在于,所述基于时钟周期,沿特征图方向在各个子图像块中获取对应的第一目标元素,并沿特征图方向在各个子权重块中获取对应的第二目标元素的步骤包括:

3.如权利要求2所述的卷积计算方法,其特征在于,所述第一预设时钟周期根据所述图像块的数量以及所述参数中的卷积核参数得到,所述第二预设时钟周期根据所述卷积核参数得到,所述第一预设时钟周期大于所述第二预设时钟周期。

4.如权利要求2所述的卷积计算方法,其特征在于,所述沿特征图方向在目标图像块的各个目标子图像块中获取对应的第一目标元素,...

【技术特征摘要】

1.一种卷积计算方法,其特征在于,包括:

2.如权利要求1所述的卷积计算方法,其特征在于,所述基于时钟周期,沿特征图方向在各个子图像块中获取对应的第一目标元素,并沿特征图方向在各个子权重块中获取对应的第二目标元素的步骤包括:

3.如权利要求2所述的卷积计算方法,其特征在于,所述第一预设时钟周期根据所述图像块的数量以及所述参数中的卷积核参数得到,所述第二预设时钟周期根据所述卷积核参数得到,所述第一预设时钟周期大于所述第二预设时钟周期。

4.如权利要求2所述的卷积计算方法,其特征在于,所述沿特征图方向在目标图像块的各个目标子图像块中获取对应的第一目标元素,并沿特征图方向在目标子权重块中获取第二目标元素的步骤包括:

5.如权利要求1所述的卷积计算方法,其特征在于,所述基于所述当前卷积计算结果,输出目标特征图的步骤包括:

6.如权利要求1所述的卷积计算方法,其特征在于,所述计算单元包括乘法累加电路、加法器以及输出寄存器,

7.如权利要求6所述的卷积计算方法,其特征在于,若当前时钟周期对应的累计周期数达到预设阈值,则通过各个计算单元的输出寄存器输出所述当前卷积计算结果,获得所述目标特征图对应的子图像块,并将各个所述计算...

【专利技术属性】
技术研发人员:桂春胜
申请(专利权)人:广州小鹏汽车科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1