【技术实现步骤摘要】
本申请涉及计算机,尤其涉及一种卷积计算方法、装置、电子设备及计算机可读存储介质。
技术介绍
1、近年来,ai(artificial intelligence,人工智能)技术得到了迅猛发展,也取得了显著的成果,特别是在图像检测和识别以及语言识别等方向上,人工智能的识别率超过了人类。而神经网络处理是实现人工智能的重要处理技术。目前,卷积计算过程是将卷积核权重(weight)与输入特征图(input feature map)中的元素进行对应的乘法和累加操作,得到目标特征图(output feature map)的一个元素,然后根据步长(stride)移动计算窗口,并重复上述卷积计算操作,直到算出目标特征图的全部元素。
2、由于卷积计算的数据量大以及硬件电路限制,在进行卷积计算时会将输入特征图和卷积核权重进行切分,或者转成矩阵后再切分,切成和硬件算力大小匹配的块进行循环计算。然而,每次卷积计算的中间结果需要进行存储,以便于进行累加获得卷积计算结果,需要消耗大量面积资源。
3、对于ai芯片,面积就是算力,面积就是成本,芯片
...【技术保护点】
1.一种卷积计算方法,其特征在于,包括:
2.如权利要求1所述的卷积计算方法,其特征在于,所述基于时钟周期,沿特征图方向在各个子图像块中获取对应的第一目标元素,并沿特征图方向在各个子权重块中获取对应的第二目标元素的步骤包括:
3.如权利要求2所述的卷积计算方法,其特征在于,所述第一预设时钟周期根据所述图像块的数量以及所述参数中的卷积核参数得到,所述第二预设时钟周期根据所述卷积核参数得到,所述第一预设时钟周期大于所述第二预设时钟周期。
4.如权利要求2所述的卷积计算方法,其特征在于,所述沿特征图方向在目标图像块的各个目标子图像块中获取
...【技术特征摘要】
1.一种卷积计算方法,其特征在于,包括:
2.如权利要求1所述的卷积计算方法,其特征在于,所述基于时钟周期,沿特征图方向在各个子图像块中获取对应的第一目标元素,并沿特征图方向在各个子权重块中获取对应的第二目标元素的步骤包括:
3.如权利要求2所述的卷积计算方法,其特征在于,所述第一预设时钟周期根据所述图像块的数量以及所述参数中的卷积核参数得到,所述第二预设时钟周期根据所述卷积核参数得到,所述第一预设时钟周期大于所述第二预设时钟周期。
4.如权利要求2所述的卷积计算方法,其特征在于,所述沿特征图方向在目标图像块的各个目标子图像块中获取对应的第一目标元素,并沿特征图方向在目标子权重块中获取第二目标元素的步骤包括:
5.如权利要求1所述的卷积计算方法,其特征在于,所述基于所述当前卷积计算结果,输出目标特征图的步骤包括:
6.如权利要求1所述的卷积计算方法,其特征在于,所述计算单元包括乘法累加电路、加法器以及输出寄存器,
7.如权利要求6所述的卷积计算方法,其特征在于,若当前时钟周期对应的累计周期数达到预设阈值,则通过各个计算单元的输出寄存器输出所述当前卷积计算结果,获得所述目标特征图对应的子图像块,并将各个所述计算...
【专利技术属性】
技术研发人员:桂春胜,
申请(专利权)人:广州小鹏汽车科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。