【技术实现步骤摘要】
用于实现卷积运算的方法、装置、介质以及电子设备
本公开涉及计算机视觉技术,尤其是涉及一种用于实现卷积运算的方法、用于实现卷积运算的装置、存储介质以及电子设备。
技术介绍
计算机视觉技术往往离不开卷积运算。例如,在计算机视觉技术所使用的CNN(ConvolutionalNeuralNetworks,卷积神经网络)、RPN(RegionProposalNetwork,区域候选神经网络)以及RNN(RecurrentNeuralNetwork,循环神经网络)等神经网络中,通常包含有至少一卷积层,每一卷积层对应预设尺寸的卷积核,每一卷积层可以基于其对应的卷积核,对该卷积层的输入特征进行卷积运算,形成新的特征,并将该新的特征作为该卷积层的输出特征,从而实现该卷积层的卷积运算。目前,一些硬件单元仅支持单一类型的卷积运算,如何使硬件单元支持多种类型的卷积运算,是一个值得关注的技术问题。
技术实现思路
为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种用于实现卷积运算的方法、装置、存储介质以及电子设备。根据本公开实施例的一方面,提供一种用于实现卷积运算的方法,该方法包括:获取卷积层的输入特征和所述卷积层对应的卷积核的权值矩阵,其中,所述输入特征的空间分辨率为n1×n11,所述权值矩阵为m1×m1的权值矩阵,且所述n1和n11为正整数,所述m1为非零偶数;根据所述输入特征和权值矩阵获得行列扩展后的待运算特征和待运算权值矩阵,其中,所述待运算特征的空间分辨率为n2×n22,所述待运算权值矩阵
【技术保护点】
1.一种用于实现卷积运算的方法,包括:/n获取卷积层的输入特征和所述卷积层对应的卷积核的权值矩阵,其中,所述输入特征的空间分辨率为n1×n11,所述权值矩阵为m1×m1的权值矩阵,所述n1和n11为正整数,所述m1为非零偶数;/n根据所述输入特征和权值矩阵获得行列扩展后的待运算特征和待运算权值矩阵,其中,所述待运算特征的空间分辨率为n2×n22,所述待运算权值矩阵为m2×m2的权值矩阵,所述n2为大于n1的整数,所述n22为大于n11的整数,所述m2为大于m1的奇数,所述m2×m2为数据处理器支持的权值矩阵的尺寸;/n通过所述数据处理器对所述待运算权值矩阵与所述待运算特征执行卷积运算,得到卷积运算结果;/n根据所述卷积运算结果,获得所述卷积层的输出特征。/n
【技术特征摘要】
1.一种用于实现卷积运算的方法,包括:
获取卷积层的输入特征和所述卷积层对应的卷积核的权值矩阵,其中,所述输入特征的空间分辨率为n1×n11,所述权值矩阵为m1×m1的权值矩阵,所述n1和n11为正整数,所述m1为非零偶数;
根据所述输入特征和权值矩阵获得行列扩展后的待运算特征和待运算权值矩阵,其中,所述待运算特征的空间分辨率为n2×n22,所述待运算权值矩阵为m2×m2的权值矩阵,所述n2为大于n1的整数,所述n22为大于n11的整数,所述m2为大于m1的奇数,所述m2×m2为数据处理器支持的权值矩阵的尺寸;
通过所述数据处理器对所述待运算权值矩阵与所述待运算特征执行卷积运算,得到卷积运算结果;
根据所述卷积运算结果,获得所述卷积层的输出特征。
2.根据权利要求1所述的方法,其中,所述根据所述输入特征和权值矩阵获得行列扩展后的待运算特征和待运算权值矩阵,包括:
采用在所述输入特征和权值矩阵的相同方位分别添加至少一扩展行和至少一扩展列的方式,获得行列扩展后的待运算输入特征和待运算权值矩阵。
3.根据权利要求2所述的方法,其中,所述采用在所述输入特征和权值矩阵的相同方位分别添加至少一扩展行和至少一扩展列的方式,获得行列扩展后的待运算输入特征和待运算权值矩阵,包括:
采用在所述输入特征和权值矩阵的相同方位分别添加相同数量的扩展行和相同数量的扩展列的方式,获得行列扩展后的待运算输入特征和待运算权值矩阵。
4.根据权利要求3所述的方法,其中,所述采用在所述输入特征和权值矩阵的相同方位分别添加相同数量的扩展行和相同数量的扩展列的方式,获得行列扩展后的待运算输入特征和待运算权值矩阵,包括:
在所述数据处理器不支持所述卷积层的特征填充需求的情况下,采用在所述输入特征和权值矩阵的最上一行的上侧和最左一列的左侧分别添加相同数量的扩展行和相同数量的扩展列的方式,获得行列扩展后的待运算输入特征和待运算权值矩阵;
且所述通过所述数据处理器对所述待运算权值矩阵与所述待运算特征执行卷积运算,包括:
通过所述数据处理器基于其支持的特征填充,对所述待运算权值矩阵与所述待运算特征执行卷积运算。
5.根据权利要求4所述的方法,其中,所述根据所述卷积运算结果,获得所述卷积层的输出特征,包括:
根据所述卷积运算结果中的部分行和部分列,获得所述卷积层的输出特征。
6.根据权利要求2至5中任一项所述的方法,其中:
所述待运算权值矩阵中的扩展行和扩展列中的各元素的取值均为零;
所述待运算特征中的扩展行和扩展列中的各元素的取值均为任意值。
7.根据权利要求2至6中任一项所述的方法,其中:
所述扩展行的行数量为所述数据处理器所支持的第一卷积核的权值矩阵的行数量与所述卷积层对应的卷积核的权值矩阵的行数量的差值;
所述扩展列的列数量为所述数据处理器所支持的第一卷积核的权值矩阵的列数量与所述卷积层对应的卷积核的权值矩阵的列数量的差值;
其中,所述第一卷积核的权值矩阵为:所述数据处理器所支持的各权值矩阵中的大于所述卷积层对应的卷积核的权值矩阵的尺寸,且与所述卷积层对应的卷积核的权值矩阵的尺寸最接近的权值矩阵。
8.一种用于实现卷积运算的方法...
【专利技术属性】
技术研发人员:王振江,李德林,张祎男,
申请(专利权)人:北京地平线机器人技术研发有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。