【技术实现步骤摘要】
特征数据提取方法及装置、指令生成方法及装置
本申请涉及神经网络
,尤其涉及一种特征数据提取方法及装置、指令生成方法及装置。
技术介绍
卷积神经网络已成功应用于图像处理、自动驾驶等诸多领域。随着卷积神经网络在诸多领域的应用,一些应用场景下需要在卷积神经网络中应用各种尺寸卷积核的卷积运算操作。然而,专用于执行神经网络计算的硬件(例如,神经网络加速器)因其硬件的限制仅能够直接执行特定尺寸的卷积核的卷积运算操作。
技术实现思路
为了解决上述技术问题,期望提供一种特征数据提取方法及装置、指令生成方法及装置,以使因硬件限制而不能支持特定尺寸卷积核的硬件(例如,神经网络加速器)能够完成各种卷积核的卷积运算操作,从而在不增加硬件成本的前提下提高硬件执行卷积神经网络运算的效率。根据本申请的一个方面,提供了一种特征数据提取方法,包括:获取第一卷积核的一部分;获取第一输入特征数据的一部分,所述输入特征数据的一部分与所述第一卷积核的一部分相对应;利用计算单元对所述第一卷积核的一部分和所述第一输入特征数据的一部分进行卷积运算,以获得第二输出特征数据;在针对所述第一卷积核的每一部分都获得了对应的第二输出特征数据之后,对针对所述第一卷积核的每一部分获得的第二输出特征数据进行整合,以获得与所述第一卷积核和所述第一输入特征数据对应的第一输出特征数据;其中,所述第一卷积核具有超出所述计算单元的硬件参数限制的尺寸,所述第一卷积核中的每一部分具有在所述计算单元的硬件参数限制范围内的尺寸。根据本申请的一个方面,提供了一种特征数据提取装置,包括:第一获取模块,配置为获取第一卷积核的一部分;第二获取 ...
【技术保护点】
1.一种特征数据提取方法,包括:获取第一卷积核的一部分;获取第一输入特征数据的一部分,所述输入特征数据的一部分与所述第一卷积核的一部分相对应;利用计算单元对所述第一卷积核的一部分和所述第一输入特征数据的一部分进行卷积运算,以获得第二输出特征数据;在针对所述第一卷积核的每一部分都获得了对应的第二输出特征数据之后,对针对所述第一卷积核的每一部分获得的第二输出特征数据进行整合,以获得与所述第一卷积核和所述第一输入特征数据对应的第一输出特征数据;其中,所述第一卷积核具有超出所述计算单元的硬件参数限制的尺寸,所述第一卷积核中的每一部分具有在所述计算单元的硬件参数限制范围内的尺寸。
【技术特征摘要】
1.一种特征数据提取方法,包括:获取第一卷积核的一部分;获取第一输入特征数据的一部分,所述输入特征数据的一部分与所述第一卷积核的一部分相对应;利用计算单元对所述第一卷积核的一部分和所述第一输入特征数据的一部分进行卷积运算,以获得第二输出特征数据;在针对所述第一卷积核的每一部分都获得了对应的第二输出特征数据之后,对针对所述第一卷积核的每一部分获得的第二输出特征数据进行整合,以获得与所述第一卷积核和所述第一输入特征数据对应的第一输出特征数据;其中,所述第一卷积核具有超出所述计算单元的硬件参数限制的尺寸,所述第一卷积核中的每一部分具有在所述计算单元的硬件参数限制范围内的尺寸。2.如权利要求1所述的方法,其中,所述计算单元包括多个乘法器和累加器。3.如权利要求2所述的方法,其中,所述计算单元的硬件参数限制包括所述计算单元中包括的乘法器的数量限制。4.如权利要求3所述的方法,其中,所述计算单元中包括的乘法器的数量小于直接执行所述第一卷积核的卷积运算所需的乘法器数量,大于或等于直接执行所述第一卷积核的所述一部分的卷积运算所需的乘法器数量。5.如权利要求1所述的方法,其中,所述第一卷积核的一部分是所述第一卷积核在宽度、高度和深度中的一个或多个维度上的一部分。6.如权利要求1所述的方法,其中,所述第一卷积核的所述每一部分之间彼此不重叠。7.如权利要求1所述的方法,其中,所述第一卷积核的至少两个部分具有彼此不同的尺寸。8.如权利要求1所述的方法,其中,获取第一输入特征数据的一部分包括:基于所述第一卷积核在每个维度上的尺寸、所述第一卷积核的一部分的起点坐标和在每个维度上的尺寸、以及所述第一输入特征数据在每个维度上的尺寸,从所述第一输入特征数据中获取与所述第一卷积核的一部分对应的部分。9.如权利要求8所述的方法,其中,所述第一输入特征数据在每个维度上的尺寸包括所述第一输入特征数据本身的尺寸和填充尺寸,从所述第一输入特征数据中获取的与所述第一卷积核的一部分对应的部分是填充后的第一输入特征数据的与所述第一卷积核的一部分对应的部分。10.一种特征数据提取装置,包括:第一获取模块,配置为获取第一卷积核的一部分;第二获取模块,配置为获取第一输入特征数据的一部分,所述第一输入特征数据的一部分与所述第一卷积核的一部分相对应;计算模块,配置为利用计算单元对所述第一卷积核的一部分和所述第一输入特征数据的一部分进行卷积运算,以获得第二输出特征数据;以及整合模块,在针对所述第一卷积核的每一部分都获得了对应的第二输出特征数据之后,对针对所述第一卷积核的每一部分获得的第二输出特征数据进行整合,以获得与所述第一卷积核和所述第一输入特征数据对应的第一输出特征数据;其中,所述第一卷积核具有超出所述计算单元的硬件参数限制的尺寸,所述第一卷积核的每一部分具有在所述计算单元的硬件参数限制范围内的尺寸。11....
【专利技术属性】
技术研发人员:李智超,王振江,凌坤,李建军,
申请(专利权)人:北京地平线机器人技术研发有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。