【技术实现步骤摘要】
一种对于特征图的卷积处理方法、装置、设备及介质
[0001]本申请涉及计算机
,尤其涉及一种对于特征图的卷积处理方法、装置、设备及介质。
技术介绍
[0002]卷积神经网络目前被广泛用于目标检测、图像增强、超分辨相关的图像任务,随着物联网技术的发展,越来越多的深度学习模型需要在边缘设备进行推理,对任务的处理速度的要求也越来越高,例如,以计算机视觉为代表的物联网应用对推理速度和实时性有很高的要求。
[0003]因此,如何提高基于卷积神经网络进行的任务的处理速度是亟待解决的技术问题。
技术实现思路
[0004]本说明书实施例提供一种对于特征图的卷积处理方法、装置、设备及介质,以提高特征图卷积处理的速度。
[0005]为解决上述技术问题,本说明书实施例是这样实现的:
[0006]本说明书实施例提供的一种对于特征图的卷积处理方法,所述方法涉及神经网络处理器,所述神经网络处理器包含多个可并行运行的算术逻辑单元;所述多个可并行运行的算术逻辑单元在一次运算过程中可支持的卷积计算向量数量为预设数 ...
【技术保护点】
【技术特征摘要】
1.一种对于特征图的卷积处理方法,所述方法涉及神经网络处理器,所述神经网络处理器包含多个可并行运行的算术逻辑单元;所述多个可并行运行的算术逻辑单元在一次运算过程中可支持的卷积计算向量数量为预设数量,所述方法包括:获取目标对象的特征金字塔;所述特征金字塔包含多个特征图;所述多个特征图中的至少一个特征图包含的第一卷积计算向量数量小于所述预设数量;将所述多个特征图进行组合,得到组合后的特征图;所述组合后的特征图包含的第二卷积计算向量数量大于所述第一卷积计算向量数量;采用所述神经网络处理器对所述组合后的特征图进行卷积运算。2.根据权利要求1所述的方法,所述组合后的特征图具有对应的组合特征图标识;所述组合特征图标识用于表示将所述组合后的特征图作为一个整体进行运算。3.根据权利要求2所述的方法,所述采用所述神经网络处理器对所述组合后的特征图进行卷积运算,具体包括:将所述组合后的特征图包含的第二卷积计算向量数量的卷积计算向量发送至所述神经网络处理器中第一数量的算术逻辑单元;所述第一数量大于第二数量;所述第二数量为所述第一卷积计算向量数量的卷积计算向量需要占用的算术逻辑单元的数量;采用所述第一数量的算术逻辑单元对所述组合后的特征图进行卷积运算。4.根据权利要求2所述的方法,所述采用所述神经网络处理器对所述组合后的特征图进行卷积运算,具体包括:将所述组合后的特征图包含的第二卷积计算向量数量的卷积计算向量中第三数量的卷积计算向量发送至所述神经网络处理器中的算术逻辑单元;利用所述算术逻辑单元进行所述第三数量的卷积计算向量的运算;所述第三数量大于第四数量;所述第四数量为所述第一卷积计算向量数量的卷积计算向量中需要发送至所述算术逻辑单元的卷积计算向量的数量。5.根据权利要求1所述的方法,所述将所述多个特征图进行组合之前,还包括:对所述多个特征图中的各个特征图进行像素填充,得到填充后的特征图;所述将所述多个特征图进行组合,具体包括:将各个填充后的特征图进行组合。6.根据权利要求5所述的方法,所述将各个填充后的特征图进行组合,具体包括:将各个填充后的特征图按照预设分块规则进行分块,得到各个填充后的特征图对应的特征块;将所述特征块按照预设组合规则进行组合,得到所述组合后的特征图。7.根据权利要求6所述的方法,所述将各个填充后的特征图按照预设分块规则进行分块,具体包括:将所述各个填充后的特征图中像素最小的填充后的特征图作为分块基准特征图;按照所述分块基准特征图的边长,以所述多个特征图中像素最小的特征图的边长为步长对各个填充后的特征图进行分块。8.根据权利要求7所述的方法,所述将所述特征块按照预设组合规则进行组合,得到所述组合后的特征图,具体包括:将各个特征块以堆叠的方式进行...
【专利技术属性】
技术研发人员:王昌宝,郑丹丹,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。