The embodiment of this application discloses a convolution core processing method and device. Firstly, the target pruning template is determined according to the size of the convolution core in the convolution neural network. The target pruning template includes a pruning matrix, which includes 0 and 1. Then, the target pruning matrix is determined from the target pruning template, and the convolution core is pruned by the target pruning matrix, which will soon be preserved. The convolution kernel corresponding to the position of 1 in the target pruning matrix is retained, and the convolution core corresponding to the position of 0 in the target pruning matrix is discarded. The retained convolution core is the convolution core which has a greater impact on the output results, and the discarded convolution core is the convolution core which has no impact on the output results. It can be seen that by defining pruning template, the problem of fragmentation of memory reading caused by random pruning position in traditional pruning algorithm is solved, which affects the speed of data reading and computing performance, thus improving the performance of data reading and the operation performance of convolutional neural network.
【技术实现步骤摘要】
一种卷积核处理方法及装置
本申请涉及计算机
,具体涉及一种卷积核处理方法及装置。
技术介绍
随着深度学习的不断发展,越来越受到计算机视觉、自然语言处理以及语音识别等众多领域的重视,尤其是卷积神经网络。其中,卷积神经网络内部包括多个卷积核,以利用多个卷积核对输入数据进行特征提取,进而利用提取的特征获取结果。一般来讲,卷积核越多,提取的特征越多,最终所获得结果越精确。然而,卷积核增多时,导致计算量较大,所消耗的计算资源也在增加,使得计算效率较低。因此,如何在不影响输出结果准确性的前提下,对卷积核进行处理以减少计算量是亟待解决的技术问题。
技术实现思路
有鉴于此,本申请实施例提供一种卷积核处理方法及装置,以实现在不影响输出结果的条件下,减少计算量、提高计算速度。为解决上述问题,本申请实施例提供的技术方案如下:在本申请实施例的第一方面,提供了一种卷积核处理方法,所述方法包括:根据卷积核尺寸确定目标剪枝模板;所述目标剪枝模板中包括至少一个剪枝矩阵;所述剪枝矩阵包括0和1,所述剪枝矩阵中1依次相连;所述剪枝矩阵中1的数量小于所述卷积核尺寸且不小于1;从所述目标剪枝模板中确定 ...
【技术保护点】
1.一种卷积核处理方法,其特征在于,所述方法包括:根据卷积核尺寸确定目标剪枝模板;所述目标剪枝模板中包括至少一个剪枝矩阵;所述剪枝矩阵包括0和1,所述剪枝矩阵中1依次相连;所述剪枝矩阵中1的数量小于所述卷积核尺寸且不小于1;从所述目标剪枝模板中确定目标剪枝矩阵;根据所述目标剪枝矩阵对所述卷积核进行剪枝处理,将目标剪枝矩阵中为1的位置对应的卷积核保留,为0的位置对应的卷积核舍弃。
【技术特征摘要】
1.一种卷积核处理方法,其特征在于,所述方法包括:根据卷积核尺寸确定目标剪枝模板;所述目标剪枝模板中包括至少一个剪枝矩阵;所述剪枝矩阵包括0和1,所述剪枝矩阵中1依次相连;所述剪枝矩阵中1的数量小于所述卷积核尺寸且不小于1;从所述目标剪枝模板中确定目标剪枝矩阵;根据所述目标剪枝矩阵对所述卷积核进行剪枝处理,将目标剪枝矩阵中为1的位置对应的卷积核保留,为0的位置对应的卷积核舍弃。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:对所述卷积核的权重进行初始化,目标剪枝矩阵中为1的位置对应的所述卷积核权重设置为原始值,目标剪枝矩阵中为0的位置对应的所述卷积核权重值设置为0;根据卷积神经网络结构以及所述卷积核权重进行前向传播计算,获得所述卷积神经网络的输出损失量;判断所述输出损失量是否小于或等于预设阈值;如果是,保存所述卷积神经网络中所述卷积核的权重。3.根据权利要求2所述的方法,其特征在于,当所述输出损失量大于预设阈值时,所述方法还包括:根据所述输出损失量以及所述卷积神经网络结构进行反向传播计算,获得所述卷积核权重变化量;根据所述目标剪枝矩阵以及所述卷积核权重变化量对所述卷积核权重进行更新;根据所述卷积神经网络结构以及所述卷积核权重再次进行前向传播计算,获得输出损失量。4.根据权利要求3所述的方法,其特征在于,所述根据所述目标剪枝矩阵以及所述卷积核权重变化量对所述卷积核权重进行更新,包括:将所述卷积核权重变化量与所述卷积核权重的原始值之和作为所述卷积核更新后的原始值。5.根据权利要求...
【专利技术属性】
技术研发人员:贾书军,程帅,袁淮,刘威,
申请(专利权)人:东软睿驰汽车技术沈阳有限公司,
类型:发明
国别省市:辽宁,21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。