图像分类卷积神经网络剪枝方法及芯粒器件数据分配方法组成比例

技术编号:38152481 阅读:10 留言:0更新日期:2023-07-13 09:17
本发明专利技术涉及图像处理技术领域,特别涉及一种图像分类卷积神经网络剪枝方法及芯粒器件数据分配方法,其中剪枝方法包括:获取训练好的原始模型;对每层网络中的各滤波器分别进行聚类,得到第一聚类结果;对原始模型进行随机剪枝;对模型进行重训练,并对每层网络中的各滤波器分别进行聚类,得到当前的第二聚类结果;对当前模型进行重剪枝;测试重剪枝后的模型,若识别准确率下降超过预设阈值,则根据第一聚类结果和增枝率新增加滤波器,再进行训练,对每层网络中的各滤波器分别进行聚类,更新当前的第二聚类结果后,返回重剪枝的步骤,否则结束剪枝,得到最终的模型。本发明专利技术能够对大型神经网络进行压缩以减少算力。大型神经网络进行压缩以减少算力。大型神经网络进行压缩以减少算力。

【技术实现步骤摘要】
图像分类卷积神经网络剪枝方法及芯粒器件数据分配方法


[0001]本专利技术涉及图像处理
,特别涉及一种图像分类卷积神经网络剪枝方法及芯粒器件数据分配方法。

技术介绍

[0002]卷积神经网络(CNN)是深度学习中的常见模型,在图像处理中应用广泛,能够提取图像特征,实现图像分类。增加神经网络复杂度,可提升模型性能,但同时伴随着高额的存储空间与计算资源消耗,这限制了深度神经网络在移动端上的使用。
[0003]已有研究表明,卷积神经网络模型中存在大量冗余滤波器,参与主要计算并对最终结果产生影响的只占总数5%~10%。神经网络压缩旨在不影响神经网络性能的前提下,通过降低模型的复杂度以减少算力,实现神经网络在移动端等设备上的应用。

技术实现思路

[0004]针对上述至少一部分不足之处,本专利技术实施例提供了一种图像分类卷积神经网络剪枝方法,能够对大型卷积神经网络进行剪枝以实现网络压缩。
[0005]第一方面,本专利技术实施例提供了一种图像分类卷积神经网络剪枝方法,包括如下步骤:获取已经训练好的用于进行图像分类识别的原始卷积神经网络模型;根据滤波器的相似性,对所述原始卷积神经网络模型每层网络中的各滤波器分别进行聚类,得到第一聚类结果;根据预设的第一剪枝率,对所述原始卷积神经网络模型中的滤波器进行随机剪枝;所述第一剪枝率包括每层网络的剪枝率;对随机剪枝后的卷积神经网络模型进行重训练,并根据滤波器的相似性,对重训练后的卷积神经网络模型每层网络中的各滤波器分别进行聚类,得到当前的第二聚类结果;根据当前的第二聚类结果和预设的第二剪枝率,对当前卷积神经网络模型中的滤波器进行重剪枝;所述第二剪枝率包括每层网络的剪枝率,且每层网络的剪枝率均不超过所述第一剪枝率中对应层网络的剪枝率;确定重剪枝后的卷积神经网络模型的识别准确率相比随机剪枝后的卷积神经网络模型的识别准确率,是否下降超过预设阈值;若是,则根据所述第一聚类结果和预设增枝率,对重剪枝后的卷积神经网络模型新增加滤波器,并对新增加滤波器的卷积神经网络模型进行再训练;根据滤波器的相似性,对再训练后的卷积神经网络模型每层网络中的各滤波器分别进行聚类,得到当前的第二聚类结果后,基于当前的第二聚类结果返回执行所述重剪枝的步骤;若否,则结束剪枝,将当前得到的卷积神经网络模型作为最终的卷积神经网络模型。
[0006]可选地,每层网络中的各滤波器的聚类方式为:对该层网络中各滤波器的三维权重矩阵进行降维,将三维权重矩阵的高度维度压缩为1;压缩后得到的二维权重矩阵宽度维度不变,行向量对应滤波器通道,相应权值变为高度维度上的权值平均值;以对应的压缩后二维权重矩阵之间的相似度作为损失函数进行计算,得到n个聚类;n为根据需要设置的聚类类别数。
[0007]可选地,两个二维权重矩阵之间的相似度通过如下方式计算:逐行计算一个二维权重矩阵的行向量与另一个二维权重矩阵的每一行向量之间的马氏距离;对所有马氏距离求和,作为两个二维权重矩阵之间的相似度。
[0008]可选地,所述对随机剪枝后的卷积神经网络模型进行重训练,包括:初始化随机剪枝后的卷积神经网络模型中滤波器的权重;采用训练所述原始卷积神经网络模型的图像样本集,重新训练随机剪枝后的卷积神经网络模型至收敛。
[0009]可选地,所述根据当前的第二聚类结果和预设的第二剪枝率,对当前卷积神经网络模型中的滤波器进行重剪枝,包括:针对每层网络均执行如下操作:根据所述第二剪枝率,确定该层网络对应的剪枝率;根据当前的第二聚类结果,确定该层网络中各聚类类别对应滤波器的数量;根据该层网络对应的剪枝率及各聚类类别对应滤波器的数量,为各聚类类别分配剪除滤波器指标,分配的剪除滤波器指标与相应聚类类别中滤波器的数量成正比;根据分配的剪除滤波器指标,对各聚类类别随机剪除滤波器。
[0010]可选地,所述根据所述第一聚类结果和预设增枝率,对重剪枝后的卷积神经网络模型新增加滤波器,包括:针对每层网络均执行如下操作:根据所述预设增枝率,确定该层网络对应的增枝率;根据所述第一聚类结果,确定该层网络中各聚类类别对应滤波器的数量;根据该层网络对应的增枝率及各聚类类别对应滤波器的数量,为各聚类类别分配新增滤波器指标,分配的新增滤波器指标与相应聚类类别中滤波器的数量成正比;根据分配的新增滤波器指标,对各聚类类别新增滤波器;其中,新增滤波器从所述第一聚类结果中同一聚类类别下的滤波器中随机选择,且不与该层网络中已有滤波器重复。
[0011]可选地,所述对新增加滤波器的卷积神经网络模型进行再训练,包括:对于原有滤波器,保留其在重训练的卷积神经网络模型中的权重;对于新增滤波器,保留其在所述原始卷积神经网络模型中的权重;继续训练当前的卷积神经网络模型至收敛。
[0012]第二方面,本专利技术实施例还提供了一种芯粒器件数据分配方法,应用于芯粒器件;所述芯粒器件包括输入输出端、集中缓存区、微控制器和多个芯粒资源单元;所述输入输出端用于交互数据,所述集中缓存区用于缓存数据,所述微控制器用于根据输入指令控制芯
粒资源单元的连接关系,多个所述芯粒资源单元呈阵列式排布;该芯粒器件数据分配方法包括如下步骤:获取待分配芯粒器件的算力资源统计表;所述算力资源统计表的记载信息包括各芯粒资源单元的尺寸、位置、连接关系及算力大小;基于如上述任一项所述的图像分类卷积神经网络剪枝方法得到的最终的卷积神经网络模型,构建对应的有向无环图;所述有向无环图用于表示卷积神经网络模型中各算子的运算顺序;基于所述有向无环图和所述算力资源统计表,为各芯粒资源单元分配计算任务;各芯粒资源单元采用权重固定数据流进行计算;监控芯粒器件的工作状态,并定期基于芯粒器件的工作状态重新为各芯粒资源单元分配计算任务。
[0013]第三方面,本专利技术实施例还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时,实现本说明书任一实施例所述的方法。
[0014]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行本说明书任一实施例所述的方法。
[0015]本专利技术实施例提供了一种图像分类卷积神经网络剪枝方法、电子设备及存储介质,本专利技术先对原始卷积神经网络进行随机剪枝,以快速压缩网络规模,然后依据滤波器的相似性进行有限制性的剪枝,以剪除可替代性高的滤波器并尽量保持模型精度,最后测试模型性能,若性能不佳,则依据滤波器的相似性再为模型新增滤波器,通过反复调整,能够得到性能较佳且规模较小的神经网络模型,有效减少图像分类卷积神经网络所需算力,为其在移动端等设备上应用提供技术支持。
[0016]本专利技术实施例还提供了一种芯粒器件数据分配方法,将剪枝后的卷积神经网络模型运算任务分配给不同的芯粒单元执行,能够实现数据的并行处理,提高处理效率,为在移动端等设备上使用深度卷积神经网络提供了技术支持。
附图说明
[0017]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像分类卷积神经网络剪枝方法,其特征在于,包括如下步骤:获取已经训练好的用于进行图像分类识别的原始卷积神经网络模型;根据滤波器的相似性,对所述原始卷积神经网络模型每层网络中的各滤波器分别进行聚类,得到第一聚类结果;根据预设的第一剪枝率,对所述原始卷积神经网络模型中的滤波器进行随机剪枝;所述第一剪枝率包括每层网络的剪枝率;对随机剪枝后的卷积神经网络模型进行重训练,并根据滤波器的相似性,对重训练后的卷积神经网络模型每层网络中的各滤波器分别进行聚类,得到当前的第二聚类结果;根据当前的第二聚类结果和预设的第二剪枝率,对当前卷积神经网络模型中的滤波器进行重剪枝;所述第二剪枝率包括每层网络的剪枝率,且每层网络的剪枝率均不超过所述第一剪枝率中对应层网络的剪枝率;确定重剪枝后的卷积神经网络模型的识别准确率相比随机剪枝后的卷积神经网络模型的识别准确率,是否下降超过预设阈值;若是,则根据所述第一聚类结果和预设增枝率,对重剪枝后的卷积神经网络模型新增加滤波器,并对新增加滤波器的卷积神经网络模型进行再训练;根据滤波器的相似性,对再训练后的卷积神经网络模型每层网络中的各滤波器分别进行聚类,得到当前的第二聚类结果后,基于当前的第二聚类结果返回执行所述重剪枝的步骤;若否,则结束剪枝,将当前得到的卷积神经网络模型作为最终的卷积神经网络模型。2.根据权利要求1所述的方法,其特征在于,每层网络中的各滤波器的聚类方式为:对该层网络中各滤波器的三维权重矩阵进行降维,将三维权重矩阵的高度维度压缩为1;压缩后得到的二维权重矩阵宽度维度不变,行向量对应滤波器通道,相应权值变为高度维度上的权值平均值;以对应的压缩后二维权重矩阵之间的相似度作为损失函数进行计算,得到n个聚类;n为根据需要设置的聚类类别数。3.根据权利要求2所述的方法,其特征在于,两个二维权重矩阵之间的相似度通过如下方式计算:逐行计算一个二维权重矩阵的行向量与另一个二维权重矩阵的每一行向量之间的马氏距离;对所有马氏距离求和,作为两个二维权重矩阵之间的相似度。4.根据权利要求1所述的方法,其特征在于,所述对随机剪枝后的卷积神经网络模型进行重训练,包括:初始化随机剪枝后的卷积神经网络模型中滤波器的权重;采用训练所述原始卷积神经网络模型的图像样本集,重新训练随机剪枝后的卷积神经网络模型至收敛。5.根据权利要求4所述的方法,其特征在于,所述根据当前的第二聚类结果和预设的第二剪枝率,对当前卷积神经网络模型中的滤波器进行重剪枝,包括:针对每层网络均执行如下操作:根据所述第二剪枝率,确定该层网络对应的剪枝率;根据当前的第二聚类结果,确定该层网络中各聚类类别对应滤波器的数量;
...

【专利技术属性】
技术研发人员:王嘉诚张少仲张栩
申请(专利权)人:中诚华隆计算机技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1