一种基于贪心策略反向通道剪枝的图像处理方法及装置制造方法及图纸

技术编号：39327708 阅读：9 留言：0更新日期：2023-11-12 16:05

本发明专利技术公开了一种基于贪心策略反向通道剪枝的图像处理方法及装置，该方法包括：获取图像数据集和待剪枝图像处理网络，对待剪枝图像处理网络进行预训练，得到预训练模型，其中预训练过程中所使用的图像集与图像数据集分布相似或相同；将预训练模型划分为特征提取量化模块和输出模块，其中特征提取量化模块作为剪枝对象；根据基于贪心策略的通道选择方法对特征提取量化模块进行反向的逐层通道剪枝，并在每层剪枝完成后进行预定轮次的微调；对进行反向的逐层通道剪枝后的预训练模型在图像数据集上进行一定轮次的微调，得到微调后的图像处理模型；将微调后的图像处理模型部署于终端，以通过微调后的图像处理模型进行图像处理。理。理。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于贪心策略反向通道剪枝的图像处理方法及装置

[0001]本专利技术属于深度学习模型压缩与推理加速领域，尤其涉及一种基于贪心策略反向通道剪枝的图像处理方法及装置。

技术介绍

[0002]深度学习是通过构建人工神经网络对样本数据的内在规律和表示层次进行学习的算法，它通过数据驱动使机器学习样本特征来替代传统的人工提取特征。它目前尤其被广泛应用在图像处理领域。深度学习通过提高模型复杂度来满足图像处理任务对精度的要求，但是通常会同时造成更多的模型参数、需要更大的运行内存以及极大的运算量，最终导致模型难以部署到资源受限的计算平台，也难以满足如自动驾驶任务对实时性的要求。
[0003]模型剪枝通过移除模型中大量冗余参数在几乎不损失精度的情况下减少模型所需的资源，提高图像处理任务的实时性能。传统的按照从输入层到输出层的逐层剪枝方法会造成剪枝造成的误差逐渐积累，使得位置上越靠后的卷积层受到更多误差的影响。但是靠近输出的卷积层通常包含更多的卷积核和更大的感受野，能够捕捉更广阔的上下文信息，并且可以将前面层次提取的特征进行组合和整合，形成更加复杂的高级特征表示。因此，靠近输出的卷积层可能对最终的效果产生更为显著的影响。为了减小靠近输出卷积层受剪枝误差的影响，本专利技术提出基于贪心策略从输出层到输入层的反向通道剪枝方法。

技术实现思路

[0004]针对现有技术存在的问题，本申请实施例的目的是提供一种基于贪心策略反向通道剪枝的图像处理方法及装置，从特征提取量化模块最后一层开始指导前一层的通道剪枝。
[00...

【技术保护点】

【技术特征摘要】
1.一种基于贪心策略反向通道剪枝的图像处理方法，其特征在于，包括：获取图像数据集和待剪枝图像处理网络，对所述待剪枝图像处理网络进行预训练，得到预训练模型；将所述预训练模型划分为特征提取量化模块和输出模块，其中所述特征提取量化模块作为剪枝对象；根据基于贪心策略的通道选择方法对所述特征提取量化模块进行反向的逐层通道剪枝，并在每层剪枝完成后进行预定轮次的微调；对进行反向的逐层通道剪枝后的预训练模型在所述图像数据集上进行预定轮的微调，得到微调后的图像处理模型；将所述微调后的图像处理模型部署于终端，以通过所述微调后的图像处理模型进行图像处理。2.根据权利要求1所述的方法，其特征在于，步骤（1）中，所述图像数据集中，每个图像样本表示为，其中，n为所述图像数据集中图像样本的数量，表示图像的像素值，表示图像对应的标签。3.根据权利要求1所述的方法，其特征在于，所述特征提取量化模块为所述预训练模型中用于处理模型的输入并输出抽象化的向量表示特征的模块，所述输出模块为所述预训练模型中用于将所述特征提取量化模块输出的向量处理为应用场景下的输出类型。4.根据权利要求1所述的方法，其特征在于，根据基于贪心策略的通道选择方法对所述特征提取量化模块进行反向的逐层通道剪枝，具体为：从所述特征提取量化模块的最后一层开始，按从后往前的顺序依次将每一层作为操作层，并对所述操作层通过基于贪心策略的通道选择方法进行剪枝，直至所述特征提取量化模块的第一层剪枝完毕。5.根据权利要求1所述的方法，其特征在于，对于第i层剪枝时，所述基于贪心策略的通道选择方法包括：（a）初始化剪枝集合、保留集合并设置剪枝比率；（b）判断所述剪枝集合中的通道数占第i层总通道数的比率是否达到所述剪枝比率；（c）若未达到，则通过计算通道剪枝前后的误差，找出所述剪枝集合的补集中剪枝前后影响最小的通道，将该通道移动至所述剪枝集合中，返回至步骤（b）；（d）若已达到，则在第i层中移除所述剪枝集合中的所有通道。6.根据权利要求5所述的方法，其特征在于，根...

【专利技术属性】
技术研发人员：刁博宇，杨雨，李超，
申请(专利权)人：之江实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人