基于图像检测模型训练的剪枝方法及装置制造方法及图纸

技术编号：36183087 阅读：15 留言：0更新日期：2022-12-31 20:41

本发明专利技术提供一种基于图像检测模型训练的剪枝方法及装置，涉及图像处理技术领域，该方法包括：将图像训练集输入图像检测模型，计算损失值；根据损失值计算所述图像检测模型的待剪枝各层中参数矩阵的第一梯度；根据预设的稀疏化比率，确定待剪枝层的参数矩阵中的待稀疏化参数；根据待稀疏化参数生成掩膜矩阵；根据掩膜矩阵和预设的正则化项更新待稀疏化参数的梯度为第二梯度；根据第二梯度更新待剪枝层中的待稀疏化参数，根据所述第一梯度更新其它参数的梯度，以更新待剪枝各层的参数矩阵，按预设的迭代次数N，迭代上述步骤N次，以完成剪枝，并得到训练完成的图像检测模型。本发明专利技术无需模型预训练和fine

全部详细技术资料下载

【技术实现步骤摘要】
基于图像检测模型训练的剪枝方法及装置

[0001]本专利技术涉及图像处理
，尤其涉及一种基于图像检测模型训练的剪枝方法及装置。

技术介绍

[0002]目前，图像检测模型主要用于对图像进行识别，从中识别出想要的目标，例如：自动驾驶系统中的行人检测模型，从车辆拍摄的图像中识别出行人，以便自动驾驶系统采集相应的安全措施。大多图像检测模型都是根据深度学习模型为基础模型训练得到。因此，图像检测模型具有复杂的结构，复杂的结构也赋予了图像检测模型从大量的训练集中学习高级语义特征的能力，同时复杂的结构带来了一系列的问题：(1)对于层数和神经元数量较多的深度网络，计算延迟难以达到应用的标准，尤其是对于一些实时任务；(2)深度模型的部署从笨重的服务器上逐渐扩展到像可穿戴设备、手机、车载设备、机器人、无人机等终端设备上，此类设备对计算能力和内存空间有严格限制，因此降低模型的大小以及计算花销成为一个有前景的课题。
[0003]在人脑的研究中发现，人脑中的神经元突触会随着年龄的增长，先增加后减少一些无用突触，根据这个现象，引出了模型剪枝问题。
[0004]模型剪枝是模型压缩领域的常用方法，用于压缩模型大小和加速模型计算，现有的模型剪枝方法中大多需要基于预训练模型进行剪枝，且在剪枝训练后都需要fine
‑
tune训练，即常规剪枝流程：模型预训练—>剪枝稀疏化训练—>剪枝fine
‑
tune(微调)训练。可见，模型预训练和fine
‑
tune训...

【技术保护点】

【技术特征摘要】
1.一种基于图像检测模型训练的剪枝方法，其特征在于，包括：将图像训练集输入图像检测模型，计算损失值；根据所述损失值计算所述图像检测模型的各层中参数矩阵的第一梯度；根据预设的稀疏化比率，确定待剪枝层的参数矩阵中的待稀疏化参数；根据所述待稀疏化参数生成掩膜矩阵；根据所述掩膜矩阵和预设的正则化项更新所述待稀疏化参数的梯度为第二梯度；根据所述第二梯度更新待剪枝层中的所述待稀疏化参数，根据所述第一梯度更新待剪枝层中的其它参数及其它各层中的参数，以更新各层的参数矩阵，按预设的迭代次数N，迭代上述步骤N次，以完成剪枝，并得到训练完成的图像检测模型，N为大于1的整数。2.根据权利要求1所述的基于图像检测模型训练的剪枝方法，其特征在于，根据预设的稀疏化比率，确定待剪枝层的参数矩阵中的待稀疏化参数，包括：将待剪枝层的参数矩阵中的参数按其绝对值由小到大排序；选择前n
×
r个参数为所述待稀疏化参数，其中，n为所述参数矩阵中参数总个数，r为所述稀疏化比率。3.根据权利要求1所述的基于图像检测模型训练的剪枝方法，其特征在于，根据所述掩膜矩阵和预设的正则化项更新所述待稀疏化参数的梯度为第二梯度，包括：根据所述参数矩阵和所述掩膜矩阵确定所述正则化项；根据所述掩膜矩阵、所述正则化项和预设的正则化项的更新系数更新所述待稀疏化参数的梯度为第二梯度。4.根据权利要求1所述的基于图像检测模型训练的剪枝方法，其特征在于，所述图像检测模型为行人检测模型。5.根据权利要求4所述的基于图像检测模型训练的剪枝方法，其特征在于，所述计算损失值，包括：计算用于预测图像中目标框的类别的第一损失函数；计算用于预测所述目标框的中心位置...

【专利技术属性】
技术研发人员：陆强，
申请(专利权)人：嬴彻星创智能科技上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人