剪枝参数搜索方法及剪枝方法、装置、设备、介质制造方法及图纸

技术编号：31493411 阅读：13 留言：0更新日期：2021-12-18 12:30

本申请的实施例涉及一种剪枝参数搜索方法及剪枝方法、装置、设备、介质，通过根据预设稀疏度值，对所述预训练模型进行剪枝，获得预剪枝模型；根据所述预训练模型中目标隐藏层的输入变量的均值和协方差值，对所述预剪枝模型进行剪枝补偿，获得补偿模型；根据所述补偿模型的准确率损失情况，调整所述预设稀疏度值，并返回所述根据预设稀疏度值，对所述预训练模型进行剪枝，获得预剪枝模型的步骤，直到循环预设次数，获得目标稀疏度值。解决了现有的神经网络模型剪枝时间成本高的技术问题，提高了神经网络模型剪枝的效率。神经网络模型剪枝的效率。神经网络模型剪枝的效率。

全部详细技术资料下载

【技术实现步骤摘要】
剪枝参数搜索方法及剪枝方法、装置、设备、介质

[0001]本申请涉及机器学习
，具体涉及一种剪枝参数搜索方法及剪枝方法、装置、设备、介质。

技术介绍

[0002]神经网络技术的突飞猛进，为科研、工业、商业、教育、医疗、环保等领域的智能化带来了丰硕成果。在实际应用中，为了加快训练过程收敛，深度神经网络的设计有“过参数化”的倾向，会保留较高的特征通道数，因此，神经网络的隐藏层特征有较多的冗余。
[0003]现有技术中，采用剪枝技术移除部分隐藏层特征通道和关联的模型参数来减小运算量，但必须通过对剪枝后的模型进行重训练来恢复模型的准确率。而剪枝后对模型的重训练，需要耗费大量的时间成本，从而导致剪枝时间成本高。

技术实现思路

[0004]本申请的主要目的在于提供一种剪枝参数搜索方法及剪枝方法、装置、设备、介质，解决现有的神经网络模型剪枝时间成本高的技术问题。
[0005]为实现上述目的，本申请提供一种剪枝参数搜索方法，包括：
[0006]根据预设稀疏度值，对预训练模型进行剪枝，获得预剪枝模型；
[0007]根据所述预训练模型中目标隐藏层的输入变量的均值和目标隐藏层的输入变量的协方差值，对所述预剪枝模型进行剪枝补偿，获得补偿模型；
[0008]根据所述补偿模型的准确率损失情况，调整所述预设稀疏度值，并返回所述根据预设稀疏度值，对预训练模型进行剪枝，获得预剪枝模型的步骤，直到循环预设次数，获得目标稀疏度值。
[0009]可选地，所述根据预设稀疏度值，对预训练模型...

【技术保护点】

【技术特征摘要】
1.一种剪枝参数搜索方法，其特征在于，包括：根据预设稀疏度值，对预训练模型进行剪枝，获得预剪枝模型；根据所述预训练模型中目标隐藏层的输入变量的均值和目标隐藏层的输入变量的协方差值，对所述预剪枝模型进行剪枝补偿，获得补偿模型；根据所述补偿模型的准确率损失情况，调整所述预设稀疏度值，并返回所述根据预设稀疏度值，对预训练模型进行剪枝，获得预剪枝模型的步骤，直到循环预设次数，获得目标稀疏度值。2.根据权利要求1所述的方法，其特征在于，所述根据预设稀疏度值，对预训练模型进行剪枝，获得预剪枝模型的步骤，包括：根据所述预设稀疏度值，进行关于剪枝前后准确率损失的优化求解，获得所述目标隐藏层需要剪去的目标变量；根据所述目标变量，对所述预训练模型进行剪枝，获得预剪枝模型。3.根据权利要求2所述的方法，其特征在于，所述根据所述预设稀疏度值，进行关于剪枝前后准确率损失的优化求解，获得所述目标隐藏层需要剪去的目标变量的步骤，包括：根据所述预设稀疏度值，对下述等式进行优化求解，获得所述目标隐藏层需要剪去的目标变量；其中，W表示剪枝前的权重矩阵；|S|表示被剪枝后残留的输入变量的数量；∑
S，S
，∑
C，S
为输入变量集合C的协方差矩阵∑
C，C
的子矩阵；∑
S，S
表示被剪枝后残留的输入变量集合S所在的行和列形成的子矩阵；∑
C，S
表示输入变量集合C所在行和S所在列形成的子矩阵；μ
C
，μ
S
分别表示C和S的均值向量。4.根据权利要求1或2所述的方法，其特征在于，所述根据所述预训练模型中目标隐藏层的输入变量的均值和目标隐藏层的输入变量的协方差值，对所述预剪枝模型进行剪枝补偿，获得补偿模型的步骤，包括：基于所述输入变量的均值和所述输入变量的协方差值，获得新权重矩阵；基于所述新权重矩阵，获得新偏置权重向量；利用所述新权重矩阵和所述新偏置权重向量替换所述目标隐藏层的权重矩阵和偏置权重向量，获得补偿模型。5.根据权利要求4所述的方法，其特征在于，所述基于所述输入变量的均值和所述输入变量的协方差值，获得新权重矩阵的步骤，包括：基于所述输入变量的均值和所述输入变量的协方差值，利用如下述等式，获得新权重矩阵：其中，W表示剪枝前的权重矩阵；W
′
表示新权重矩阵；∑
S，S
，∑
C，S
为输入变量集合C的协方差矩阵∑
C，C
的子矩阵，∑
S，S
表示被剪枝后残留的输入变量集合S所在的行和列形成的子矩阵，∑
C，S
表示输入变量集合C所在行和S所在列形成的子矩阵；所述基于所述新权重矩阵，获得新偏置权重向量的步骤，包括：基于所述新权重矩阵，利用如下述等式，获得新偏置权重向量：
b
′
＝μ
C
W
‑
μ
S
W
′
+b，其中，b
′
表示新偏置权重向量；b表示剪枝前的偏置权重向量；μ
C
，μ
S
分别表示C和被剪枝后残留的输入变量集合S的均值向量。6.根据权利要求1所述的方法，其特征在于，所述预设稀疏度值为稀疏度上限值和稀疏度下限值的均值；所述根据所述补偿模型的准确率损失情况，调整所述预设稀疏度值，并返回所述根据预设稀疏度值，对所述预训练模型进行剪枝，获得预剪枝模型的步骤，直到循环预设次数，获得目标稀疏度值的步骤，包括：若所述补偿模型的准确率损失值小于准确率损失上限值，则以第一修改稀疏度值...

【专利技术属性】
技术研发人员：ꢀ七四专利代理机构，
申请(专利权)人：成都数联云算科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人