模型剪枝方法、装置、计算机设备、存储介质和程序产品制造方法及图纸

技术编号：38129101 阅读：10 留言：0更新日期：2023-07-08 09:35

本申请涉及一种模型剪枝方法、装置、计算机设备、存储介质和程序产品。所述方法包括：获取待剪枝处理的源模型对应的初始模型集合，所述初始模型集合中的各初始模型是利用各初始剪枝算法分别对所述源模型进行剪枝处理得到的；将所述初始模型集合作为当前模型集合，进行迭代学习，对于每次迭代过程，从当前模型集合中确定目标模型和参考模型，利用所述参考模型训练所述目标模型，并利用训练后的目标模型更新当前模型集合，直至得到目标模型集合；基于目标模型集合和筛选条件，确定源模型对应的剪枝处理后的模型。采用本方法能够在提升剪枝效率的同时保证剪枝后的模型的性能。效率的同时保证剪枝后的模型的性能。效率的同时保证剪枝后的模型的性能。

全部详细技术资料下载

【技术实现步骤摘要】
模型剪枝方法、装置、计算机设备、存储介质和程序产品

[0001]本申请涉及模型剪枝
，特别是涉及一种模型剪枝方法、装置、计算机设备、存储介质和程序产品。

技术介绍

[0002]模型剪枝(Model Pruning)技术可以减少神经网络模型(以下简称为源模型)的参数量，在模型的轻量化部署中有着广泛应用。模型剪枝的主要流程是：按照压缩比要求为源模型中需要剪枝的权重层分配压缩比，再衡量每个权重层中不同维度的权重的重要性，删除重要性较低的权重，保留重要性较高的权重。
[0003]目前，已经存在多种剪枝算法，若需要为某个源模型进行模型剪枝，相关技术中，通常分别训练各个剪枝算法，训练完成后再从中选择最优解作为剪枝模型对源模型进行模型剪枝。
[0004]然而，在具体的业务场景中，不仅要考虑剪枝处理后的模型的性能，还需要兼顾剪枝效率，上述模型剪枝方式存在剪枝效率低的问题。

技术实现思路

[0005]本申请实施例提供了一种模型剪枝方法、装置、计算机设备、存储介质和程序产品，可以在提升剪枝效率的同时保证剪枝后的模型的性能。
[0006]第一方面，提供了一种模型剪枝方法，该方法包括：
[0007]获取待剪枝处理的源模型对应的初始模型集合，所述初始模型集合中的各初始模型是利用各初始剪枝算法分别对所述源模型进行剪枝处理得到的；
[0008]将所述初始模型集合作为当前模型集合，进行迭代学习，对于每次迭代过程，从当前模型集合中确定目标模型和参考模型，利用所述参考模型训练所述目标模型，并...

【技术保护点】

【技术特征摘要】
1.一种模型剪枝方法，其特征在于，包括：获取待剪枝处理的源模型对应的初始模型集合，所述初始模型集合中的各初始模型是利用各初始剪枝算法分别对所述源模型进行剪枝处理得到的；将所述初始模型集合作为当前模型集合，进行迭代学习，对于每次迭代过程，从当前模型集合中确定目标模型和参考模型，利用所述参考模型训练所述目标模型，并利用训练后的目标模型更新当前模型集合，直至得到目标模型集合；基于所述目标模型集合和筛选条件，确定所述源模型对应的剪枝处理后的模型。2.根据权利要求1所述的方法，其特征在于，所述利用所述参考模型训练所述目标模型，包括：获取所述参考模型针对目标输入样本的参考输出结果，并获取所述目标模型针对所述目标输入样本的目标输出结果；根据所述参考输出结果、所述目标输出结果和预设机器学习算法训练所述目标模型。3.根据权利要求2所述的方法，其特征在于，所述根据所述参考输出结果、所述目标输出结果和预设机器学习算法训练所述目标模型，包括：根据所述参考输出结果、所述目标输出结果和所述预设机器学习算法对应的损失函数计算损失值；根据所述损失值调整所述目标模型的模型参数。4.根据权利要求3所述的方法，其特征在于，所述根据所述参考输出结果、所述目标输出结果和所述预设机器学习算法对应的损失函数计算损失值，包括：获取所述参考模型和所述目标模型之间的匹配度；将所述参考输出结果、所述目标输出结果和所述匹配度输入至所述损失函数中，得到所述损失值，所述匹配度的大小与所述损失值的大小负相关。5.根据权利要求2
‑
4任一项所述的方法，其特征在于，所述预设机器学习算法为蒸馏学习算法。6.根据权利要求1所述的方法，其特征在于，所述从当前模型集合中确定目标模型和参考模型，包括：从当前模型集合中随机选取出所述目标模型；对于当前模型集合中的每个其他模型，利用匹配网络计算所述目标模型和所述其他模型之间的匹配度；若所述匹配度大于预设匹配度阈值，则确定所述其他模型为所述参考模型。7.根据权利要求6所述的方法，其特征在于，所述方法还包括：根据所述目标模型的输出和所述参考模型的输出，对所述匹配网络的网络参数进行更新。8.根据权利要求7所述的方法，其特征在于，对所述匹配网络的网络参数进行更新的更新频率大于或者等于所述迭代学习的迭代频率。9.根据权利要求1所述的方法，其特征在于，所述利用训练后的目标模型更新当前模型集合，包括：在当前模型集合中确定候选模型，所述候选模型的性能指标值小于所述训练后的目标模型的性能指标值；
在当前模型集合中利用所述训练后的目标模型替换所述候选模型。10.根据权利要求1所述的方法，其特征在于，所述获取待剪枝处理的源模型对应的初始模型集合，包括：将各所述初始剪枝算法的超参数设置为随机值；对于每个所述初始剪枝算法，利用所述初始剪枝算法和目标压缩比对所述源模型进行剪枝处理得到初始模型...

【专利技术属性】
技术研发人员：董旭炯，
申请(专利权)人：哲库科技上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人