模型压缩方法及装置、计算机可读介质和电子设备制造方法及图纸

技术编号：37524880 阅读：23 留言：0更新日期：2023-05-12 15:48

本公开提供一种模型压缩方法及装置、计算机可读介质和电子设备，涉及人工智能技术领域。该方法包括：获取预训练的初始神经网络模型；对所述初始神经网络模型进行深度剪枝处理，得到深度剪枝后的初始神经网络模型；对所述深度剪枝后的初始神经网络模型进行宽度剪枝处理，得到宽度剪枝后的初始神经网络模型；将满足预设模型压缩参数的所述宽度剪枝后的初始神经网络模型，确定为目标神经网络模型。本公开能够有效对初始神经网络模型中的冗余结构进行压缩，可以在保证目标神经网络模型的性能和精度的同时，有效减小目标神经网络模型的模型体积，进而提高目标神经网络模型的适用场景。场景。场景。

全部详细技术资料下载

【技术实现步骤摘要】
模型压缩方法及装置、计算机可读介质和电子设备

[0001]本公开涉及人工智能
，具体涉及一种模型压缩方法、模型压缩装置、计算机可读介质和电子设备。

技术介绍

[0002]伴随着科学技术水平的不断提高，深度学习(Deep Learning，DL)技术得到迅速发展。深度学习的目标是学习样本数据的内在规律和表示层次，深度学习的实现一般依赖各种类型的神经网络结构，而随着任务复杂度的提升以及数据量的增大，深度学习模型中的神经网络结构也越来越复杂，通常存在较多的冗余网络，如何对深度学习模型中的冗余网络进行优化是如今面临的巨大难题。
[0003]目前，神经网络优化主要采用通道剪枝的方案，但是该方式对于神经网络模型的压缩力度有限，得到的神经网络模型仍存在冗余网络，同时也不能有效保证剪枝后的神经网络的性能和精度。

技术实现思路

[0004]本公开的目的在于提供一种模型压缩方法、模型压缩装置、计算机可读介质和电子设备，进而上在保证目标神经网络模型的性能和精度的同时，有效减小目标神经网络模型的模型体积。
[0005]根据本公开的第一方面，提供一种模型压缩方法，包括：
[0006]获取预训练的初始神经网络模型；
[0007]对所述初始神经网络模型进行深度剪枝处理，得到深度剪枝后的初始神经网络模型；
[0008]对所述深度剪枝后的初始神经网络模型进行宽度剪枝处理，得到宽度剪枝后的初始神经网络模型；
[0009]将满足预设模型压缩参数的所述宽度剪枝后的初始神经网络模型，确定为...

【技术保护点】

【技术特征摘要】
1.一种模型压缩方法，其特征在于，包括：获取预训练的初始神经网络模型；对所述初始神经网络模型进行深度剪枝处理，得到深度剪枝后的初始神经网络模型；对所述深度剪枝后的初始神经网络模型进行宽度剪枝处理，得到宽度剪枝后的初始神经网络模型；将满足预设模型压缩参数的所述宽度剪枝后的初始神经网络模型，确定为目标神经网络模型。2.根据权利要求1所述的方法，其特征在于，所述预设模型压缩参数包括模型执行效率阈值和输出结果准确率阈值；所述将满足预设压缩参数的所述宽度剪枝后的初始神经网络模型，确定为目标神经网络模型，包括：对所述宽度剪枝后的初始神经网络模型进行验证操作，确定所述宽度剪枝后的初始神经网络模型的模型执行效率以及输出结果准确率；若所述模型执行效率大于或者等于所述模型执行效率阈值，且所述输出结果准确性大于或者等于输出结果准确率阈值，则将所述宽度剪枝后的初始神经网络模型，确定为目标神经网络模型。3.根据权利要求1所述的方法，其特征在于，所述对所述初始神经网络模型进行深度剪枝处理，得到深度剪枝后的初始神经网络模型，包括：基于所述初始神经网络模型中卷积层的可用性，构建神经网络模型搜索空间，所述神经网络模型搜索空间包括2
N
个子网络，其中N为所述卷积层的数量；对所述神经网络模型搜索空间中的所述子网络进行随机采样和网络训练，得到训练好的子网络模型；基于进化搜索的方式和所述预设模型压缩参数，对所述子网络模型中的子网络进行搜索，确定目标子网络，并将所述目标子网络作为所述深度剪枝后的初始神经网络模型。4.根据权利要求3所述的方法，其特征在于，所述对所述神经网络模型搜索空间中的子网络进行随机采样和网络训练，得到训练好的子网络模型，包括：确定所述神经网络模型搜索空间中各子网络的计算量；对所述计算量大于或者等于预设计算量阈值的子网络进行随机采样和网络训练，得到训练...

【专利技术属性】
技术研发人员：樊欢欢，
申请(专利权)人：西安欧珀通信科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人