网络模型裁剪方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号：30442494 阅读：30 留言：0更新日期：2021-10-24 18:31

本申请提供一种网络模型裁剪方法、装置、电子设备及可读存储介质，该方法包括：对原始网络模型进行稀疏约束训练；依据同一训练过程中对所述原始网络模型进行不同轮数的稀疏约束训练的训练结果统计N1条裁剪参数

全部详细技术资料下载

【技术实现步骤摘要】
网络模型裁剪方法、装置、电子设备及可读存储介质

[0001]本申请涉及人工智能
，尤其涉及一种网络模型裁剪方法、装置、电子设备及可读存储介质。

技术介绍

[0002]随着人工智能技术的高速发展，依据网络模型执行智能任务，如进行智能检测(如车辆、车牌检测等)的应用越来越普及。由于终端设备的计算资源通常是有限的，若网络模型的结构过于复杂，则其对计算资源的需求会过大，导致终端设备依据该网络模型执行智能任务的速度会比较慢，实时性较差。因此，为了提高终端设备执行智能任务的实时性，可以对终端设备上应用的网络模型进行合理裁剪，而基于稀疏约束的网络模型裁剪是一种较为常用的网络模型裁剪方式。
[0003]稀疏约束是通过训练重构模型参数的一种典型方法，通过将每层网络参数分为多组，并在目标函数中添加稀疏约束的方式，减小一些组的范数，从而达到稀疏的目的。
[0004]目前，基于稀疏约束对网络模型进行裁剪主要包括两种方案：
[0005]1、等权重稀疏约束方案：对网络模型的所有连接使用相同强度的稀疏约束。这种方法的缺点是不能将网络的每一层精确稀疏到指定稀疏度。
[0006]2、变权重稀疏约束方案：对网络模型的不同连接使用不同强度的稀疏约束，从而，将网络的每层精确稀疏到指定稀疏度。
[0007]然而实践发现，传统变权重稀疏约束方案需要人工设定网络模型各层的裁剪比例，无法实现自动裁剪，导致终端设备依据网络模型执行智能任务的实时性较差。

技术实现思路

[0008]有鉴于此，本申请提供一种网...

【技术保护点】

【技术特征摘要】
1.一种网络模型裁剪方法，其特征在于，包括：对原始网络模型进行稀疏约束训练；依据同一训练过程中对所述原始网络模型进行不同轮数的稀疏约束训练的训练结果统计N1条裁剪参数
‑
优化目标量曲线，直至统计得到的裁剪参数
‑
优化目标量曲线满足预设停止规则；其中，基于任一训练结果统计得到的裁剪参数
‑
优化目标量曲线，用于表征该训练结果按照不同裁剪参数进行裁剪后的优化目标量，裁剪参数与该训练结果的各层的裁剪比例正相关，N1≥2，所述预设停止规则包括目标裁剪参数随着训练轮数增加的变化幅度不超过预设取值范围，目标裁剪参数为使裁剪后的网络模型的计算量等于预设裁后计算量的裁剪参数；依据所述N1条裁剪参数
‑
优化目标量曲线，以及预设裁后优化目标量，确定第一目标裁剪参数；依据所述第一目标裁剪参数确定各层的裁剪比例；依据所述各层的裁剪比例，对所述原始网络模型进行变权重稀疏约束训练，得到所述原始网络模型对应的稀疏模型，并依据所述各层的裁剪比例对所述稀疏模型进行裁剪。2.根据权利要求1所述的方法，其特征在于，所述依据同一训练过程中对所述原始网络模型进行不同轮数的稀疏约束训练的训练结果统计N1条裁剪参数
‑
优化目标量曲线，包括：同一训练过程中，每隔预设轮数，依据对所述原始网络模型进行当前轮数的稀疏约束训练的训练结果统计裁剪参数
‑
优化目标量曲线。3.根据权利要求1所述的方法，其特征在于，所述统计得到的裁剪参数
‑
优化目标量曲线满足预设停止规则，包括：相邻第二目标裁剪参数的差值满足预设停止规则；其中，对于统计得到的任一裁剪参数
‑
优化目标量曲线，该裁剪参数
‑
优化目标量曲线对应的第二目标裁剪参数为依据所述预设裁后优化目标量以及该裁剪参数
‑
优化目标量曲线确定的裁剪参数。4.根据权利要求3所述的方法，其特征在于，所述相邻第二目标裁剪参数的差值满足预设停止规则，包括：连续N2个第二目标裁剪参数中，相邻第二目标裁剪参数的差值小于预设阈值，2≤N2≤N1。5.根据权利要求4所述的方法，其特征在于，所述依据所述N1条裁剪参数
‑
优化目标量曲线，以及预设裁后优化目标量，确定第一目标裁剪参数，包括：依据所述连续N2个第二目标裁剪参数，确定所述第一目标裁剪参数。6.根据权利要求1所述的方法，其特征在于，所述依据所述第一目标裁剪参数确定各层的裁剪比例，包括：对于所述原始网络模型中通道数为A的层i，依据以下策略确定层i的裁剪比例r：r＝a/A其中，R为所述第一目标裁剪参数，y＝f(x)为对层i各通道的L2 norm按照从小到大进行排序后对应的曲线，对于任一通道，该通道的L2 norm为该通道所有元素的平方和。
7.一种网络模型裁剪装置，其特征在于，包括：预训练单元，用于对原始网络模型进行稀疏约束训练；统计单元，用于依据同一训练过程中对所述原始网络模型进行不同轮数的稀疏约束训练的训练结果统...

【专利技术属性】
技术研发人员：张顺，李哲暘，彭博，谭文明，任烨，
申请(专利权)人：杭州海康威视数字技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人