System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 网络模型裁剪方法及装置制造方法及图纸_技高网

网络模型裁剪方法及装置制造方法及图纸

技术编号:41384456 阅读:4 留言:0更新日期:2024-05-20 19:05
本申请公开了一种网络模型裁剪方法及装置,方法包括根据嵌入式平台对所运行待裁剪网络模型所要求的通道对齐方式,确定所述待裁剪网络模型至少一个卷积层内的待裁剪通道数量;根据所述待裁剪通道数量和所述嵌入式平台对所述待裁剪网络模型的耗时要求,确定所述待裁剪网络模型在裁剪所述待裁剪通道数量后所对应的目标损失函数;根据所述待裁剪通道数量对所述待裁剪网络模型进行裁剪,并通过所述目标损失函数对进行裁剪后的裁剪后模型进行训练。

【技术实现步骤摘要】

本申请属于网络模型,具体涉及一种网络模型裁剪方法及装置


技术介绍

1、随着训练图像的数量越来越多,网络模型越来越深,模型的性能也越来越好。但是在网络性能提升的同时,网络的耗时也在逐步增加,网络运行所占用的磁盘空间和内存消耗也越来越多,因此训练得到的网络模型难以直接运用到嵌入式设备等移动端设备中去。对模型进行压缩与加速的技术得到广泛发展,而模型裁剪技术便是其中最广泛的研究方向之一。

2、模型结构化裁剪技术大多需要手动指定或通过某个指标来确定每个网络层的裁剪率,但是设定的裁剪率很难精确的满足嵌入式设备的耗时要求,得到的裁剪模型并非最优的裁剪结果。


技术实现思路

1、本申请实施例提供一种网络模型裁剪方法及装置,以解决现有的网络模型裁剪方式不能满足嵌入式设备的要求的问题。

2、第一方面,本申请实施例提供了一种网络模型裁剪方法,包括:

3、根据嵌入式平台对所运行待裁剪网络模型所要求的通道对齐方式,确定所述待裁剪网络模型至少一个卷积层内的待裁剪通道数量;

4、根据所述待裁剪通道数量和所述嵌入式平台对所述待裁剪网络模型的耗时要求,确定所述待裁剪网络模型在裁剪所述待裁剪通道数量后所对应的目标损失函数;

5、根据所述待裁剪通道数量对所述待裁剪网络模型进行裁剪,并通过所述目标损失函数对进行裁剪后的裁剪后模型进行训练。

6、第二方面,本申请实施例另提供了一种网络模型裁剪装置,包括:

7、第一确定模块,用于根据嵌入式平台对所运行待裁剪网络模型所要求的通道对齐方式,确定所述待裁剪网络模型至少一个卷积层内的待裁剪通道数量;

8、第二确定模块,用于根据所述待裁剪通道数量和所述嵌入式平台对所述待裁剪网络模型的耗时要求,确定所述待裁剪网络模型在裁剪所述待裁剪通道数量后所对应的目标损失函数;

9、裁剪模块,用于根据所述待裁剪通道数量对所述待裁剪网络模型进行裁剪,并通过所述目标损失函数对进行裁剪后的裁剪后模型进行训练。

10、第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。

11、第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。

12、本申请实施例通过根据嵌入式平台对所运行待裁剪网络模型所要求的通道对齐方式,确定待裁剪网络模型至少一个卷积层内的待裁剪通道数量;根据待裁剪通道数量和嵌入式平台对待裁剪网络模型的耗时要求,确定待裁剪网络模型在裁剪待裁剪通道数量后所对应的目标损失函数;根据待裁剪通道数量对待裁剪网络模型进行裁剪,并通过目标损失函数对进行裁剪后的裁剪后模型进行训练,实现了根据嵌入式平台对在其运行的待裁剪网络模型所要求的通道对齐方式对待裁剪网络模型进行裁剪,并根据嵌入式平台的耗时要求确定待裁剪网络模型在裁剪所述待裁剪通道数量后所对应的目标损失函数,使得裁剪后模型在通道对齐方式维度和耗时维度能够满足嵌入式平台对模型耗时和模型通道对齐方式的限制,从而使得裁剪后模型在嵌入式平台上运行时能够运行流畅,满足应用场景的需求。

本文档来自技高网...

【技术保护点】

1.一种网络模型裁剪方法,其特征在于,包括:

2.根据权利要求1所述的网络模型裁剪方法,其特征在于,所述根据嵌入式平台对所运行待裁剪网络模型所要求的通道对齐方式,确定所述待裁剪网络模型至少一个卷积层内的待裁剪通道数量,包括:

3.根据权利要求2所述的网络模型裁剪方法,其特征在于,所述计算每组通道所对应的裁剪概率,包括:

4.根据权利要求2所述的网络模型裁剪方法,其特征在于,所述根据每组通道所对应的裁剪概率确定所述卷积层内的待裁剪通道组数,包括:

5.根据权利要求3或4所述的网络模型裁剪方法,其特征在于,所述激活层为可微极化门,所述被裁剪的概率为0或1。

6.根据权利要求1所述的网络模型裁剪方法,其特征在于,所述根据所述待裁剪通道数量和所述嵌入式平台对所述待裁剪网络模型的耗时要求,确定所述待裁剪网络模型在裁剪所述待裁剪通道数量后所对应的目标损失函数,包括:

7.根据权利要求6所述的网络模型裁剪方法,其特征在于,所述耗时要求和所述当前耗时量均以每秒浮点运算次数进行表示;

8.根据权利要求2所述的网络模型裁剪方法,其特征在于,所述根据所述待裁剪通道数量对所述待裁剪网络模型进行裁剪,包括:

9.根据权利要求1所述的网络模型裁剪方法,其特征在于,所述嵌入式平台包括进阶精简指令集机器ARM平台或现场可编程逻辑门阵列FPGA平台。

10.一种网络模型裁剪装置,其特征在于,包括:

...

【技术特征摘要】

1.一种网络模型裁剪方法,其特征在于,包括:

2.根据权利要求1所述的网络模型裁剪方法,其特征在于,所述根据嵌入式平台对所运行待裁剪网络模型所要求的通道对齐方式,确定所述待裁剪网络模型至少一个卷积层内的待裁剪通道数量,包括:

3.根据权利要求2所述的网络模型裁剪方法,其特征在于,所述计算每组通道所对应的裁剪概率,包括:

4.根据权利要求2所述的网络模型裁剪方法,其特征在于,所述根据每组通道所对应的裁剪概率确定所述卷积层内的待裁剪通道组数,包括:

5.根据权利要求3或4所述的网络模型裁剪方法,其特征在于,所述激活层为可微极化门,所述被裁剪的概率为0或1。

6.根据权利要求1所述的网...

【专利技术属性】
技术研发人员:张烁颜聪泉杨彭举谢迪
申请(专利权)人:杭州海康威视数字技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1