System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 模型处理方法、装置、存储介质及电子设备制造方法及图纸_技高网

模型处理方法、装置、存储介质及电子设备制造方法及图纸

技术编号:41384399 阅读:3 留言:0更新日期:2024-05-20 19:05
本申请公开了一种模型处理方法、装置、存储介质及电子设备。该方法包括:获取待剪枝模型,并根据所述待剪枝模型以及软掩码,获取生成器;获取判别器;通过所述待剪枝模型获取真实样本,并根据所述真实样本对所述生成器和所述判别器进行生成对抗训练,直至满足预设停止条件;根据训练后的软掩码,确定对所述待剪枝模型的剪枝策略。本申请可以减少模型占用的存储空间。

【技术实现步骤摘要】

本申请属于电子,尤其涉及一种模型处理方法、装置、存储介质及电子设备


技术介绍

1、近年来,在诸如智能手机或平板电脑等电子设备上部署模型以实现相机优化、智能语音助手以及其他各种各样的人工智能应用已经成为业界标配。由于诸如智能手机或平板电脑等电子设备的存储空间有限,需要减少模型占用的存储空间。


技术实现思路

1、本申请实施例提供一种模型处理方法、装置、存储介质及电子设备,可以减少模型占用的存储空间。

2、第一方面,本申请实施例提供一种模型处理方法,包括:

3、获取待剪枝模型以及软掩码,并根据所述待剪枝模型以及软掩码,获取生成器;

4、获取判别器;

5、通过所述待剪枝模型获取真实样本,并根据所述真实样本对所述生成器和所述判别器进行生成对抗训练,直至满足预设停止条件;

6、根据训练后的软掩码,确定对所述待剪枝模型的剪枝策略。

7、第二方面,本申请实施例提供一种模型处理装置,包括:

8、第一获取模块,用于获取待剪枝模型以及软掩码,并根据所述待剪枝模型以及软掩码,获取生成器;

9、第二获取模块,用于获取判别器;

10、训练模块,用于通过所述待剪枝模型获取真实样本,并根据所述真实样本对所述生成器和所述判别器进行生成对抗训练,直至满足预设停止条件;

11、确定模块,用于根据训练后的软掩码,确定对所述待剪枝模型的剪枝策略。

12、第三方面,本申请实施例提供一种存储介质,其上存储有计算机程序,当所述计算机程序在计算机上执行时,使得所述计算机执行本申请实施例提供的模型处理方法。

13、第四方面,本申请实施例还提供一种电子设备,包括存储器,处理器,所述处理器通过调用所述存储器中存储的计算机程序,用于执行本申请实施例提供的模型处理方法。

14、本申请实施例中,通过获取待剪枝模型,并根据所述待剪枝模型以及软掩码,获取生成器;获取判别器;通过所述待剪枝模型获取真实样本,并根据所述真实样本对所述生成器和所述判别器进行生成对抗训练,直至满足预设停止条件;根据训练后的软掩码,确定对所述待剪枝模型的剪枝策略,再根据模型处理策略对模型进行剪枝处理,可以减少模型占用的存储空间。

本文档来自技高网...

【技术保护点】

1.一种模型处理方法,其特征在于,包括:

2.根据权利要求1所述的模型处理方法,其特征在于,所述根据所述待剪枝模型以及软掩码,获取生成器,包括:

3.根据权利要求2所述的模型处理方法,其特征在于,所述多样化分支模块的至少部分分支包括分支系数,所述分支系数用于表征对应分支的重要程度。

4.根据权利要求3所述的模型处理方法,其特征在于,所述根据所述真实样本对所述生成器和所述判别器进行生成对抗训练,直至满足预设停止条件,包括:

5.根据权利要求3所述的模型处理方法,其特征在于,所述根据所述真实样本对所述生成器和所述判别器进行生成对抗训练,直至满足预设停止条件,包括:

6.根据权利要求1至5任一项所述的模型处理方法,其特征在于,所述获取判别器,包括:

7.根据权利要求6所述的模型处理方法,其特征在于,所述生成器与所述判别器的结构之间的相似度大于预设相似度和/或所述生成器与所述判别器的权重至少部分相同。

8.根据权利要求1至5任一项所述的模型处理方法,其特征在于,所述根据训练后的软掩码,确定对所述待剪枝模型的剪枝策略之后,还包括:

9.根据权利要求8所述的模型处理方法,其特征在于,所述剪枝策略包括:根据所述训练后的软掩码对所述待剪枝模型中除使得剪枝后得到的剪枝后模型的精度与所述待剪枝模型的精度的差值大于预设差值的层之外的层进行剪枝处理,得到剪枝后模型。

10.一种模型处理装置,其特征在于,包括:

11.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行权利要求1至9任一项所述的模型处理方法。

12.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器通过调用所述存储器中存储的所述计算机程序,用于执行权利要求1至9任一项所述的模型处理方法。

...

【技术特征摘要】

1.一种模型处理方法,其特征在于,包括:

2.根据权利要求1所述的模型处理方法,其特征在于,所述根据所述待剪枝模型以及软掩码,获取生成器,包括:

3.根据权利要求2所述的模型处理方法,其特征在于,所述多样化分支模块的至少部分分支包括分支系数,所述分支系数用于表征对应分支的重要程度。

4.根据权利要求3所述的模型处理方法,其特征在于,所述根据所述真实样本对所述生成器和所述判别器进行生成对抗训练,直至满足预设停止条件,包括:

5.根据权利要求3所述的模型处理方法,其特征在于,所述根据所述真实样本对所述生成器和所述判别器进行生成对抗训练,直至满足预设停止条件,包括:

6.根据权利要求1至5任一项所述的模型处理方法,其特征在于,所述获取判别器,包括:

7.根据权利要求6所述的模型处理方法,其特征在于,所述生成器与所述判别器的结构之间的相似度大于预设相似度和/或所述生成器与...

【专利技术属性】
技术研发人员:李文进
申请(专利权)人:哲库科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1