System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种深度学习模型的压缩方法、装置和电子设备制造方法及图纸_技高网

一种深度学习模型的压缩方法、装置和电子设备制造方法及图纸

技术编号:44934110 阅读:17 留言:0更新日期:2025-04-08 19:16
本公开属于人工智能技术领域,具体涉及一种深度学习模型的压缩方法、装置和电子设备。其中所述方法包括:获取待压缩的深度学习模型,分别确定模型参数的费舍尔重要度与参数关联重要度;基于费舍尔重要度与参数关联重要度确定协同重要度;基于模型参数的协同重要度对所述深度学习模型进行剪枝。本公开提供了一种剪枝效率更佳的深度学习模型的压缩方法。

【技术实现步骤摘要】

本公开属于人工智能,具体涉及一种深度学习模型的压缩方法、装置和电子设备


技术介绍

1、随着深度学习模型在各种任务中的成功应用,模型部署设备硬件资源的受限与模型规模的庞大之间的矛盾使得模型压缩技术成为当前热点。模型压缩指通过一系列技术手段,减少模型的参数数量、计算复杂度和存储空间,从而在保持或提高模型性能的同时,使其更适合在资源受限的设备上运行。

2、模型剪枝是一种常见的模型压缩技术。模型剪枝可以移除对模型输出贡献较小的参数,从而在显著降低模型参数量的前提下,同时保持模型性能的最小化损失。现在的模型剪枝方法依赖于基于梯度信息计算参数的费舍尔(fisher)重要度以删除重要度较小的参数。

3、但是,梯度信息本质上是一种局部信息,基于费舍尔重要度并不能从全局维度评估参数的重要度。因此,基于费舍尔重要度的剪枝方法往往不能取得全局最优的剪枝效果。


技术实现思路

1、本公开实施例提出了一种深度学习模型的剪枝方案,以解决现阶段基于费舍尔重要度的剪枝方法剪枝效果往往不是全局最优的问题。

2、本公开实施例的第一方面提供了一种深度学习模型的压缩方法,包括:

3、获取待压缩的深度学习模型,分别确定模型参数的费舍尔重要度与参数关联重要度;

4、基于费舍尔重要度与参数关联重要度确定协同重要度;

5、基于模型参数的协同重要度对所述深度学习模型进行剪枝。

6、在本公开的一些实施例中,所述确定模型参数的费舍尔重要度包括:

7、依据模型参数的依赖性对模型参数进行分组,计算所述模型参数的hessian矩阵;

8、从hessian矩阵确定费舍尔重要度。

9、在本公开的一些实施例中,所述从hessian矩阵确定费舍尔重要度包括:

10、从hessian矩阵计算费舍尔信息矩阵;

11、根据下式基于费舍尔信息矩阵确定费舍尔重要度:;

12、其中是费舍尔信息矩阵的第i个特征值,为费舍尔重要度,是第i个;模型参数对应的量子态角度。

13、在本公开的一些实施例中,确定模型参数的参数关联重要度包括:

14、对所述模型参数进行量子态映射;

15、基于量子态映射结果确定所述模型参数的参数关联强度,基于参数关联强度确定参数关联重要度。

16、在本公开的一些实施例中,所述基于参数关联强度确定参数关联重要度包括:;

17、其中,为参数关联重要度,为第i个和j个参数的参数关联强度,n为样本数。

18、在本公开的一些实施例中,所述基于费舍尔重要度与参数关联重要度确定协同重要度包括:;

19、其中,为协同重要度,为费舍尔重要度,为量子关联重要度,是第i个模型参数对应的量子态角度,是权重系数,满足。

20、在本公开的一些实施例中,所述方法还包括:

21、对压缩后的所述深度学习模型进行微调,以恢复模型的精度。

22、本公开实施例的第二方面提供了一种深度学习模型的压缩装置,包括:

23、获取模块,用于获取待压缩的深度学习模型,分别确定模型参数的费舍尔重要度与参数关联重要度;

24、确定模块,用于基于费舍尔重要度与参数关联重要度确定协同重要度;

25、剪枝模块,用于基于模型参数的协同重要度对所述深度学习模型进行剪枝。

26、本公开实施例的第三方面提供了一种电子设备,包括存储器和处理器,

27、所述存储器,用于存储计算机程序;

28、所述处理器,用于当执行所述计算机程序时,实现根据本公开第一方面所述的方法。

29、综上所述,本公开各实施例提供的深度学习模型的压缩方法、装置、和电子设备,通过将基于梯度信息生成的fisher重要度与利用量子关联方法来度量的参数关联重要度协同合作评估参数重要度,依据协同重要度进行剪枝,从而融合了fisher重要度与参数关联重要度的优势,从局部和全局两个维度对参数重要度进行综合评估,提升了深度学习模型的剪枝效率。

本文档来自技高网
...

【技术保护点】

1.一种深度学习模型的压缩方法,其特征在于,包括:

2.根据权利要求1所述方法,其特征在于,所述确定模型参数的费舍尔重要度包括:

3.根据权利要求2所述方法,其特征在于,所述从Hessian矩阵确定费舍尔重要度包括:

4.根据权利要求1所述方法,其特征在于,确定模型参数的参数关联重要度包括:

5.根据权利要求4所述方法,其特征在于,所述基于参数关联强度确定参数关联重要度包括:

6.根据权利要求1所述方法,其特征在于,所述基于费舍尔重要度与参数关联重要度确定协同重要度包括:

7.根据权利要求1所述方法,其特征在于,所述对所述深度学习模型进行剪枝之后,还包括:

8.根据权利要求1所述方法,其特征在于,所述方法还包括:

9.一种深度学习模型的压缩装置,其特征在于,包括:

10.一种电子设备,其特征在于:包括存储器和处理器,

【技术特征摘要】

1.一种深度学习模型的压缩方法,其特征在于,包括:

2.根据权利要求1所述方法,其特征在于,所述确定模型参数的费舍尔重要度包括:

3.根据权利要求2所述方法,其特征在于,所述从hessian矩阵确定费舍尔重要度包括:

4.根据权利要求1所述方法,其特征在于,确定模型参数的参数关联重要度包括:

5.根据权利要求4所述方法,其特征在于,所述基于参数关联强度确定参数关联重要...

【专利技术属性】
技术研发人员:张朝李艳鹏薛润佳
申请(专利权)人:人民中科北京智能技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1