基于两阶段权重组衰减的粗粒度神经网络稀疏化方法及系统技术方案

技术编号:46541995 阅读:0 留言:0更新日期:2025-10-10 21:07
本发明专利技术公开一种基于两阶段权重组衰减的粗粒度神经网络稀疏化方法,包括:对初始神经网络进行若干周期的预训练,使模型在目标任务上初步收敛;在预训练模型的基础上引入第一阶段的细粒度权重衰减机制,依据各权重的相对幅值分配不同的衰减因子;基于预设的重要性评估标准,以结构单元为粒度进行第二阶段粗粒度衰减操作,将每个结构单元内的所有权重视为整体,并根据其重要性水平施加统一的衰减因子,进一步弱化低重要性结构单元对模型性能的贡献,逐步实现结构化稀疏过程;对经过稀疏的模型进行微调训练,恢复因模型稀疏化造成的精度损失。本发明专利技术在不显著影响模型性能的前提下,实现模型压缩与加速。

【技术实现步骤摘要】

本专利技术属于神经网络模型压缩与加速,具体涉及一种基于两阶段权重组衰减的粗粒度神经网络稀疏化方法,用以实现模型压缩与部署加速。


技术介绍

1、在现有的深度神经网络模型中,普遍存在参数量大、计算复杂度高的问题,尤其是在边缘计算设备(如移动终端、嵌入式设备)中部署时,会面临模型体量大、运算速度慢、功耗高等挑战。为了提高模型的推理效率,降低模型复杂度,神经网络压缩技术应运而生,其中结构化剪枝是当前研究和应用的主要方法。相较于细粒度剪枝(权重剪枝),结构化剪枝有助于保持规则的网络结构,便于实现高效的硬件加速。该方法通过预设的评估标准以评估神经网络中特定的结构单元(如神经元、通道、滤波器等)的重要性,并一次性或迭代式地移除对模型性能贡献较小的结构单元,最终在不降低模型准确率的情况下,显著减少模型参数量和计算开销。

2、尽管现有结构化剪枝技术已经取得一定进展,但在实际应用中仍存在以下技术挑战:

3、1)结构单元重要性难以准确评估:现有技术中,结构单元对模型性能的贡献在训练过程中是动态变化的,难以在训练初期准确判断其最终对模型性能的影响,可能导致本文档来自技高网...

【技术保护点】

1.基于两阶段权重组衰减的粗粒度神经网络稀疏化方法,其特征在于,包括:

2.根据权利要求1所述基于两阶段权重组衰减的粗粒度神经网络稀疏化方法,其特征在于,所述第一阶段衰减,还包括:

3.根据权利要求2所述基于两阶段权重组衰减的粗粒度神经网络稀疏化方法,其特征在于,所述第一阶段衰减,还包括:

4.根据权利要求1所述基于两阶段权重组衰减的粗粒度神经网络稀疏化方法,其特征在于,所述第二阶段衰减,还包括:

5.根据权利要求4所述基于两阶段权重组衰减的粗粒度神经网络稀疏化方法,其特征在于,所述第二阶段衰减,还包括:

6.根据权利要求1所述...

【技术特征摘要】

1.基于两阶段权重组衰减的粗粒度神经网络稀疏化方法,其特征在于,包括:

2.根据权利要求1所述基于两阶段权重组衰减的粗粒度神经网络稀疏化方法,其特征在于,所述第一阶段衰减,还包括:

3.根据权利要求2所述基于两阶段权重组衰减的粗粒度神经网络稀疏化方法,其特征在于,所述第一阶段衰减,还包括:

4.根据权利要求1所述基于两阶段权重组衰减的粗粒度神经网络稀疏化方法,其特征在于,所述第二阶段衰减,还包括:

5.根据权利要求4所述基于两阶段权重组衰减的粗粒度神经网络稀疏化方法,其特征在于,所述第二阶段衰减,还包括:

6.根据权利要求1所述基于两阶段权重组衰减的粗粒度神经网络稀疏化方法,其特征在于,所述方法,还包括:

7.基于两阶段权重组衰减的粗粒度神经网络...

【专利技术属性】
技术研发人员:陈夕子潘锐杨鑫泽
申请(专利权)人:华中农业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1