一种融合剪枝量化联合优化的模型压缩方法技术

技术编号:45465107 阅读:22 留言:0更新日期:2025-06-06 21:56
本发明专利技术提供了一种融合剪枝量化联合优化的模型压缩方法,包括:获取待剪枝的模型;获取为模型构建的量化模块,其通过可学习的量化参数对模型的可训练参数进行量化以得到对应的量化值,其中,每个可训练参数对应的量化值比其自身的数据量更小;利用训练语料对模型和量化模块进行剪枝和量化优化的联合训练,得到经联合训练后的模型和量化模块,其中,训练时的正向传播中用可训练参数对应的量化值来暂代可训练参数进行计算,反向传播中以最小化预设的总损失函数的值为目标对可训练参数和量化参数进行更新;对经联合训练后的模型进行剪枝,得到剪枝后的模型;利用经联合训练后的量化模块对剪枝后的模型中的可训练参数进行量化,得到经量化后的模型。

【技术实现步骤摘要】

本专利技术涉及神经网络,具体来说涉及深度学习模型压缩领域,更具体地说,涉及一种融合剪枝量化联合优化的模型压缩方法


技术介绍

1、近年来,随着深度学习技术的发展,gpt(generative pre-trainedtransformer)、glm(general language model pretraining with autoregressive blankinfilling)、llama(large language model meta ai)、通义千问(qwen)等大语言模型凭借其强大的表达能力和广泛适用性,越来越多地被应用于文本生成、机器翻译、问答系统等各类自然语言处理任务中。然而,这些大语言模型的规模和复杂度极大增加,参数量达到数十亿甚至千亿级别。因此,在边缘计算等资源受限场景中,部署大语言模型面临严峻挑战。针对这一问题,许多研究开始集中于如何对大语言模型进行有效压缩,以便在资源受限的设备上高效运行。

2、现有的模型压缩技术主要是利用模型剪枝(pruning)移除不重要的参数(如权重、神经元或注意力头),实现计算和存储需求的降本文档来自技高网...

【技术保护点】

1.一种模型压缩方法,该方法包括:

2.根据权利要求1所述的方法,其特征在于,联合训练的总损失函数为多个子损失函数的加权和,多个子损失函数包括:

3.根据权利要求2所述的方法,其特征在于,总损失函数为:

4.根据权利要求3所述的方法,其特征在于,第二子损失函数为:

5.根据权利要求3所述的方法,其特征在于,第三子损失函数为:

6.根据权利要求1-5之一所述的方法,其特征在于,量化模块利用量化参数对可训练参数进行截断、偏置和缩放处理,其中,

7.根据权利要求1-5之一所述的方法,其特征在于,量化参数包括偏置参数和缩放参...

【技术特征摘要】

1.一种模型压缩方法,该方法包括:

2.根据权利要求1所述的方法,其特征在于,联合训练的总损失函数为多个子损失函数的加权和,多个子损失函数包括:

3.根据权利要求2所述的方法,其特征在于,总损失函数为:

4.根据权利要求3所述的方法,其特征在于,第二子损失函数为:

5.根据权利要求3所述的方法,其特征在于,第三子损失函数为:

6.根据权利要求1-5之一所述的方法,其特征在于,量化模块利用量化参数对可...

【专利技术属性】
技术研发人员:郭嘉丰程学旗梁伯翰李琳廖华明张志斌邱强
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1