大语言模型的量化方法、电子设备、芯片系统及存储介质技术方案

技术编号：41490134 阅读：18 留言：0更新日期：2024-05-30 14:36

本申请提供一种大语言模型的量化方法、电子设备、芯片系统及存储介质，涉及模型量化技术领域，该方法可以基于多种分组尺寸将大语言模型中的权重在维度上进行分组，针对权重每一分组尺寸下的每个小组中的元素，通过小组内元素的最大值和最小值以及该权重的缩放系数a，计算各元素分别对应的量化后的元素；这样得到大语言模型中每个权重量化后的元素；将同一业务数据输入量化权重后的大语言模型和未量化权重的大语言模型，使得二者的输出的差异收敛，差异最小的分组方式和缩放系数对应的大语言模型为量化后的大语言模型；通过自适应学习a可以降低权重的离群值导致的缩放刻度异常过大问题；通过更细的分组量化，提升量化精度。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及模型量化，尤其涉及一种大语言模型的量化方法、电子设备、芯片系统及存储介质。

技术介绍

1、大语言模型是基于海量文本数据训练的深度学习模型，大语言模型不仅能够生成自然语言文本，还能够深入理解文本含义，处理各种自然语言任务，如文本摘要、问答、翻译等。大语言模型数据量非常大，因此，需要对大语言模型进行模型量化，即将大语言模型中的浮点数据映射为定点数据，从而降低参数量、提升计算速度等。

2、目前，在大语言模型已经训练完成后，可以通过训练后量化的方法进行量化，然而，这种量化方式与量化前浮点权重的最大值和最小值相关，若量化前权重中存在异常离群点，则可能导致量化后的权重偏差较大，使得量化后的模型精度下降。

技术实现思路

1、本申请提供一种大语言模型的量化方法、电子设备、芯片系统及存储介质，可以提高量化后的模型精度。

2、为达到上述目的，本申请第一方面采用如下技术方案：

3、本申请第一方面提供一种大语言模型的量化方法，包括：

4、基于设置的缩放系数...

【技术保护点】

1.一种大语言模型的量化方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述通过所述差异损失函数更新所述缩放系数，并通过最新更新的缩放系数更新差异损失函数，直到所述差异损失函数收敛，包括：

3.如权利要求1所述的方法，其特征在于，基于设置的缩放系数，得到量化权重后的大语言模型，包括：

4.如权利要求3所述的方法，其特征在于，所述第b个block的第i个权重的初始缩放刻度为：

5.如权利要求1所述的方法，其特征在于，所述差异损失函数为量化权重后的大语言模型的输出和未量化权重的大语言模型的输出之间的均方误差损失函数。

<...

【技术特征摘要】

1.一种大语言模型的量化方法，其特征在于，包括：

3.如权利要求1所述的方法，其特征在于，基于设置的缩放系数，得到量化权重后的大语言模型，包括：

4.如权利要求3所述的方法，其特征在于，所述第b个block的第i个权重的初始缩放刻度为：

6.如权利要求1至5任一项所述的方法，其特征在于，所述基于设置的缩放系数，得到量化权重后的大语言模型，包括：

7.如权利要求6所述的方法，其特征在于，基于设置的分组尺寸和设置的缩放系数，得到每...

【专利技术属性】
技术研发人员：徐成国，
申请(专利权)人：荣耀终端有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人