一种深度学习量化感知训练方法、装置、设备及介质制造方法及图纸

技术编号：37980415 阅读：10 留言：0更新日期：2023-06-30 09:55

本申请公开了一种深度学习量化感知训练方法、装置、设备及介质，涉及深度学习技术领域，包括：加载预训练深度学习网络模型，并对所述预训练深度学习网络模型中的权重参数进行固化，得到固化后网络模型；对所述固化后网络模型中预设的可训练量化因子参数进行训练，得到训练后网络模型；加载所述训练后网络模型，并对所述训练后网络模型中的所述可训练量化因子参数和所述权重参数同时进行训练，得到量化感知训练后模型。本申请可以保证深度学习网络模型在低bit位进行量化的精度，同时提高轻量级网络模型和裁剪后网络模型量化感知训练的稳定性。的稳定性。的稳定性。

全部详细技术资料下载

【技术实现步骤摘要】
一种深度学习量化感知训练方法、装置、设备及介质

[0001]本申请涉及深度学习
，特别涉及一种深度学习量化感知训练方法、装置、设备及介质。

技术介绍

[0002]随着深度学习的快速发展，模型的计算量越来越大，推理的时间也越来越长，对深度学习的推理部署提出了更大的挑战，特别是在一些小算力硬件设备上的部署。
[0003]目前深度学习模型加速方法之一是模型量化。传统的模型量化方法有训练后静态量化(PQT，Post Training Static Quantization)方法和量化感知训练(QAT，Quantization Aware Training)方法，其中，训练后静态量化方法是直接对训练后的模型进行量化，由于量化本身也是一种噪声的引入方式，因此会导致对噪声比较敏感的模型精度下降严重，并且多数训练后静态量化采用8bit量化，使得该方法应用范围受到很大的限制；而量化感知训练方法是在训练过程中，模拟量化的实际运行过程，包括边界截断和取整操作，并将量化过程中产生的误差也作为一个特征提供给网络学习，通常情况下量化感知训练会获得比训练后静态量化方法更好的精度，但由于取整函数中几乎每一处的梯度都是0，因此导致模型不能收敛。现有的技术方案是通过引入STE(Straight Through Estimator，即直通估计器)将量化前的权重梯度直接回传，使网络模型可以正常训练，但这种方式导致量化后梯度信息没法回传到反向传播中，导致求取的结果不是最优解，并且在对深度学习网络模型进行低bit位量化时，精度损失严重。另外，目前...

【技术保护点】

【技术特征摘要】
1.一种深度学习量化感知训练方法，其特征在于，包括：加载预训练深度学习网络模型，并对所述预训练深度学习网络模型中的权重参数进行固化，得到固化后网络模型；对所述固化后网络模型中预设的可训练量化因子参数进行训练，得到训练后网络模型；加载所述训练后网络模型，并对所述训练后网络模型中的所述可训练量化因子参数和所述权重参数同时进行训练，得到量化感知训练后模型。2.根据权利要求1所述的深度学习量化感知训练方法，其特征在于，所述可训练量化因子参数包括量化因子s和zero_pointβ。3.根据权利要求2所述的深度学习量化感知训练方法，其特征在于，所述对所述训练后网络模型中的所述可训练量化因子参数和所述权重参数同时进行训练，得到量化感知训练后模型之后，还包括：对所述量化感知训练后模型进行常量折叠合并。4.根据权利要求3所述的深度学习量化感知训练方法，其特征在于，所述对所述量化感知训练后模型进行常量折叠合并，包括：加载所述量化感知训练后模型，并将所述量化感知训练后模型的BN层合并至卷积层，然后将所述zero_pointβ合并到bias中，再与所述量化因子s合并，以及将所述权重参数转换为整数形式。5.根据权利要求2至4任一项所述的深度学习量化感知训练方法，其特征在于，所述zero_pointβ用于将所述输入所述可训练量化因子s的浮...

【专利技术属性】
技术研发人员：贾敬崧，
申请(专利权)人：郑州云海信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人