基于TorchScript模型的混合精度量化方法、装置、设备及存储介质制造方法及图纸

技术编号：40333790 阅读：28 留言：0更新日期：2024-02-09 14:24

本发明专利技术适用深度学习模型优化压缩以及工具链技术领域，提供了一种基于TorchScript模型的混合精度量化方法，该方法包括：先采用模型映射策略对Pytorch模型进行模型映射，得到TorchScript映射模型，再根据模型输入量化策略、模型权重量化策略以及模型输出量化策略分别对输入TorchScript映射模型的原始输入值、TorchScript映射模型的各网络层的权重以及TorchScript映射模型每层网络层输出的待量化输出值进行量化，最终得到对Pytorch模型压缩后的TorchScript模型，从而降低了Pytorch深度学习模型量化的复杂度，并降低了量化后模型的精度损失。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于深度学习模型优化压缩以及工具链，尤其涉及一种基于torchscript模型的混合精度量化方法、装置、设备及存储介质。

技术介绍

1、随着深度学习快速发展，其在语音、图像和自然语言处理等领域得到了广泛应用，大量基于神经网络模型的技术推陈出新，同时也增生了大量的ai芯片厂商，然而，由于神经网络模型本身具有层数多、参数量多、计算量大的特点，在将这些模型进行芯片部署时，仍面临着计算资源不足、储存空间不足、内存消耗过多等问题，为此必须对神经网络模型进行优化压缩，或者采用定点运算来减小浮点运算产生的高功耗问题，以保证其能在嵌入式终端设备上顺利落地。

2、传统基于pytorch模型量化压缩方案基本步骤如下：首先，对模型进行权重量化，统计每一个网络层的权重绝对值最大值wmax，将其最大值映射到127，即根据公式flw＝int(log2(127/wmax))计算整数flw，这样，一个层数为n的网络最终会统计出n个flw，随后，根据公式得到权重的8比特量化值，接着，选取校准数据集对模型进行输出量化，使用该校准数据集进行神经网络前向...

【技术保护点】

1.一种基于TorchScript模型的混合精度量化方法，其特征在于，所述方法包括下述步骤：

2.如权利要求1所述的方法，其特征在于，所述采用预设的模型输入量化策略对输入所述TorchScript映射模型的原始输入值进行量化的步骤，包括：

3.如权利要求1所述的方法，其特征在于，所述采用预设的模型权重量化策略对所述TorchScript映射模型的当前网络层的第一权重进行量化的步骤，包括：

4.如权利要求1所述的方法，其特征在于，所述并采用预设的模型输出量化策略对所述待量化输出值进行量化，得到目标输出值的步骤包括：

5.如权利要求1所述的方法...

【技术特征摘要】

1.一种基于torchscript模型的混合精度量化方法，其特征在于，所述方法包括下述步骤：

2.如权利要求1所述的方法，其特征在于，所述采用预设的模型输入量化策略对输入所述torchscript映射模型的原始输入值进行量化的步骤，包括：

3.如权利要求1所述的方法，其特征在于，所述采用预设的模型权重量化策略对所述torchscript映射模型的当前网络层的第一权重进行量化的步骤，包括：

4.如权利要求1所述的方法，其特征在于，所述并采用预设的模型输出量化策略对所述待量化输出值进行量化，得到目标输出值的步骤包括：

5.如权利要求1所述的方法，其特征在于，所述得到对所述pytorch模型压缩后的torc...

【专利技术属性】
技术研发人员：张鹏，王春燕，
申请(专利权)人：珠海亿智电子科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人