一种基于自熵过滤与伪标签生成的无数据网络量化方法技术

技术编号：41246942 阅读：17 留言：0更新日期：2024-05-09 23:57

本发明专利技术涉及模型量化领域，公开了一种基于自熵过滤与伪标签生成的无数据网络量化方法，包括以下步骤，步骤一：生成数据和全精度预训练模型P，并输出n‑b it量化模型Q，步骤二：数据自熵过滤；步骤三：伪标签生成；步骤四：基于伪标签训练。本发明专利技术通过在量化之前对合成数据进行评估，从而使不同可靠性的样本可以提供不同的信息从而提高性能，设计了多个伪标签为合成数据生成不同可靠性的标签，它为高质量样本和低质量样本分别设计了主要和辅助伪标签，从而提供有价值的监督信息，并避免低质量样本误导量化，在经典图像分类任上进行了大量的实验，与现有的无数据量换方法相比，该方法可以取得更为卓越的效果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及模型量化领域，具体为一种基于自熵过滤与伪标签生成的无数据网络量化方法。

技术介绍

1、模型量化是一种有效的深度学习网络压缩方法，它通过映射的方法将模型的全精度浮点值转换为定点值，从而减少内存的占用。通常会使用部分或全部的原始数据对量化模型进行训练优化，以弥补模型位数降低所带来的精度下降。然而，在现实世界中，因为数据隐私等问题，我们可能无法直接获取原始的数据集，仅仅只有预训练的全精度模型，我们称为无数据量化问题。解决该问题的方法通常会使用特定的生成器，利用预训练模型中批归一化层的信息对生成器进行训练，从而合成近似原始数据分布的合成数据，利用这些合成数据，可以帮助量化模型进行训练，提升模型精度。

2、然而过去的这些方法缺乏对于生成数据质量的有效评估，低质量的数据反而可能会对量化模型的训练起到负面的作用，基于这个问题，本专利技术引入自熵这一概念。在信息论中，熵代表了随机变量的不确定性，我们使用预训练模型计算合成数据集的自熵，用于评估数据的不确定性从而判断其质量。通过自熵这一指标，我们将合成数据集划分为高质量和低质量数...

【技术保护点】

1.一种基于自熵过滤与伪标签生成的无数据网络量化方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于自熵过滤与伪标签生成的无数据网络量化方法，其特征在于，所述步骤二中使用自熵作为指标去评估生成数据相对于预训练模型的可靠性，通过计算输入的生成样本在预训练模型中的输出结果确定该样本的自熵。

3.根据权利要求1所述的一种基于自熵过滤与伪标签生成的无数据网络量化方法，其特征在于，所述步骤三中将其在预训练模型中输出置信度最高的那一类作为该样本的伪标签，即主标签，而低可靠的样本，因为其自身的不确定性，同时将预测值第一高和第二高的类别分别作为一级和二级标签，这两级...

【技术特征摘要】

1.一种基于自熵过滤与伪标签生成的无数据网络量化方法，其特征在于，包括以下步骤：

3.根据权利要求1所述的一种基于自熵过滤与伪标签生成的无数据网络量化方法，其特征在于，所述步骤三中将其在预训练模型中输出置信度最高的那一类作为该样本的伪标签，即主标签，而低可靠的样本，因为其自身的不确定性，同时将预测值第一高和第二高的类别分别...

【专利技术属性】
技术研发人员：樊春晓，王子奇，郭丹，汪萌，
申请(专利权)人：合肥工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人