基于4比特量化的模型压缩方法、装置、设备及存储介质制造方法及图纸

技术编号：37284765 阅读：13 留言：0更新日期：2023-04-20 23:53

本发明专利技术实施例公开了一种基于4比特量化的模型压缩方法、装置、设备及存储介质，其中方法包括：对SCRFD人脸口罩模型进行4比特量化感知训练，以获得4比特模型mAP；根据4比特模型mAP判断是否满足人脸口罩检测精度要求；若不满足精度要求，则修改量化感知训练配置文件使SCRFD人脸口罩模型中的部分网络层使用8比特进行量化感知训练，直至符合人脸口罩检测精度要求；将符合人脸口罩检测精度要求的量化感知训练后的深度神经网络模型作为最终的人脸口罩检测模型。通过选用人脸口罩检测的SCRFD人脸口罩模型作为基础网络，并结合INT4量化感知训练的方式，而非直接量化，从而能够保持模型一定精度的同时，缩小了模型的运算处理的时间和需要的存储空间。和需要的存储空间。和需要的存储空间。

全部详细技术资料下载

【技术实现步骤摘要】
基于4比特量化的模型压缩方法、装置、设备及存储介质

[0001]本专利技术涉及数据处理
，更具体地说是基于4比特量化的模型压缩方法、装置、设备及存储介质。

技术介绍

[0002]近年来，卷积神经网络(CNN)已成为各种计算机视觉任务的主要方法，例如图像分类，目标检测，语义分割。大规模数据集，高端现代的GPU和新的网络架构使得大型卷积神经网络模型得到了前所未有的开发。然而，拥有更强大能力的大型卷积神经网络模型却往往会要求更多的资源。卷积神经网络模型在实际应用中的部署是主要受制于：模型的大小，运行时的内存需求和浮点运算数的数量要求。
[0003]与此同时，以人脸口罩检测为核心的算法出现在各种应用场景之中，包括戴口罩刷脸通行，公共区域佩戴口罩检查，驾驶员佩戴口罩检查等。在检测精度方面，现有的一些大型人脸检测卷积神经网络有着非常优秀的表现，对其进行一些改动便可以应用于人脸口罩检测。然而，在某些实际搭载的设备比如智能摄像机等边缘设备，计算资源和存储资源有限，而大型卷积神经网络模型需要执行大量的浮点运算，并且有大量权重参数，比如ResNet需要执行5GFLOPs，有24M个参数，这种情况严重制约了大型卷积神经网络模型的实际应用。
[0004]解决上述问题的常用方法是模型压缩。模型量化，作为模型压缩中最常用的方法之一，被认为是满足深度神经网络模型内存要求的最有效方法，近年来也吸引了许多研究者的目光，涌现了许多可行的神经网络量化策略和方案。然而，无论是工业界还是学术界，普遍被接受的都是INT8量化，因为它在加速...

【技术保护点】

【技术特征摘要】
1.基于4比特量化的模型压缩方法，其特征在于，包括：对SCRFD人脸口罩模型进行4比特量化感知训练，以获得4比特模型mAP；根据4比特模型mAP判断是否满足人脸口罩检测精度要求；若不满足精度要求，则修改量化感知训练配置文件使SCRFD人脸口罩模型中的部分网络层使用8比特进行量化感知训练，直至符合人脸口罩检测精度要求；将符合人脸口罩检测精度要求的量化感知训练后的深度神经网络模型作为最终的人脸口罩检测模型。2.根据权利要求1所述的基于4比特量化的模型压缩方法，其特征在于，所述对SCRFD人脸口罩模型进行4比特量化感知训练，以获得4比特模型mAP，包括：对训练数据进行预处理，以得到预处理后的数据；根据SCRFD人脸口罩模型结构生成量化感知训练配置文件；根据量化感知训练配置文件在SCRFD人脸口罩模型中添加量化层与反量化层，以生成量化感知训练模型；向量化感知训练模型输入预处理后的数据，并经过量化层，卷积层、反量化层、模型颈部以及模型头部处理，以得到模型输出；将得到的模型输出与训练数据的标签对比得到损失函数，并将损失函数的梯度反向传播；循环执行所述将得到的模型输出与标签对比得到损失函数，并将损失函数的梯度反向传播，直至损失函数的损失值趋于稳定时，将得到的模型输出进行后处理，以获得4比特模型mAP。3.根据权利要求2所述的基于4比特量化的模型压缩方法，其特征在于，所述对训练数据进行预处理，以得到预处理后的数据，包括：对训练数据进行数据增强以及统一化处理，以得到待封装数据；将待封装数据封装为dataloader的形式，以得到预处理后的数据。4.根据权利要求1所述的基于4比特量化的模型压缩方法，其特征在于，所述若不满足精度要求，则修改量化感知训练配置文件使SCRFD人脸口罩模型中的部分层使用8比特量化感知训练，直至符合人脸口罩检测精度要求，包括：自定义每一个神经网络层的量化类型；筛选出对精度影响达到设定值的神经网络层；对筛选出的神经网络层使用8比特量化。5.基于4比特量化的模型压缩装置，其特征在于，包括量化感知训练单元、判断单元、修改单元以及设定单元；所述量化感知训练单元，用于对SCRFD人脸口罩模型进行4比特量化感知训练，以获得4比特模型mAP；所述判断单元，用于根据4比特模型mAP判断是否满足人脸口罩检测精度要求；所述修改单元，用于若不满足精度要求，则修改量化感知训练配置文件使SCRFD人脸口罩模型中...

【专利技术属性】
技术研发人员：曹堃，陈志宇，龙晓华，
申请(专利权)人：深圳市同为数码科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人