一种适用于超分网络的分布灵活子集量化方法技术

技术编号：39667382 阅读：7 留言：0更新日期：2023-12-11 18:31

一种适用于超分网络的分布灵活子集量化方法，涉及人工神经网络的压缩与加速

全部详细技术资料下载

【技术实现步骤摘要】
一种适用于超分网络的分布灵活子集量化方法

[0001]本专利技术涉及人工神经网络的压缩与加速，尤其是涉及一种适用于超分网络的分布灵活子集量化方法
。

技术介绍

[0002]图像超分辨率
(SR)
是一项基本的低级计算机视觉任务，旨在从低分辨率输入图像
(LR)
中恢复高分辨率
(HR)
图像
。
由于深度神经网络
(DNN)
的显著成功，基于
DNN
的超分模型已经成为处理超分任务的常见手段
。
最近的
SR
模型的惊人性能通常依赖于不断增加的网络规模和计算成本，从而限制它们的应用，特别是在资源密集型设备，如智能手机
。
压缩
SR
模型已经得到学术界和工业界的广泛关注
。
为了实现模型的部署，已经研究各种网络压缩技术
。
在这些技术中，网络量化将网络中的全精度权重和激活映射为低位格式，由于其能够同时减少存储大小和计算成本，因此获得青睐
。
但目前的方法必须在获得整个训练集的前提下重新训练量化的
SR
模型，即所谓的量化意识训练
(QAT)。
在现实世界中由于隐私
、
数据传输等原因，获取原始训练数据有时是很困难的
。
此外，沉重的训练和能源成本也阻碍了其实际部署
。
后训练量化
(PTQ)
方法只用原始训练集

【技术保护点】

【技术特征摘要】
1.
一种适用于超分网络的分布灵活子集量化方法，其特征在于包括以下步骤：
1)
使用
L1
损失
、
结构转移损失预训练一个全精度的超分网络；
2)
统计全精度超分神经网络每一层激活值的分布；
3)
每层激活值分布进行归一化处理；
4)
进行
k
‑
means
聚类得到量化点，并对激活值进行子集量化
。2.
如权利要求1所述一种适用于超分网络的分布灵活子集量化方法，其特征在于在步骤
1)
中，所述预训练一个全精度的超分网络，是已经在目标数据集上以全精度的形式训练好的超分网络模型；其中
L1
损失为：结构转移损失为：其中，
F'
s
,F'
T
分别是全精度网络和量化网络激活值结构特征，可以如下计算：其中，
F∈R
C*H*w
是高级特征模块的输出；总的损失函数为：
L
＝
L1+1000L
SKT
。3.
如权利要求1所述一种适用于超分网络的分布灵活子集量化方法，其特征在于在步骤
2)
中，所述统计全精度超分神经网络每一层激活值的分布，具体操作为使用预训练好的超分神经网络前向传播小批量的图片，记录全精度模型中每一层特征图激活值
。4.
如权利要求1所述一种适用于超分网络的分布灵活子集量化方法，其特征在于在步骤
3)
中，所述每层激活值分布进行归一化处理，具体步骤为：对记录下来的全精度模型中每一层特征图激活值先进行预处理，以消除不同通道间的分布差异；用
X∈R
B
×
C
×
H
×
W
来表示全精度特征图，其中
B
×
C
×
H
×
W
分别表示特征图的小批量大小
、
通道数
、
高度和宽度；考虑到激活分布在不同的样本和通道之间有很大的不同，选择对每个通道进行对每个样本的每个通道进行量化，表示为
X
i,c
∈R
H
×
W
，其中，
X
i,c
表示第<...

【专利技术属性】
技术研发人员：纪荣嵘，钟云山，谢晶晶，林明宝，
申请(专利权)人：厦门大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人