【技术实现步骤摘要】
深度学习编解码网络的训练方法与装置
[0001]本专利技术涉及图像编解码
,尤其涉及一种深度学习编解码网络的训练方法与装置。
技术介绍
[0002]目前学术界基于深度学习的图像编解码模型,在BPP(像素深度),PSNR(峰值信噪比),MS
‑
SSIM(多层级结构相似性)以及各种主观指标上均超越了传统JPEG、JPEG2000,BPG,H265,H266的效果。
[0003]目前,深度学习编解码网络大多通过率失真损失进行训练,训练效果不佳,训练后深度学习编解码网络的图像重建效果还有待提升。通用的率失真损失并没有很好的利用图像解码层的中间特征,使得图像解码质量并不理想。
技术实现思路
[0004]本专利技术的目的是提供一种深度学习编解码网络的训练方法与装置,可以提升图像重建的效果。
[0005]本专利技术的目的是通过以下技术方案实现的:
[0006]一种深度学习编解码网络的训练方法,所述深度学习编解码网络包括:编码部分、超先验概率模型与解码部分,包括:
[0007]第一阶段:设置多个基于卷积的辅助模块,其中一个基于卷积的辅助模块的输入为解码部分中第一个反卷积层的输入,其余每一基于卷积的辅助模块的输入为第一个反卷积层至倒数第二个反卷积层之间单个反卷积层的输出,设置一个卷积模块,其输入为解码部分的输出;将原始图像输入至深度学习编解码网络,计算率失真损失,以及利用所有基于卷积的辅助模块输出的特征与所述卷积模块输出的特征计算特征损失,结合率失真损失与特征损失 ...
【技术保护点】
【技术特征摘要】
1.一种深度学习编解码网络的训练方法,所述深度学习编解码网络包括:编码部分、超先验概率模型与解码部分,其特征在于,包括:第一阶段:设置多个基于卷积的辅助模块,其中一个基于卷积的辅助模块的输入为解码部分中第一个反卷积层的输入,其余每一基于卷积的辅助模块的输入为第一个反卷积层至倒数第二个反卷积层之间单个反卷积层的输出,设置一个卷积模块,其输入为解码部分的输出;将原始图像输入至深度学习编解码网络,计算率失真损失,以及利用所有基于卷积的辅助模块输出的特征与所述卷积模块输出的特征计算特征损失,结合率失真损失与特征损失构建第一阶段的损失函数对所述深度学习编解码网络进行训练;第二阶段:移除卷积模块与所有基于卷积的辅助模块,将原始图像输入至深度学习编解码网络,计算率失真损失作为第二阶段的损失函数对第一阶段训练后的深度学习编解码网络进行训练。2.根据权利要求1所述的一种深度学习编解码网络的训练方法,其特征在于,所有基于卷积的辅助模块的结构相同;单个基于卷积的辅助模块包括:依次设置的第一个卷积层、激活层与第二卷积层。3.根据权利要求1所述的一种深度学习编解码网络的训练方法,其特征在于,利用所有基于卷积的辅助模块输出的特征与所述卷积模块输出的特征计算特征损失包括:将所有基于卷积的辅助模块输出的特征记为特征集合{x1,x2,...,x
n
},其中,x
i
表示第i个基于卷积的辅助模块输出的特征,i=1,2,...,n,n表示基于卷积的辅助模块的数目;将卷积模块输出的特征记为对特征按照特征集合{x1,x2,...,x
n
}中每一特征的大小进行下采样,获得下采样特征集合其中,下采样特征与第i个基于卷积的辅助模块输出的特征x
i
的大小相同;利用特征集合{x1,x2,...,x
n
}与下采样特征集合计算特征损失,表示为:其中,L
‑
LOSS表示特征损失,MSE表示均方误差。4.根据权利要求1或3所述的一种深度学习编解码网络的训练方法,其特征在于,所述第一阶段的损失函数表示为:RD
‑
LOSS1=R
‑
LOSS+λ1D
‑
LOSS+λ2L
‑
LOSS其中,RD
‑
LOSS1表示第一阶段的损失函数,L
‑
LOSS表示特征损失;R
‑
LOSS与D
‑
LOSS分别表示率损失与失真损失,二者构成率失真损失;λ1与λ2分别表示调节失真损失与特征损失占比的超参数。5.一种深度学习编解码网络的训练装置,所述深度学习编解码网络包括:编码部分、超先验概率模型与解码部分,其特征在于,包括:第一训练单元,应用于第一阶段,所述第一阶段包括:设置多个基于卷积的辅助模块,其中一个基...
【专利技术属性】
技术研发人员:阮海航,武祥吉,陈也达,
申请(专利权)人:上海双深信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。