一种基于深度神经网络的图像编解码器的训练方法技术

技术编号：19024026 阅读：86 留言：0更新日期：2018-09-26 19:13

一种基于深度神经网络的图像编解码器的训练方法，所述训练方法包括以下步骤：第一步、空间解耦：用于解除编解码器和生成模型的耦合，并解除隐变量编码与重建模块的耦合；第二步，时间分治：在训练编解码器的不同阶段优化不同的损失函数并使用不同的学习速率来提高训练的速度与稳定性。本发明专利技术提供了一种有效避免多个误差函数相互干扰的基于深度神经网络的图像编解码器的训练方法。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度神经网络的图像编解码器的训练方法
本专利技术属于图像编解码器领域，具体涉及基于深度神经网络的图像编解码器的训练方法。
技术介绍
对于基于深度神经网络的图像编解码器，在网络的训练中通常需要同时优化多个损失函数，例如重建误差函数，图像生成对抗误差函数。同时，在实际应用中，还会根据具体需要额外优化其他的损失函数。这些不同的损失函数存在显著的耦合关系，在网络训练中会出现严重的冲突问题。如果不同误差函数之间的配比比例不当，则会导致训练的不稳定，影响解码器对图像的重建精度和生成图像的拟真，即，影响编解码后的图像与训练图像集的相似程度。在目前已有的相关文献中多数只给出了2个误差函数和3个功能模块的稳定性约束方法。然而在复杂的图像编解码器中往往会存在2个以上误差函数以及3个以上功能模块。对于这样复杂的编解码器，如何统筹协调多个误差函数的关系，使得所有误差函数通过训练达到收敛成为一个急需解决的问题。
技术实现思路
为了克服现有技术在训练编解码器时多个误差函数相互干扰的不足，本专利技术提供了一种有效避免多个误差函数相互干扰的基于深度神经网络的图像编解码器的训练方法。本专利技术解决其技术问题所采用的技术方案是：一种基于深度神经网络的图像编解码器的训练方法，所述训练方法包括以下步骤：第一步、空间解耦：用于解除编解码器和生成模型的耦合，并解除隐变量编码与重建模块的耦合；第二步，时间分治：在训练编解码器的不同阶段优化不同的损失函数并使用不同的学习速率来提高训练的速度与稳定性。进一步，所述空间解耦对编解码器中相互存在干扰的损失函数聚合成为一个模块，在训练时按模块进行损失函数的优...

【技术保护点】
1.一种基于深度神经网络的图像编解码器的训练方法，其特征在于，所述训练方法包括以下步骤：第一步、空间解耦：用于解除编解码器和生成模型的耦合，并解除隐变量编码与重建模块的耦合；第二步，时间分治：在训练编解码器的不同阶段优化不同的损失函数并使用不同的学习速率来提高训练的速度与稳定性。

【技术特征摘要】
1.一种基于深度神经网络的图像编解码器的训练方法，其特征在于，所述训练方法包括以下步骤：第一步、空间解耦：用于解除编解码器和生成模型的耦合，并解除隐变量编码与重建模块的耦合；第二步，时间分治：在训练编解码器的不同阶段优化不同的损失函数并使用不同的学习速率来提高训练的速度与稳定性。2.如权利要求1所述的基于深度神经网络的图像编解码器的训练方法，其特征在于，所述空间解耦对编解码器中相互存在干扰的损失函数聚合成为一个模块，在训练时按模块进行损失函数的优化。3.如权利要求2所述的基于深度神经网络的图像编解码器的训练方法，其特征在于，根据所述空间解耦方法聚合形成的模块之间是解耦合的，即对某个模块进行优化时，不会对其他模块的优化造成影响或干扰。4.如权利要求1～3之一所述的基...

【专利技术属性】
技术研发人员：周乾伟，陶鹏，陈禹行，詹琦梁，胡海根，李小薪，陈胜勇，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人