训练方法、图像编码方法、图像解码方法及装置制造方法及图纸

技术编号:30146190 阅读:33 留言:0更新日期:2021-09-25 14:49
本申请实施例提供一种训练方法、图像编码方法、图像解码方法及装置。图像编码装置包括:图像编码器,其对输入的图像数据进行编码得到潜在变量;量化器,其根据量化步长对所述潜在变量进行量化处理,生成量化的潜在变量;以及熵编码器,其使用熵模型对量化的潜在变量进行熵编码,形成码流。形成码流。形成码流。

【技术实现步骤摘要】
训练方法、图像编码方法、图像解码方法及装置


[0001]本申请实施例涉及图像处理领域。

技术介绍

[0002]随着计算机技术的发展,图像的应用越来越广泛。为了对图像文件进行高效的存储或传输,需要对图像进行编码,编码的结果能够被转换为码流。通过对码流进行解码,能够对图像进行再现。
[0003]深度神经网络(deep neural network)已经成为图像编码领域一个很有前途的研究方向。基于深度神经网络而设计的非线性变换编码方法比传统的图像编码方法有更好的性能,传统的图像编码方法例如是更好的便携图形(BPG)编码方法。
[0004]在基于深度神经网络的图像编码方法中,一个关键的挑战是如何实现码率(bit rate)和失真(distortion)程度的折中。其中,码率反映了图像的码流相对于图像的尺寸的大小,例如,码率可以等于码流的长度除以图像的长与宽的乘积所得到的商;失真反映了解码后得到的图像与原图像的差异。
[0005]通常,可以引入拉格朗日乘子来实现码率与失真程度的折衷,例如,在对基于深度神经网络的编码器进行训练时,可本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种图像处理装置的训练装置,使用训练图像对图像编码器和图像解码器进行训练,其特征在于,所述训练装置包括:第一获取单元,其获取所述图像编码器对输入的训练图像数据进行编码得到的潜在变量;第二获取单元,其获取所述图像解码器对所述潜在变量进行解码得到的第一复原的图像数据,以及所述图像解码器对所述潜在变量与噪声的和进行解码得到的第二复原的图像数据;训练单元,其根据代价函数对所述图像编码器和所述图像解码器进行训练,所述代价函数与所述输入的训练图像数据与所述第一复原的图像数据的偏差,以及所述第一复原的图像数据与所述第二复原的图像数据的偏差相关。2.一种图像编码装置,其特征在于,所述图像编码装置包括:图像编码器,其对输入的图像数据进行编码得到潜在变量,所述图像编码器通过如权利要求1所述的训练装置训练得到;量化器,其根据量化步长对所述潜在变量进行量化处理,生成量化的潜在变量;以及熵编码器,其使用熵模型对所述量化的潜在变量进行熵编码,形成码流。3.如权利要求2所述的图像编码装置,其中,所述图像编码装置还包括:第一量化步长调整器,其调整所述量化步长,以调整所述码流的码率。4.如权利要求...

【专利技术属性】
技术研发人员:周静中川章温思寒谭志明
申请(专利权)人:富士通株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1