一种图像编码、解码方法及系统技术方案

技术编号:29678304 阅读:16 留言:0更新日期:2021-08-13 22:01
本发明专利技术公开了一种图像编码、解码方法及系统,基于变分自编码网络,由编码模型和解码模型构成,本发明专利技术通过变分自编码网络旨在编解码图片的过程中采用激活函数Softplus、relu以及leakyrelu,实现最佳拟合方差,降低计算误差,同时通过减低残差块的通道数和个数,更进一步减少用户使用的显存量和计算量,提高压缩性能,达到最佳的压缩效果。

【技术实现步骤摘要】
一种图像编码、解码方法及系统
本专利技术涉及图像识别
,具体涉及一种图像编码、解码方法及系统。
技术介绍
随着大数据信息时代的到来,图像信号正成为信息存储与传播的主体,在推动国民经济、保障社会安全、传播先进文化等方面发挥着极为重要的作用。图像信号内部存在大量冗余,包括空间冗余、结构冗余以及视觉冗余等。正因为存在这样的冗余,图像数据才能够被压缩。而在互联网的发展中,人们通过观看视频和读取图片来获取信息,而视频和图片所占的空间非常大,会导致占用大量网络宽带,影响传输速度,因此,在图像信息的传输方面如何压缩图像数据以节省空间已经成为迫在眉睫需要解决的问题。传统的图像编码算法bpg在随着量化级数的增加,容易导致计算量呈现指数上涨,增加计算复杂度,从而使得编码效率低,导致压缩性能低。因此,现有技术有待于改进和发展。
技术实现思路
基于此,有必要针对上述的技术问题,提供一种图像编码、解码方法及系统,旨在将编码模型与解码模型所构成的变分自编码网络在编解码图片的过程中采用不同的激活函数Softplus、relu以及leakyrelu,实现最佳拟合方差,降低计算误差,同时通过减低残差块的通道数和个数,更进一步减少用户使用的显存量和计算量,提高压缩性能和压缩比,达到最佳的压缩效果。为了达到上述目的,本专利技术采取了以下技术方案:一种图像编码方法,所述图像编码方法包括以下步骤:将原始图片作为输入图像,输入至有损编码网络,通过所述有损编码网络输出原始图片对应的初始特征图;将所述初始特征图量化后得到的初始量化特征图输入至无损编码网络,通过所述无损编码网络输出初始量化特征图对应的初始概率图;将初始量化特征图和初始概率图进行算术编码,得到压缩后的中间文件。可选的,所述有损编码网络和所述无损编码网络构成编码模型,所述有损编码网络包括上采样模块、下采样模块以及连接模块;所述通过所述有损编码网络输出原始图片对应的初始特征图具体包括:将原始图片输入至上采样模块,通过上采样模块输出原始图片对应的第一特征图;将第一特征图输入至下采样模块,通过下采样模块输出若干第二特征图;将第一特征图以及所述若干第二特征图输入所述连接模块,通过所述连接模块输出所述原始图片对应的初始特征图。可选的,所述上采样模块包括若干第一卷积层,所述将原始图片输入至上采样模块,通过上采样模块输出原始图片对应的第一特征图具体包括:将原始图片依次输入至各第一卷积层,通过各第一卷积层依次输出若干中间第一特征图;直至通过最后一个第一卷积层输出原始图片对应的第一特征图。可选的,所述下采样模块包括并列设置的若干第二卷积层,所述将第一特征图输入至下采样模块,通过下采样模块输出若干第二特征图具体包括:获取各第一卷积层输出的若干中间第一特征图;将若干中间第一特征图分别对应输入至若干第二卷积层,通过各第二卷积层输出若干第二特征图。可选的,所述连接模块包括连接层和第三卷积层,所述将第一特征图以及所述若干第二特征图输入所述连接模块,通过所述连接模块输出所述原始图片对应的初始特征图具体包括:获取原始图片对应的第一特征图以及若干第二特征图;将所述第一特征图与所有的第二特征图输入至连接层,通过所述连接层输出第三特征图;将所述第三特征图输入至所述第三卷积层,通过所述第三卷积层输出原始图片对应的初始特征图。可选的,所述无损编码网络包括概率编码模块和先验估计模块,所述先验估计模块用于辅助所述概率编码模块,且根据所述初始量化特征图获取预估方差;所述概率编码模块包括第四卷积层和第五卷积层,所述将所述初始特征图量化后得到的初始量化特征图输入至所述无损编码网络,通过所述无损编码网络输出初始量化特征图对应的初始概率图具体包括:将所述初始特征图进行取整量化处理,得到初始量化特征图;将所述初始量化特征图进行切片操作,得到各初始量化特征图对应的若干切片特征图;将各切片特征图分别输入至第四卷积层,通过所述第四卷积层和leakyrelu激活函数,输出若干第一切片特征图;将各第一切片特征图输入至第五卷积层,通过所述第五卷积层和softplus激活函数拟合所述预估方差,输出各初始量化特征图对应的初始概率图。本专利技术还提供一种图像解码方法,所述图像解码方法包括以下步骤:将待解压的中间文件输入至无损解码网络,通过所述无损解码网络输出初始量化特征图;其中,所述中间文件是基于如权利要求1所述的中间文件;将所述初始量化特征图输入至有损解码网络,通过所述有损解码网络输出初始图片;将所述初始图片输入至后增强网络,通过所述后增强网络输出原始图片。可选的,所述无损解码网络、所述有损解码网络以及所述后增强网络构成解码模型,所述有损解码网络包括依次连接的若干第一残差块和若干第六卷积层,所述将所述初始量化特征图输入至有损解码网络,通过所述有损解码网络输出初始图片具体包括:将所述初始量化特征图输入至第一残差块,通过所述第一残差块输出初始量化特征图对应的中间图;将所述中间图输入至第六卷积层,通过第六卷积层和反归一操作,输出初始量化特征图对应的初始图片。可选的,所述后增强网络包括两层第七卷积层,两层第七卷积层之间设置有若干第二残差块,所述将所述初始图片输入至后增强网络,通过所述后增强网络输出原始图片具体包括:将获取的初始图片输入至第七卷积层,通过所述第七卷积层输出初始图片对应的第一增强图片;将所述第一增强图片依次输入至各第二残差块,通过每个第二残差块输出所述第一增强图片对应的第二增强图片;将所述第二增强图片输入至最后一层第七卷积层,通过所述最后一层第七卷积层输出初始图片对应的第三增强图片,即所述第三增强图片为原始图片。本专利技术还提供一种系统,所述系统包括发送终端和接收终端,所述发送终端和所述接收终端均包括处理器与所述处理器连接的存储器,针对发送终端,所述存储器存储有并可在所述处理器上运行的图像编码程序,所述图像编码程序被所述处理器执行时实现上述所述的图像编码方法;针对接收终端,所述存储器存储有并可在所述处理器上运行的图像解码程序,所述图像解码程序被所述处理器执行时实现上述所述的图像解码方法的步骤。有益效果:相较于现有技术,本专利技术提供的一种图像编码、解码方法及系统,其编码模型与解码模型构成了变分自编码网络,本专利技术通过变分自编码网络旨在编解码图片的过程中采用激活函数Softplus、relu以及leakyrelu,实现最佳拟合方差,降低计算误差,同时通过减低残差块的通道数和个数,更进一步减少用户使用的显存量和计算量,提高压缩性能,达到最佳的压缩效果。附图说明图1为本专利技术提供的一种图像编码方法的流程图。图2为本专利技术提供的编码模型和解码模型整体的结构框图。图3为本专利技术提供的先验估计模块Z的结构框图。图4为本专利技术提供的概率编码模块本文档来自技高网...

【技术保护点】
1.一种图像编码方法,其特征在于,所述图像编码方法包括以下步骤:/n将原始图片作为输入图像,输入至有损编码网络,通过所述有损编码网络输出原始图片对应的初始特征图;/n将所述初始特征图量化后得到的初始量化特征图输入至无损编码网络,通过所述无损编码网络输出初始量化特征图对应的初始概率图;/n将初始量化特征图和初始概率图进行算术编码,得到压缩后的中间文件。/n

【技术特征摘要】
1.一种图像编码方法,其特征在于,所述图像编码方法包括以下步骤:
将原始图片作为输入图像,输入至有损编码网络,通过所述有损编码网络输出原始图片对应的初始特征图;
将所述初始特征图量化后得到的初始量化特征图输入至无损编码网络,通过所述无损编码网络输出初始量化特征图对应的初始概率图;
将初始量化特征图和初始概率图进行算术编码,得到压缩后的中间文件。


2.根据权利要求1所述的图像编码方法,其特征在于,所述有损编码网络和所述无损编码网络构成编码模型,所述有损编码网络包括上采样模块、下采样模块以及连接模块;所述通过所述有损编码网络输出原始图片对应的初始特征图具体包括:
将原始图片输入至上采样模块,通过上采样模块输出原始图片对应的第一特征图;
将第一特征图输入至下采样模块,通过下采样模块输出若干第二特征图;
将第一特征图以及所述若干第二特征图输入所述连接模块,通过所述连接模块输出所述原始图片对应的初始特征图。


3.根据权利要求2所述的图像编码方法,其特征在于,所述上采样模块包括若干第一卷积层,所述将原始图片输入至上采样模块,通过上采样模块输出原始图片对应的第一特征图具体包括:
将原始图片依次输入至各第一卷积层,通过各第一卷积层依次输出若干中间第一特征图;
直至通过最后一个第一卷积层输出原始图片对应的第一特征图。


4.根据权利要求3所述的图像编码方法,其特征在于,所述下采样模块包括并列设置的若干第二卷积层,所述将第一特征图输入至下采样模块,通过下采样模块输出若干第二特征图具体包括:
获取各第一卷积层输出的若干中间第一特征图;
将若干中间第一特征图分别对应输入至若干第二卷积层,通过各第二卷积层输出若干第二特征图。


5.根据权利要求4所述的图像编码方法,其特征在于,所述连接模块包括连接层和第三卷积层,所述将第一特征图以及所述若干第二特征图输入所述连接模块,通过所述连接模块输出所述原始图片对应的初始特征图具体包括:
获取原始图片对应的第一特征图以及若干第二特征图;
将所述第一特征图与所有的第二特征图输入至连接层,通过所述连接层输出第三特征图;
将所述第三特征图输入至所述第三卷积层,通过所述第三卷积层输出原始图片对应的初始特征图。


6.根据权利要求1所述的图像编码方法,其特征在于,所述无损编码网络包括概率编码模块和先验估计模块,所述先验估计模块用于辅助所述概率编码模块,且根据所述初始量化特征图获取预估方差;所述概率编码模块包括第四卷积层和第五卷积层,
所述将所述初始特征图量化后得到的初始量化特征图输入至所述无损编码网络,通过所述...

【专利技术属性】
技术研发人员:肖云雷刘阳兴
申请(专利权)人:武汉TCL集团工业研究院有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1