基于深度学习的可变码率图像编码、解码系统及方法技术方案

技术编号：21577707 阅读：21 留言：0更新日期：2019-07-10 17:08

本发明专利技术公开了一种基于深度学习的可变码率图像编码系统及方法，包括：正向多尺度分解变换网络模块，将输入原始图像分解为多个尺度的图像特征；量化模块，将图像特征量化成整数；自适应码率分配模块，根据给定的目标码率对量化成整数的图像特征进行块级别的码率分配；熵编解码模块，将进行码率分配后的图像特征编码为二进制码流；同时提供了一种可变码率图像解码系统及方法，用于解码上述编码系统及方法形成的编码。本发明专利技术使用深度卷积神经网络构建正反多尺度分解变换，利用大量数据进行训练得到最优模型参数，结合基于图像复杂度的自适应码率分配方法，在实际应用中可实现可变码率图像编解码。

Variable Bit Rate Image Coding and Decoding System and Method Based on Deep Learning

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习的可变码率图像编码、解码系统及方法
本专利技术涉及一种图像编码系统及方法，特别是涉及一种基于深度学习的可变码率图像编码、解码系统及方法。
技术介绍
如今多媒体数据占据了互联网的绝大部分流量。对于视频图像数据的压缩对于多媒体数据的存储和高效传输有着至关重要的作用。所以图像编码是一项具有重大实用价值的技术。对于图像编码的研究已经有较长的历史了，研究人员提出了大量的方法，并制定了多种国际标准，比如JPEG，JPEG2000，WebP，BPG等图像编码标准。这些编码方法虽然在目前都得到了广泛应用，但是针对现在不断增长的图像数据量及不断出现的新媒体类型，这些传统方法显示出了某些局限性。由于这些方法都是针对某种类型的图像基于特征工程，手工设计的操作，因此对于不断出现的新媒体类型，比如虚拟现实图像，全景图像，广场图像等，缺乏自适应性。因此在未来的图像应用中，需要改进的或全新的编码方法。近年来，开始有研究人员开展了基于深度学习图像编码方法的研究。有些研究人员已经取得了不错的成果，比如Ballé等人提出了一种端到端优化的图像编码方法，取得了超越目前最好的图像编码性能，甚至超越了目前最好的传统编码标准BPG。不过目前大多数基于深度卷积网络的图像编码都有一个缺陷，即一个训练好的模型针对一种输入图像只能输出一种编码结果，而不能根据实际需求，得到目标码率的编码结果。这个缺点严重限制了基于深度学习的图像编码的实际应用，因为根据带宽过存储需求，输出目标码率对于实际应用至关重要。目前没有发现同本专利技术类似技术的说明或报道，也尚未收集到国内外类似的资料。
技术实现思路
本专利技术...

【技术保护点】
1.一种基于深度学习的可变码率图像编码系统，其特征在于，包括：正向多尺度分解变换网络模块，该模块基于深度卷积神经网络，将输入原始图像分解为多个尺度的图像特征并发送至量化模块，其中每一个尺度的图像特征对应于一个质量等级的编码结果；量化模块，将每一个尺度的图像特征量化成整数，并发送至自适应码率分配模块；自适应码率分配模块，根据给定的目标码率对整数图像特征进行块级别的码率分配，得到当前图像块的目标码率，选择与当前图像块的目标码率最接近的整数图像特征作为编码结果发送至熵编码模块；熵编码模块，将整数图像特征编码为二进制码流并输出。

【技术特征摘要】
1.一种基于深度学习的可变码率图像编码系统，其特征在于，包括：正向多尺度分解变换网络模块，该模块基于深度卷积神经网络，将输入原始图像分解为多个尺度的图像特征并发送至量化模块，其中每一个尺度的图像特征对应于一个质量等级的编码结果；量化模块，将每一个尺度的图像特征量化成整数，并发送至自适应码率分配模块；自适应码率分配模块，根据给定的目标码率对整数图像特征进行块级别的码率分配，得到当前图像块的目标码率，选择与当前图像块的目标码率最接近的整数图像特征作为编码结果发送至熵编码模块；熵编码模块，将整数图像特征编码为二进制码流并输出。2.根据权利要求1所述的一种基于深度学习的可变码率图像编码系统，其特征在于，所述正向多尺度分解变换网络模块基于深度卷积神经网络构建而成，其中：卷积层采用标准的卷积神经网络层；归一化层采用广义归一化层；通道连接操作将特征图在通道维度上连接在一起，输出多个尺度的图像特征。3.根据权利要求1所述的一种基于深度学习的可变码率图像编码系统，其特征在于，所述自适应码率分配模块采用基于图像复杂度的码率分配方法，将当前图像块复杂度与剩余图像块复杂度和的比值作为分配比率，将给定的目标码率按照分配比率分配到当前图像块，得到当前图像块的目标码率。4.根据权利要求1所述的一种基于深度学习的可变码率图像编码系统，其特征在于，所述熵编码模块基于二进制数字编码，采用的熵编码模型通过网络训练及测试过程统计更新得到；其中，网络训练过程采用概率模型进行近似，测试过程采用的概率模型由网络训练完成后的概率模型离线计算得到，并保存在熵编码模块中。5.根据权利要求4所述的一种基于深度学习的可变码率图像编码系统，其特征在于，所述网络训练过程为：利用随机梯度下降算法，对概率模型参数进行优化，直到率失真损失收敛。6.一种可变码率图像解码系统，其特征在于，用于解码权利要求1所述系统形成的编码，包括：熵解码模块，对经过熵编码后输出的二进制码流进行熵解码，得到图像特征并输出至反向多尺度分解变换网络模块；反向多尺度分解变换网络模块，基于深度卷积神经网络将熵解码得到的图像特征重构为解码图像并输出。7.根据权利要求6所述的一种可变码率图像解码系统，其特征在于，所述反向多尺度分解变换网络模块基于深度卷积神经网络构建而成，其中：反卷积层采用标准的卷积神经网络层；反归一化层采用广义反归一化层；通道分离操作将熵解码得到的图像特征在通道维度上平均分成多组特征图输出。8.根据权利要求6所述的一种可变码率图像解码系统，其特征在于，所述熵解码模块基于二进制数字解码，采用的熵解码模型通过网络训练及测试过程统计更新得到；其中，网络训练过程采用基于线性样条插值的概率模型进行近似，测试过程采用的概率模型由网络训练完成后的概率模型离线计算得到，并保存在熵解码模块中。9.一种基于深度学习的可变码率图像编码方法，其特征在于，包括：S1，采用深度卷积神经网络，...

【专利技术属性】
技术研发人员：陈立，蔡春磊，张小云，高志勇，鲁国，
申请(专利权)人：上海交通大学，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人