一种频域上的JPEG压缩图像质量增强方法技术

技术编号:37232871 阅读:7 留言:0更新日期:2023-04-20 23:15
本发明专利技术公开了一种频域上的JPEG压缩图像质量增强方法,首先将原始图像压缩成对应的JPEG压缩图像;将RGB三通道形式的压缩图像转换为YUV图像;再将YUV形式的压缩图像进行8

【技术实现步骤摘要】
一种频域上的JPEG压缩图像质量增强方法


[0001]本专利技术涉及图像处理、计算机视觉领域,具体涉及一种在频域上的压缩图像质量增强方法。

技术介绍

[0002]JPEG是目前使用最广泛的图像有损压缩标准,其压缩是在频域上通过量化实现的。由于人眼对高频信息较不敏感,因此JPEG通过对高频信息进行较大程度的压缩来大幅缩小图像体积。具体来说,JPEG压缩标准将图像分为8
×
8像素的图像块,并对每个块进行离散余弦变换(DCT),得到DCT系数矩阵。进一步,DCT系数矩阵被量化并进行编码,通过对高频部分的系数赋予较大的量化参数来实现压缩。然而,随着压缩比的增大,高频信息的严重丢失带来的伪影会显著降低图像的观看质量。
[0003]现有的压缩图像增强技术大多在像素域上对图像进行增强。虽然像素域上的处理方法可以直接利用像素间的相关信息对伪影进行消除,但是很难利用上DCT域中的先验信息,因此增强的效果非常有限。

技术实现思路

[0004]基于现有技术所存在的问题,本专利技术的目的是提供一种频域上的JPEG压缩图像质量增强方法,在进行JEPG压缩图像质量增强任务中与现有的方法相比具有更好的效果。
[0005]本专利技术提供一种频域上的JPEG压缩图像质量增强方法,采用频域压缩图像质量增强网络模型,利用训练好的所述图像质量增强网络模型对低质量的压缩图像进行增强处理,增强处理后得到高质量的图像。
[0006]一种频域上的JPEG压缩图像质量增强方法,步骤如下:
[0007]步骤一,将原始图像压缩成对应的JPEG压缩图像。
[0008]步骤二,将RGB三通道形式的压缩图像转换为YUV图像。
[0009]步骤三,将YUV形式的压缩图像进行8
×
8尺寸的二维DCT变换。
[0010]步骤四,搭建图像增强网络模型。
[0011]步骤五,训练图像增强网络模型。
[0012]步骤六,将DCT系数矩阵输入模型,得到经过模型增强后的DCT系数矩阵。
[0013]步骤七,对增强后的DCT系数矩阵进行8
×
8二维IDCT变换,得到增强后的YUV420图像。
[0014]步骤八,将增强后的YUV420图像转换为最终的RGB图像。
[0015]本专利技术有益效果如下:
[0016]通过采用提出的频域压缩图像质量增强网络模型作为质量增强模型,对JPEG压缩图像进行增强,使经过网络增强后的JPEG压缩图像的观感质量获得提升。
附图说明
[0017]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
[0018]图1为本专利技术实施例提供的图像增强方法的流程图;
[0019]图2为本专利技术实施例提供的图像增强方法的网络模型的结构原理图;
[0020]图3为使用本专利技术实施例提供的图像增强方法对原图像进行增强后的对比图。
具体实施方式
[0021]下面结合本专利技术的具体内容,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术的保护范围。本专利技术实施例中未作详细描述的内容属于本领域专业技术人员公知的现有技术。
[0022]如图1所示,本专利技术实施例提供一种图像增强方法,采用神经网络模型对压缩图像进行增强,包括:
[0023]步骤一,将原始图像压缩成对应的JPEG压缩图像。
[0024]步骤二,将RGB三通道形式的压缩图像转换为YUV图像。
[0025]步骤三,将YUV形式的压缩图像进行8
×
8尺寸的二维DCT变换。
[0026]步骤四,搭建图像增强网络模型。
[0027]步骤五,训练图像增强网络模型。
[0028]步骤六,将DCT系数矩阵输入模型得到增强后的DCT系数矩阵。
[0029]步骤七,对增强后的DCT系数矩阵进行8
×
8二维IDCT变换,得到增强后的YUV420图像。
[0030]步骤八,将增强后的YUV420图像转换为RGB形式,最终得到增强后的RGB图像。
[0031]上述的步骤一具体方法如下:
[0032]使用FFmpeg编码器对原始图像进行指定质量因数(QF)的JPEG压缩,得到JPEG压缩图像。
[0033]上述的步骤二具体方法如下:
[0034]根据ITU.BT

601数据协议转换公式,将RGB形式的JPEG压缩图像转换为YUV420形式的JPEG压缩图像。
[0035]上述的步骤三具体方法如下:
[0036]将图像分割为8
×
8尺寸的图像块,对图像块分别进行二维DCT

2变换,将变换得到的图像块的DCT系数矩阵拼合得到整张图像的DCT系数矩阵,生成的DCT系数矩阵如图3中所示。
[0037]上述的步骤四具体方法如下:
[0038]图像增强网络模型结构如图2所示,网络通过Pixel Unshuffle对输入的DCT系数矩阵进行8倍的降采样,使DCT系数矩阵的长和宽都变为输入的DCT系数矩阵的1/8,DCT系数
矩阵的通道数变为输入的DCT系数矩阵的64倍。
[0039]经过降采样后的DCT系数矩阵经过一层卷积核大小为3
×
3的二维卷积处理。
[0040]之后通过一组由卷积核大小为3
×
3的二维卷积组成的DenseNet来进行特征提取。
[0041]再采用一个3
×
3卷积作为特征映射层,对DenseNet产生的卷积特征进行重映射。
[0042]最后通过Pixel Unshuffle对DCT系数矩阵进行8倍的上采样,使DCT系数矩阵的长和宽变换到输入网络前的大小,DCT系数矩阵的通道数变换到于输入网络前相同。
[0043]上述的步骤五具体方法如下:
[0044]训练使用的数据集为一组未经过压缩的原图像和对应的经过指定质量因数(QF)的JPEG压缩图像。为扩充数据集样本数,使网络有更好的泛化性,将原图像和压缩图像对应组成的图像对进行相同的随机反转和旋转操作,为加快训练速度,将图像对再进行随机选取裁剪位置的裁剪操作,裁剪成96
×
96的图像输入网络进行训练。
[0045]训练采用Adam优化器作为优化器,采用L2损失函数作为损失函数。
[0046]训练过程中,初始学习率设定为1e

4,当连续5个epoch的验证集的客观评价指标没有进一步提高时,学习率降低到当前值的一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种频域上的JPEG压缩图像质量增强方法,其特征在于,步骤如下:步骤一,将原始图像压缩成对应的JPEG压缩图像;步骤二,将RGB三通道形式的压缩图像转换为YUV图像;步骤三,将YUV形式的压缩图像进行8
×
8尺寸的二维DCT变换;步骤四,搭建图像增强网络模型;步骤五,训练图像增强网络模型;步骤六,将DCT系数矩阵输入模型,得到经过模型增强后的DCT系数矩阵;步骤七,对增强后的DCT系数矩阵进行8
×
8二维IDCT变换,得到增强后的YUV420图像;步骤八,将增强后的YUV420图像转换为最终的RGB图像。2.根据权利要求1所述的一种频域上的JPEG压缩图像质量增强方法,其特征在于,步骤一具体方法如下:使用FFmpeg编码器对原始图像进行指定质量因数QF的JPEG压缩,得到JPEG压缩图像。3.根据权利要求2所述的一种频域上的JPEG压缩图像质量增强方法,其特征在于,步骤二具体方法如下:根据ITU.BT

601数据协议转换公式,将RGB形式的JPEG压缩图像转换为YUV420形式的JPEG压缩图像。4.根据权利要求3所述的一种频域上的JPEG压缩图像质量增强方法,其特征在于,步骤三具体方法如下:将图像分割为8
×
8尺寸的图像块,对图像块分别进行二维DCT

2变换,将变换得到的图像块的DCT系数矩阵拼合得到整张图像的DCT系数矩阵。5.根据权利要求4所述的一种频域上的JPEG压缩图像质量增强方法,其特征在于,步骤四具体方法如下:图像增强网络模型通过PixelUnshuffle对输入的DCT系数矩阵进行8倍的降采样,使DCT系数矩阵的长和宽都变为输入的DCT系数矩阵的1/8,DCT系数矩阵的通道数变为输入的DCT系数矩阵的64倍;经过降采样后的DCT系数矩阵经过一层卷积核大小为3
×
3的二维卷积处理;之后通过一组由卷积核大小为3
×
3的二维卷积组成的DenseNet来进行特征提取;再采用一...

【专利技术属性】
技术研发人员:颜成钢肇恒润陈楚翘朱尊杰高宇涵孙垚棋王鸿奎殷海兵胡冀张继勇李宗鹏
申请(专利权)人:杭电丽水研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1