一种基于插值重建的彩色图像压缩方法技术

技术编号:19126535 阅读:71 留言:0更新日期:2018-10-10 07:56
本发明专利技术属于图像压缩技术领域,提供一种基于插值重建的彩色图像压缩方法,用以克服传统彩色图像压缩编码技术中色度分量的下采样插值重建失真明显这一问题。本发明专利技术压缩方法利用所提出的基于插值压缩的自适应滤波器对色度分量进行滤波处理,在大幅节省码率的同时,为解码端色度分量的插值重建提供了更多先验信息,插值质量高,最终合成的RGB彩色图像色彩保真度高;与此同时,本发明专利技术有效地节省了编码码率,进而提升了彩色图像整体的编码效率。

【技术实现步骤摘要】
一种基于插值重建的彩色图像压缩方法
本专利技术属于图像压缩
,具体涉及一种基于插值重建的彩色图像压缩方法。
技术介绍
彩色图像作为多媒体信息的重要载体,具有直观易懂、生动形象等诸多优点,符合人类对于信息的认知方式,被认作是一种高效传播信息的手段。在信息产业飞速发展的今天,彩色图像处理与传输技术凭借着能以较低的数据量存储和传输高质量的图像的特点,已经成为网络信息传递的关键技术。由于彩色图像数据本身具有数据量大的特点,为了提升编码效率,彩色图像压缩编码的方法通常是将原始图像从RGB空间转换到YUY空间,根据不同的应用场景以及实际需求,按不同的采样格式进行压缩编码。由于人眼对彩色图像的亮度信息Y较为敏感,而色度信息Cb、Cr不敏感,因此在对彩色图像的压缩编码中,通常是对色度分量进行下采样编码,以达到节省码率的目的,常见的采样格式有YCbCr4:2:0、YCbCr4:2:2、YCbCr4:1:1,如文献:“BT.601-7:Studioencodingparametersofdigitaltelevisionforstandard4:3andwidescreen16:9aspectratios,2011”。然而,传统的基于色度空间下采样的彩色图像压缩方法在解码端是通过简单的插值算法重建色度分量,而插值算法往往受限于先验信息不足等诸多条件,无法得到较高质量的插值图像;因此,传统的彩色图像压缩方法虽然具有较高的压缩率,但压缩后的RGB图像常存在色彩失真,尤其是对于色彩丰富的高保真图像,压缩图像存在明显的质量退化。
技术实现思路
本专利技术的目的在于针对上述技术问题提供一种新型的基于插值重建的彩色图像压缩方法,用以克服传统彩色图像压缩编码技术中色度分量的下采样插值重建失真明显这一问题,该压缩方法利用所提出的基于插值压缩的自适应滤波器对色度分量进行滤波处理,在大幅节省码率的同时,为解码端色度分量的插值重建提供了更多先验信息,从而使整张彩色图像的压缩编码效率提高;与传统的彩色图像压缩编码相比,本专利技术对色度分量的插值重建的质量更高、码率更低,彩色图像整体的编码效率有明显的提升。为实现上述目的,本专利技术采用的技术方案为:为了方便描述本专利技术的内容,首先做以下术语定义:定义1:标准的RGB与YCbCr色彩空间转换方法RGB-YCbCr的转换公式为:Y=0.257*R+0.504*G+0.098*B+16Cb=-0.148*R-0.291*G+0.439*B+128Cr=0.439*R-0.368*G-0.071*B+128YCbCr-RGB转化公式:R=1.164*(Y-16)+1.596*(Cr-128)G=1.164*(Y-16)-0.813*(Cr-128)-0.392*(Cb-128)B=1.164*(Y-16)+2.017*(Cb-128);定义2:二维离散余弦变换根据离散余弦变换矩阵,将图像块从像素域转换到变换域,获得变换系数矩阵;定义3:bicubic插值方法对每一个需要插值的像素点(x,y),取其附近的4×4邻域点(xi,yj)(i,j=0,1,2,3),按如下公式进行插值计算:W为插值系数矩阵,f(x,y)为像素点(x,y)的像素值;定义4:传统的Kronecker乘法传统的Kronecker乘法表示为其中,表示Kronecker乘法算子,A是大小为m×n的矩阵,并且:B是大小为p×q的矩阵,C是大小为mp×nq的矩阵,定义5:l1范数约束l1范数是指向量中各个元素绝对值之和,也称Lassoregularization;如果用l1范数来规则化一个参数向量X,就是希望X的大部分元素都是0,也就是让参数X是稀疏的;定义6:快速迭代阈值收敛算法快速迭代阈值收缩算法(Afastiterativeshrinkage-thresholdingalgorithm)是一种基于梯度下降思想的l1范数优化方法,与传统梯度下降方法相比,迭代过程中修正方式的选择更为合理,收敛速度更快;定义7:软门限操作软门限操作是快速迭代阈值收缩算法针对梯度下降思想最重要的改进,能够有效地选取更加合适的下一次迭代序列,使得整个迭代算法快速地收敛;定义8:图像编码变换系数的Zig-Zag扫描顺序一个8×8变换系数矩阵的扫描顺序如下所示:矩阵中数值的大小代表了Zig-Zag扫描的先后顺序。本专利技术提供的一种基于插值重建的彩色图像压缩方法,其特征在于,包括以下步骤:步骤1,色彩空间转换:采用RGB-YCbCr图像色彩空间转换方法,将输入的彩色图像从RGB空间转换为YCbCr图像,得到图像亮度分量Y和色度分量Cb、Cr;步骤2,对亮度分量Y进行二维离散余弦变换(DCT变换):将亮度分量Y分成N=(W×H)/82个互不重叠,大小为8×8的正方形图像块,对每个图像块进行二维离散余弦变化,得到N个亮度分量Y的变换系数矩阵;其中,W表示图像的宽度、H表示图像的高度;步骤3,利用基于插值压缩的自适应滤波器对色度分量Cb、Cr分别进行滤波处理:将色度分量Cb、Cr分成M=(W×H)/162个互不重叠,大小为16×16的正方形图像块;对于一个16×16的图像块,选取奇数行奇数列对应的64个像素点,称之为保留点,并将其坐标记录、记为Ω;然后,将图像块按列排列转化成向量x,x中对应的保留点用xΩ表示;设定插值矩阵为H(插值矩阵由bicubic插值方法决定),那么插值重建的向量表示为:为了使重建的向量尽可能和原始图像向量x相同,令其差值的二范数最小,得到优化后保留点集合设定T是由两个16×16的DCT变换矩阵C通过传统的Kronecker乘法得到的一个256×256的变换矩阵:其中、符号表示传统的Kronecker算子;选取T的逆矩阵T-1中的64个对应坐标Ω的行,组成新的维度为64×256的矩阵Λ,则xΩ=ΛX、X表示系数向量,据此将公式(2)转化为:为了使系数向量X稀疏化,对公式(3)加上l1范数约束,即得到目标方程:其中,||·||2表示二范数,||·||1表示一范数;通过快速迭代阈值收敛算法求解上述目标方程最优解将其还原成16×16的变换系数矩阵;由于迭代过程中将变换系数矩阵除左上角8×8块位置Π以外的系数强制置0,因此对变换系数矩阵做下采样,仅保留左上角8×8大小的变换系数矩阵,用于后续的压缩编码;对Cb、Cr分量的每一个16×16图像块均进行上述滤波处理,得到M个Cb、Cr分量的变换系数矩阵;进一步的,上述目标方程最优解的计算过程如下:a)初始化:设X(0)=X(1)=T-1x,X(0)表示系数向量X的初始值、X(1)表示系数向量X的第一次迭代值;预设中间变量t0=t1=1,t0表示中间变量t的初始值、t1表示中间变量t的第一次迭代值;b)按照如下迭代公式进行依次迭代:假设X(i+1)对应的一个16×16的变换系数矩中,左上角8×8块的坐标集合为Π;若系数向量X(i+1)的位置坐标不属于Π,则强制置0;其中,i表示迭代次数,λ、L均为预设常量,soft(·)表示软门限操作;c)当迭代误差小于预设门限或者迭代次数达到预设最大迭代次数,则停止迭代,输出最优系数向量步骤4,将分量Y、Cb、Cr的变换系数矩阵压缩编码得到编码码流:分别对分量Y、分量Cb、分量Cr的每个本文档来自技高网...
一种基于插值重建的彩色图像压缩方法

【技术保护点】
1.一种基于插值重建的彩色图像压缩方法,其特征在于,包括以下步骤:步骤1,色彩空间转换:采用RGB‑YCbCr图像色彩空间转换方法,将输入的彩色图像从RGB空间转换为YCbCr图像,得到图像亮度分量Y和色度分量Cb、Cr;步骤2,对亮度分量Y进行二维离散余弦变换:将亮度分量Y分成N=(W×H)/82个互不重叠,大小为8×8的正方形图像块,对每个图像块进行二维离散余弦变化,得到N个亮度分量Y的变换系数矩阵;其中,W表示图像的宽度、H表示图像的高度;步骤3,利用基于插值压缩的自适应滤波器对色度分量Cb、Cr分别进行滤波处理:将色度分量Cb、Cr分成M=(W×H)/162个互不重叠,大小为16×16的正方形图像块;对于一个16×16的图像块,选取奇数行奇数列对应的64个像素点,称之为保留点,并将其坐标记录、记为Ω;然后,将图像块按列排列转化成向量x,x中对应的保留点用xΩ表示;设定插值矩阵为H,则插值重建的向量

【技术特征摘要】
1.一种基于插值重建的彩色图像压缩方法,其特征在于,包括以下步骤:步骤1,色彩空间转换:采用RGB-YCbCr图像色彩空间转换方法,将输入的彩色图像从RGB空间转换为YCbCr图像,得到图像亮度分量Y和色度分量Cb、Cr;步骤2,对亮度分量Y进行二维离散余弦变换:将亮度分量Y分成N=(W×H)/82个互不重叠,大小为8×8的正方形图像块,对每个图像块进行二维离散余弦变化,得到N个亮度分量Y的变换系数矩阵;其中,W表示图像的宽度、H表示图像的高度;步骤3,利用基于插值压缩的自适应滤波器对色度分量Cb、Cr分别进行滤波处理:将色度分量Cb、Cr分成M=(W×H)/162个互不重叠,大小为16×16的正方形图像块;对于一个16×16的图像块,选取奇数行奇数列对应的64个像素点,称之为保留点,并将其坐标记录、记为Ω;然后,将图像块按列排列转化成向量x,x中对应的保留点用xΩ表示;设定插值矩阵为H,则插值重建的向量表示为:进而得到保留点集合优化方程:设定T是由两个16×16的DCT变换矩阵C通过传统的Kronecker乘法得到的一个256×256的变换矩阵:其中、符号表示传统的Kronecker算子;选取T的逆矩阵T-1中的64个对应坐标Ω的行,组成新的维度为64×256的矩阵Λ,则xΩ=ΛX、X表示系数向量;据此将上述优化方程转化为如下目标方程:其中,||·||2表示二范数,||·||1表示一范数;通过快速迭代阈值收敛算法求解上述目标方程最优解将其还原成16×16的变换系数矩阵,并对变换系数矩阵做下采样,保留左上角8×8大小的变换系数矩阵;对Cb、Cr分量的每一个16×16图像块均进行上述滤波处理,得到M个Cb、Cr分量的变换系数矩阵;步骤4,将分量Y、Cb、Cr的变换系数矩阵...

【专利技术属性】
技术研发人员:朱树元何志应王岩
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1