嵌入的离散余弦变换式静止图像编码算法制造技术

技术编号:3616194 阅读:185 留言:0更新日期:2012-04-11 18:40
在一种嵌入的DCT式(EDCT)图像编码方法中,对每个位面的扫描次序是从一个DCT块(相当于DC系数)的左上角开始,并且按照重要性的次序发送这些系数,由此获得的图像比早先使用的JPEG和DCT式编码器具有更好的PSNR。用编码器产生一个嵌入的比特流。解码器可以在任何点上切断比特流,以便按照较低的速率重组一个图像。在这种低速率下重组的图像质量与直接用原速率编码的图像是相同的。在DCT系数的精度范围之内有可能重组出接近无损和无损的图像。该算法特别适用于诸如WWW,数据库的快速浏览,医疗图像等等各种应用。(*该技术在2018年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及静止图像的编码算法和用来执行这种算法的设备。该算法特别适合用来产生一种嵌入的比特流,并且用不同于其余图像的质量对一部分图像进行编码。在许多实际的图像/电视压缩系统中已经广泛地使用了变换编码。采用变换方式的基本目的是,在变换之后的图像压缩工作比空间域中的直接编码更容易。诸如JPEG,H261/H.263和MPEG等等大多数编码标准已经采用了离散余弦变换(DCT)的变换方法。近年来,大多数研究工作已经从DCT转向了小波变换,特别是在Shapiro发表了他对嵌入的零树小波(EZW)图像编码的研究报告之后,参见J.M.Shapiro“Embedded Image Coding using zerotrees ofwavelet coefficients”,IEEE Trans.on Signal Processing,Vol.41,No.12,pp.3445-3462,Dec.1993。W.B.Pennebaker,J.L.Mitchell的论文JPEG Still Image DataCompression Standard,Van Nostrand Reinhold,New York,1993描述了DCT式编码的现有技术状态。在许多应用中都需要获得一种嵌入的比特流。由于嵌入的比特流中包含在比特流开头嵌入的所有低速率,比特是按照从最重要到不太重要的顺序排列的。使用嵌入的编码,在达到比特计数的目标参数时就停止这种编码。按照类似的方式,对于嵌入的比特流来说,解码器可以在任何一点上停止解码,并且可以产生对应着所有低速率编码的再现。为了优化嵌入的比特流而需要首先发送对图像的视觉识别最重要的那些比特。这就相当于在低比特率下让比特流具有良好的压缩/质量比。DCT是正交的,这就意味着它会保存能量。换句话说,相对于均方根误差(RMSE)(或是峰值信-噪比-PSNR)来说,一定幅值的变换图像中的误差会在相同幅值的原始图像中产生一个误差。这就意味着应该首先发送具有最大幅值的系数,因为这其中具有最多的信息。同时还意味着可以用二进制表达方式来排列这种信息,并且应该首先发送最高有效位。在DCT变换之后,图像的大多数能量集中在低频系数中,而其余的系数具有很低的值。这就意味着在这些系数的最高有效位面(MSB)上有许多零。一直到找到某一系数的第一有效位(FSB)时为止,零的概率很高。因此,编码的任务也就变成了以一种有效的方式对这些零进行编码的任务。在Z.Xiong,O.Guleryuz,M.T.Orchard,″A DCT-based embeddedimage coder,IEEE Signal Processing Letters,Vol.3,No.11,pp.289-290,Nov.1996,N.K.Laurance,D.M.Monro,Embedded DCTcoding with significance masking″Proc.IEEE ICASSP 97,Vol.IV,pp.2717-2720,1997和J.Li,J.Li,C.-C.Jay Kuo,LayeredDCT still image compression,IEEE Tran.On Circuits and Systemsfor Video Technology,Vol.7,No.2,April 1997,pp.440-442的论文中,尽管也使用了DCT变换,系数的编码并不是按照JPEG编码的方式完成的,而是可以产生一种嵌入的比特流。本专利技术的目的是提供一种算法和执行这种算法的装置,用来输出一种嵌入的DCT式(EDCT)图像,由此所获得的解码图像比上述论文中所公开的从JPEG和DCT式编码器获得的图像具有更好的PSNR。本专利技术的另一个目的是提供一种方法,它可以用一种不同于其余图像的质量为图像中的Regions of Interest(ROI)(重要区域)进行编码,同时仍然保持算法的嵌入性质。这些目的是通过采用以下基本步骤的方法来实现的-将图像划分成方块。-单独用DCT变换每一块。变换产生一个块的系数,在左上角是DC系数,在对应着块的轴线方向上具有较高的水平和垂直频率系数。传统块使用8×8的尺寸,但是此处可以使用任何二的乘方的块尺寸。将尺寸限制为二的乘方是为了能快速地计算DCT。-以渐进的方式量化和发送DCT系数,以便首先发送最重要的信息。然而,为了在各种传输速率下实现有效的压缩,以便能在任何时间切断比特流并且在这一压缩比上仍然提供具有优异质量的图像,需要采用一种有效的扫描次序。按照本专利技术,每一个系数从最高有效位到最低有效位的第一个非零位被称为First有效位(FSB)。一个系数在第一有效位前面的位被称为Zero位(ZB)。用Sign位(SB)代表符号信息,而第一有效位后面的其余位被称为Raw位(RB)。编码是在逐个位面上进行的。在每个位面中从最低频率系数到最高频率系数进行编码。对于发送的每一个零位,将解码器得到的系数的不确定的间隔长度一分为二。如下文所述,在遇到第一有效位时,为了维持嵌入的代码,需要发送系数的符号。在符号位之后必须发送RB。这其中包含很少的冗余,并且用良好的预测尝试对这些冗余进行编码所带来的增益很小。接收机可以反过来执行这些步骤。产生的比特流被嵌入,并且解码器可以在任何点上切断比特流,并且所产生的图像与直接用这一比特率压缩时具有相同的质量。只要在这样的编码方案中使用这样的扫描次序,在所有压缩比下都可以获得很好的视觉质量。以下要参照附图详细地解释本专利技术,在附图中附图说明图1表示DCT系数是如何安排的;图2表示一个象素中的比特次序;图3表示嵌入的编码算法的扫描次序;图4表示一个符号位的发送;图5表示AC系数零位的前后关系;图6表示DC系数零位的前后关系;图7表示cut_off信号的前后关系;图8是这种编码程序的一个流程图。在图1中表示了一种8×8 DCT块的DCT系数的配置。因此,在左上角是低频系数,而在右下角是高频系数。每个系数用多个位来表示,例如在图2中是8位。图2中的前三位是零,称作零位(ZB),第四位不是零,被称为第一有效位(FSB),其它低位被称为原始位(RB)。在一个最佳实施例中,数字DCT变换图像的编码算法如下(1)找出所有DC系数的平均值(DC_平均)。从每个DC系数中减去这个值。(2)选择一个量值,它的大小是图像中最大数值系数的一半。发送这一量值。(3)传送/编码那些新系数比当前的量值更有效的信息以及这些系数的符号。一个系数比一个量值更有效的意思是说它的幅值比当前量值的绝对值大。(4)从这一位面中发现的有效系数幅值中减去当前的量值。用减去了当前量值的幅值代替这一有效系数的幅值。其差值相当于仅仅保留原始位。(5)针对在前一个位面中所有有效的系数,传送/编码关于该系数比该量值的幅值大或是小的信息。从大或是小的幅值中减去这一量值,并且用所得的值代替这些系数。这相当于发送一个原始位。(6)将当前的量值一分为二。这相当于进入这些系数的最低有效位。(7)从步骤(3)开始重复,直至耗尽位的堆积,或者是达到某种理想的质量。上述的步骤1是可以选择的。如果使用了这一步,就必须存储/发送DC系数的平均值。重组是按照以下步骤本文档来自技高网...

【技术保护点】
一种数字图像的压缩方法,包括以下步骤: -将图像划分成块, -对图像的每一块进行离散余弦变换(DCT), -用一个二进制位面来代表每一个块, 其特征是按照降低位面有效性的次序扫描和发送DCT系数,并且对每一个位面的每一个DCT块采用从左上角到右下角的扫描次序。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:C克里斯托普洛斯D尼斯特
申请(专利权)人:艾利森电话股份有限公司
类型:发明
国别省市:SE[瑞典]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1