视频编码和解码方法、设备及程序技术

技术编号:3609478 阅读:153 留言:0更新日期:2012-04-11 18:40
一种由视频编码设备编码一个分割成多个区域的活动图像的视频编码方法,该视频编码方法包括:    在编码包含多个图像的一个活动图像时确定每个图像的编码模式的步骤;    根据所述编码模式确定用于将所述图像分割成多个区域的区域构成单元的步骤;    根据区域构成单元来定义区域的步骤;    编码与如此定义的区域有关的区域信息的步骤;    根据编码模式按编码单元压缩编码在所述区域内包含的像素数据,从而生成压缩编码数据的步骤;和    输出编码模式、区域信息和压缩编码数据的输出步骤。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及活动图像的压缩编码和解码,尤其涉及一种有效地发送编码状态的方法。
技术介绍
活动图像信号的压缩编码技术通常用于活动图像信号的传输和存储再生。公知的技术包括诸如ITU-T建议书H.263、ISO/IEC国际标准14496-2(MPEG-4视频)等的国际标准视频编码方法。另一种公知的较新的编码系统是ITU-T和ISO/IEC共同国际标准化而制订的视频编码方法,即ITU-T建议书H.264和ISO/IEC国际标准14496-10。例如,在下面列出的非专利文献1中公开了在这些视频编码方法中使用的普通编码技术。非专利文献1《国际图像编码标准的基本技术》(Fumitaka Ono和HiroshiWatanabe合著,CORONA出版有限公司1998年3月20日出版)在这些编码方法中,一种编码设备被配置以将一个图像分割成多块区域,并在相同状态下对每块区域执行编码操作。该编码设备将每块区域内所包括的像素值分组成多个编码单元,此后,获得相对于预先确定的预测信号的余量,然后执行差值信号的离散余弦变换(DCT)、DCT系数的量化和已量化数据的可变长度编码。从而生成压缩编码数据(比特流)。编码单元的大小根据图像编码状态(在下文中称作“编码模式”)而不同。图1图示图像编码模式和编码单元之间的关系。这些编码模式中的一种模式是称作在不分离一个图像的扫描线的情况下执行编码的帧编码模式的编码模式(在下文中称作“帧模式”)。图1中的编号802表示这种帧模式。在这种情况下,编码单元是一个包括16×16个像素的宏块。与此相反地,在分离一个图像的扫描线的情况下执行编码的编码模式称作场编码模式(图1中的803,在下文中将称作“场模式”)。图1中的编号804表示将一个隔行扫描图像的扫描线分离出来形成偶数扫描线和奇数扫描线的情况。在这种情况下,编码单元是宏块单元,与在帧编码的情况下是类似的,但是在合并扫描线之后的编码单元是16×32个像素。此外,还存在一种按编码单元分离扫描线的情况下执行编码的模式和一种按编码单元不分离扫描线的情况下执行编码的模式。图1中的编号805代表按编码单元不分离扫描线的情况下执行编码的情况。在这种情况下的编码单元是宏块。按编码单元自适应地分离或不分离扫描线的情况下(在下文中称作“MB_AFF模式”),如图1中用806所表示的,用“宏块对”代表编码单元,每个宏块对包括16×32个像素。如上面所描述的,该编码设备根据编码模式改变编码单元的大小以获得一种最佳结构,从而执行高效的压缩编码。另一方面,在将一个图像分割成多块区域的情况下,还配置该编码设备来定义在编码模式中效率最高的编码单元内的区域。图2(a)和图2(b)图示使用现有技术分割的图像内的区域的例子。图2(a)的图像901被分割成两个区域,一个是填充与块902相同图案的区域,另一个是未填充的区域。在这里假设是帧模式,并以从图像中央开始的虚箭头904所示的顺序用宏块单元来定义区域903。图2(b)的图像905也被分割成两个区域,一个是填充与块906相同图案的区域,另一个是未填充的区域。在这里假设是MB_AFF模式,并以从图像中央开始的虚箭头908所示的顺序用“宏块对”单元来定义区域907。逐区域地将按编码单元编码的压缩编码数据放置在一起,并添加诸如编码模式和其它的相关信息,然后予以传输或者记录。通过逐区域地将压缩编码数据放置在一起,我们实现了即使出现因为某一区域内数据污损导致的错误,也可以抑制该错误到其它区域的扩展的优点。也可以执行按区域单元的并行处理,从而能够快速地操作。然而,上面的现有技术存在下述问题。即,它要求在将一个图像分割成多个区域的视频编码方法中,时间上相邻的图像的区域彼此一致。然而,在现有技术中,以编码单元为基础定义区域,而编码单元随着编码模式的不同而不同。因为这个原因,在相邻图像的编码模式彼此不同的情况下,即使在相同的状态下定义,区域的图案也将是不同的。例如,假设图像901和图像905是在时间上相邻的两个图像,因为各自图像的编码模式之间的不同,区域903和区域907的图案是不同的。在这样的不一致的情况下,相应的区域将随着时间改变它们的形状,当在时间轴上显示所述区域内的所述图像时,将使人感到明显的障碍。此外,通过观察图2(a)中的矩形909和图2(b)中的矩形910,可以看出矩形910的下半块属于图像901内的其它区域(未填充区域)。也就是说,在再生图像901的未填充区域之前,与矩形910的下半块相对应的块是不存在的。因此,在预测编码中未使用相关的块,因而,对压缩编码的效率造成不利的影响。
技术实现思路
因而,本专利技术的一个目的是减少活动图像的编码和解码中由于编码模式不同所导致的区域形状的变化,和提高压缩编码的效率。为了解决上述问题,根据本专利技术的一种视频编码方法是一种由视频编码设备编码一个分割成多个区域的活动图像的视频编码方法,该视频编码方法包括在编码包含多个图像的一个活动图像时确定每个图像的编码模式的步骤;根据编码模式确定用于将所述图像分割成多个区域的区域构成单元的步骤;根据区域构成单元来定义所述区域的步骤;编码与所述如此定义的区域有关的区域信息(例如与区域形状有关的信息)的步骤;根据编码模式按编码单元压缩编码在所述区域内包含的像素数据,从而生成压缩编码数据的步骤;和输出编码模式、区域信息和压缩编码数据的步骤。在根据本专利技术的视频编码方法中,可以从下列编码模式中选择一种编码模式在不分离构成一个图像的扫描线的情况下执行编码的帧模式;在分离构成一个图像的扫描线的情况下执行编码的场模式;将一个图像划分成多个编码单元和通过帧模式或场模式在每个编码单元内执行编码的编码单元转换模式;通过帧模式或场模式在每个图像单元内执行编码的图像单元转换模式;作为帧模式与编码单元转换模式之组合的第一组合模式;和作为场模式与图像单元转换模式之组合的第二组合模式。在根据本专利技术的视频编码方法中,每个编码单元可以是当编码模式是帧模式时一个包含N×N个像素的块;当编码模式是场模式时一个包含N×N个像素的块;或者当编码模式是编码单元转换模式时一个包含N×M(M是垂直像素的数量,M=2N)个像素的块。可以配置根据本专利技术的视频编码方法以便当用一种编码模式编码构成活动图像的所有图像时,区域构成单元是编码单元,和当用不同的编码模式编码构成活动图像的图像时,区域构成单元是不同编码模式的编码单元中最大的编码单元。根据本专利技术的视频解码方法是一种由视频解码设备解码一个分割成多个区域的活动图像的视频解码方法,该视频解码方法包括实现输入通过将图像分割成多个区域和对其执行压缩编码而根据构成一个活动图像的每个图像所生成的压缩编码数据的步骤;根据压缩编码数据确定每个图像的编码模式的步骤;根据编码模式确定将所述图像分割成多个区域所用的区域构成单元的步骤;根据压缩编码数据获得与区域有关的区域信息(例如与区域形状有关的信息)的步骤;根据区域构成单元和区域信息来定义区域的步骤;解码在编码单元中如此定义的区域内所包括的压缩编码数据,从而生成编码单元中的再生数据的步骤;和根据编码模式依据编码单元中的再生数据构造一个再生图像的步骤。在根据本专利技术的视频解码方法中,可以从下列编码模式中选择一种编码模式在不分离构成一个图像的扫本文档来自技高网
...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:陈朝庆安达悟加藤祯笃文中丞
申请(专利权)人:株式会社NTT都科摩
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1