通过使用大型变换单元编码和解码图像的方法和设备技术

技术编号:8961580 阅读:104 留言:0更新日期:2013-07-25 20:45
公开了一种用于通过将多个相邻预测单元组合为变换单元并将所述多个相邻预测单元变换为频域来编码图像的图像编码方法和设备,以及一种用于通过使用所述图像编码方法和设备来对编码的图像进行解码的图像解码方法和设备。

【技术实现步骤摘要】
通过使用大型变换单元编码和解码图像的方法和设备本申请是申请日为2010年8月13日,申请号为201310092700.3,专利技术名称为“通过使用大型变换单元编码和解码图像的方法和设备”的专利技术专利申请的分案申请。
示例性实施例涉及一种编码和解码图像的方法和设备,更具体地说,涉及一种通过将像素域的图像变换为频域的系数来对图像进行编码和解码的方法和设备。
技术介绍
为了执行图像压缩,多数图像编码和解码方法和设备通过将像素域的图像变换为频域的系数来对图像编码。作为频率变换技术之一的离散余弦变换(DCT)是广泛使用于图像和声音压缩中的公知技术。使用DCT的图像编码方法包括:对像素域的图像执行DCT,生成离散余弦系数,量化生成的离散余弦系数,对生成的离散余弦系数执行熵编码。
技术实现思路
技术方案示例性实施例提供一种通过使用更有效的离散余弦变换(DCT)来对图像进行编码和解码的方法和设备,还提供一种其上记录了用于执行所述方法的程序的计算机可读记录介质。有益效果根据一个或多个示例性实施例,可以将变换单元设置为比预测单元大,并执行DCT,从而可有效地对图像进行压缩和编码。附图说明通过参照附图详细描述本专利技术的示例性实施例,示例性实施例的以上和其它特点将变得更清楚,其中:图1是根据示例性实施例的图像编码设备的框图;图2是根据另一示例性实施例的图像解码设备的示图;图3是根据另一示例性实施例的层次编码单元;图4是根据另一示例性实施例的基于编码单元的图像编码器的框图;图5是根据另一示例性实施例的基于编码单元的图像解码器的框图;图6示出根据另一示例性实施例的最大编码单元、次级编码单元和预测单元;图7是根据另一示例性实施例的编码单元和变换单元的示图;图8A和图8B示出根据另一示例性实施例的最大编码单元、预测单元和变换单元的划分形状;图9是根据另一示例性实施例的图像编码设备的框图;图10是变换器的示图;图11A到图11C示出根据另一示例性实施例的变换单元的类型;图12示出根据另一示例性实施例的不同变换单元;图13是根据另一示例性实施例的图像解码设备的框图;图14是根据示例性实施例的图像编码方法的流程图;图15是根据另一示例性实施例的图像解码方法的流程图。最佳实施方式根据示例性实施例的一方面,提供了一种图像编码方法,包括以下操作:通过选择多个相邻预测单元来设置变换单元;根据变换单元将所述多个相邻预测单元变换为频域,并生成频率分量系数;量化频率分量系数;对量化的频率分量系数执行熵编码。可基于指示大小缩减的等级的深度来执行设置变换单元的操作,所述大小缩减从当前片段或当前图片的最大编码单元到包括所述多个相邻预测单元的次级编码单元逐级执行。可通过选择根据相同预测模式执行预测的多个相邻预测单元来执行设置变换单元的操作。相同预测模式可以是帧间预测模式或帧内预测模式。图像编码方法还可包括通过对不同的变换单元重复执行上述操作来设置最佳变换单元的操作,其中,上述操作包括以下操作:通过选择多个相邻预测单元来设置变换单元,根据变换单元将所述多个相邻预测单元变换为频域并生成频率分量系数,量化频率分量系数并对量化的频率分量系数执行熵编码。根据示例性实施例的另一方面,提供了一种图像编码设备,包括:变换器,通过使用多个相邻预测单元来设置变换单元,根据变换单元将所述多个相邻预测单元变换为频域并生成频率分量系数;量化单元,量化频率分量系数;熵编码单元,对量化的频率分量系数执行熵编码。根据示例性实施例的另一方面,提供了一种图像解码方法,包括以下操作:根据变换单元对通过被变换到频域而生成的频率分量系数进行熵解码;反量化频率分量系数;将频率分量系数反变换为像素域,并重构包括在变换单元中的多个相邻预测单元。根据示例性实施例的另一方面,提供了一种图像解码设备,包括:熵解码器,根据变换单元对通过被变换到频域而生成的频率分量系数进行熵解码的;反量化单元,反量化频率分量系数;反变换器,将频率分量系数反变换为像素域,并重构包括在变换单元中的多个相邻预测单元。根据示例性实施例的另一方面,提供了一种记录了用于执行图像编码和解码方法的计算机可读记录介质。具体实施方式在下文,将参照附图详细描述示例性实施例。在示例性实施例中,根据上下文,“单元”可表示或可不表示单元的大小,“图像”可表示视频的静止图像或运动图像(即,视频本身)。图1是根据示例性实施例的用于编码图像的设备100的框图。参照图1,设备100包括最大编码单元划分单元110、编码深度确定单元120、图像数据编码器130以及编码信息编码器140。最大编码单元划分单元110可基于作为最大大小的编码单元的最大编码单元划分当前图片或片段。也就是说,最大编码单元划分单元110可划分当前图片或片段以获得至少一个最大编码单元。根据示例性实施例,可使用最大编码单元和深度来表示编码单元。如上所述,最大编码单元指示当前图片的编码单元中的具有最大大小的编码单元,深度指示通过层次地减小编码单元而获得的次级编码单元的大小。随着深度增加,编码单元可在大小上从最大编码单元减小到最小编码单元,其中,最大编码单元的深度被定义为最小深度,最小编码单元的深度被定义为最大深度。由于编码单元的大小随着深度增加从最大编码单元减小,因此第k深度的次级编码单元可包括多个第(k+n)(k和n是等于或大于1的整数)深度的次级编码单元。根据将要编码的图片的大小的增加,以更大的编码单元对图像编码可得到更高的图像压缩率。然而,如果固定采用更大的编码单元,则考虑到连续变化的图像特征的因素,不能高效地编码图像。例如,当对诸如大海或天空的平滑区域进行编码时,编码单元越大,压缩率就会越增加。然而,当对诸如人物或建筑物的复杂区域进行编码时,编码单元越小,压缩率就会越增加。因此,根据示例性实施例,对每个图片或片段设置不同最大图像编码单元和不同最大深度。由于最大深度表示编码单元可减小的倍数的最大数量,因此可根据最大深度不同地设置包括在最大图像编码单元中的每个最小编码单元的大小。编码深度确定单元120确定最大深度。可基于速率失真(R-D)成本的计算来确定最大深度。可为每个图片或片段或每个最大编码单元不同地确定最大深度。确定的最大深度被提供到编码信息编码器140,根据最大编码单元的图像数据被提供到图像数据编码器130。最大深度表示可包括在最大编码单元中的具有最小大小的编码单元(即最小编码单元)。换句话说,最小编码单元可被划分为根据不同深度的具有不同大小的次级编码单元。稍后参照图8A到图8B对此详细描述。此外,可基于具有不同大小的处理单元预测或变换包括在最大编码单元中的具有不同大小的次级编码单元。换句话说,设备100可基于具有不同大小和不同形状的处理单元执行用于图像编码的多种处理操作。为了对图像数据进行编码,执行诸如预测、变换和熵编码的处理操作,其中,具有相同大小的处理单元可用于每个操作,或者具有不同大小的处理单元可用于每个操作。例如,设备100可选择与编码单元不同的处理单元来预测所述编码单元。当编码单元的大小是2N×2N(其中N是正整数)时,用于预测的处理单元可以是2N×2N、2N×N、N×2N和N×N。换句话说,可基于具有编码单元的高和宽中的至少一个被等分为二的形状的处理单元来执行运动预测。在下文,作本文档来自技高网...
通过使用大型变换单元编码和解码图像的方法和设备

【技术保护点】
一种图像解码设备,包括:处理器,通过使用从接收的编码视频的比特流解析的关于编码单元的划分形状的信息、关于用于预测每个编码单元的至少一个预测单元的信息、关于用于对每个编码单元进行反变换的至少一个变换单元的信息,来确定具有用于解码图像的层次结构的编码单元、所述至少一个预测单元和所述至少一个变换单元;解码器,从比特流解析通过根据通过划分编码单元产生的至少一个变换单元的变换而产生的变换系数,通过对解析的变换系数执行熵解码、反量化和反变换来重构所述至少一个预测单元的编码数据,对重构的编码数据执行帧内预测或帧间预测并对编码视频进行重构,其中,根据编码单元的深度层次地分割编码单元,其中,所述至少一个变换单元包括具有比所述至少一个预测单元的大小大的大小的变换单元。

【技术特征摘要】
2009.08.13 KR 10-2009-00748951.一种图像解码设备,包括:处理器,通过使用关于编码单元的信息确定具有分层结构并被包括在多个最大编码单元之中的最大编码单元中的多个编码单元,通过使用关于预测单元的信息确定用于预测所述多个编码单元之中的编码单元的至少一个预测单元,并通过使用关于变换单元的信息确定用于对编码单元进行反变换的至少一个变换单元,其中,关于编码单元的信息、关于预测单元的信息和关于变换单元的信息是从比特流解析得到的;解码器,从比特流解析根据所述至少一个变换单元的变换而产生的变换系数,通过对解析的变换系数执行反量化和反变换来重构所述至少一个变换单元的残差数据,对所述至少一个预测单元执行帧内预测或帧间预测,并基于残差值和被执行了预测的所述至少一个预测单元来重构...

【专利技术属性】
技术研发人员:李泰美韩宇镇陈建乐郑海庆
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1