一种基于视频编码模式的方向变换方法技术

技术编号:15522609 阅读:105 留言:0更新日期:2017-06-04 11:35
公开了一种与视频相关的基于预测模式的方向变换的帧内编解码方法,其能够根据当前序列不同模式的残差的统计特性,使得残差数据在变换之后能量更加集中,从而得到更小的码流,提升编码效率。该方法包括编码和解码,在编码端,首先对残差数据进行收集,对其根据预测模式训练,得到KLT集合;在编码时,通过RDO在KLT和DCT中选取对于当前编码单元更好的变换方法,同时将KLT集合传输到解码端;在解码端,首先对传输到解码端的字典进行解码,再进行整个视频的解码。

Direction change method based on video encoding mode

Disclosed is a prediction model based on the direction of the transformation in the related frame and video coding and decoding method, according to the statistical characteristics of the residual current sequence of different pattern, the residual data after the transformation of energy is more concentrated, resulting in smaller streams, to improve the encoding efficiency. The method includes encoding and decoding, encoding in the end, the residual data collection, based on the prediction model of training, get the KLT collection; in the encoding, selected by RDO in KLT and DCT for the current encoding unit transformation method is better, while the KLT collection is transferred to the decoder at the decoding end, first; for transmission to the decoder to decode the dictionary, and then the whole video decoding.

【技术实现步骤摘要】
一种基于视频编码模式的方向变换方法
本专利技术属于视频压缩编码的
,具体地涉及一种与视频相关的基于预测模式的方向变换的帧内编解码方法。
技术介绍
从MPEG-2,H.263,MPEG-4到H.264/AVC,编码效率更高的技术一直是人们追求的更高目标。近些年来,随着大量的高清视频与日剧增,一种更高效率的编码框架--HEVC应运而生。HEVC采用了许多新的技术,其中重要的一项技术为基于编码单元的自适应四叉树分割,最大的编码单元为64×64,其作为树根分割为4个32×32的编码单元,而且每一个32×32的编码单元可以继续分割,直至4×4的编码单元。对每一个编码单元,对其进行不同的预测得到不同的残差单元(变换单元)。每一个残差单元(变换单元)需要进行变换以及量化操作,根据RDO从这些不同的预测模式选取最优的预测模式以及分割模式。尽管HEVC比H.264/AVC得到50%以上的增益,然而,由于预测时使用此编码单元周围的像素值对当前预测单元进行预测,仅仅利用到像素之间的局部相关性,并没有利用到像素之间的非局部信息,所以利用序列间的非局部信息提高压缩效率成为近些年研究的一个热点。研究人员利用外部图像的相关性对图像压缩进行了一次探索性的尝试。对一副高分辨的图像I进行下采样之后得到低分辨率图像D,对D进行压缩,同时在解码端将压缩过的低分辨率图像D进行上采样,得到高分辨率图像然而由于压缩之前对原始图像进行的下采样操作造成了信息的损失,通过简单的三次线性差值很难得到高质量的高分辨率图像,那么利用与外部的图像数据库进行匹配,对其增强重构得到了高质量的高分辨率图像匹配时利用了与外部的图像数据库的SIFT特征的相关性。但此种方法对大量数据库的需求成为了弊端,一旦数据库与所压缩的图像相关性不强,那么并不能对一些图像的细节信息进行很好的恢复。众所周知,KLT能够最大化使信号能量集中,而DCT在信号满足一阶马尔科夫模型能够很好的逼近KLT。但是DCT是固定的变换,而且并非所有信号均满足一阶马尔科夫模型,所以近些年来,KLT对于一类数据的表达能力再次被人们得到重视,所以如何设计满足一类数据的KLT便成为研究的课题之一。而基于编码模式的方向变换(MDDT)便是根据预测方向将相关性较强的一类数据共同使用一个KLT,从而得到更优的压缩效率。MDDT最早在H.264/AVC上提出,其方法观察到使用同一个预测模式的残差数据有相似的方向性,如图1,这种具有相似方向性的数据可以用来生成一组分离的KLT,在编码端,通过对传统DCT进行RDO选取更好的变换。MDDT提供了一种理念,其以后的离线变换的一些研究中对其进行了改进。基于编码模式的稀疏变换(MDST)产生了更加鲁棒的行和列变换,解决了当外点存在于训练数据集中时MDDT不够高效的问题。另外,一些研究人员观察到即使使用同一个预测模式的残差数据仍旧有很多残差之间并不存在很强的相关性,如图2所示,对于均为垂直预测模式下的残差块,其方向性仍旧区分很大。RDOT通过对同一个模式的残差数据更好的分类,对同一个预测模式的残差使用更多的变换,从而提高了编码效率。同时,将MDDT中的分离KLT变为非分离KLT也成为了改进MDDT的途径之一。尽管基于MDDT的改进方法都取得了一定的增益,但是,MDDT,MDST,RDOT均为离线训练,其预定义的变换并不能适应于越来越多的不同分辨率下以及各种各样的视频序列。而且,不同的视频序列残差块像素之间的相关性也不尽相同,这造成了预定义的变换训练时需要的数据集的包容性变得至关重要。然而对于KLT变换,其训练集自身内部的差异性越大,得到的KLT变换越接近于DCT变换。那么,如何使训练集满足同一类特性同时生成与其相关的变换变得至关重要。基于信号的自适应变换(SDT)采用在线训练的方法。对于每一个编码单元,SDT通过模版匹配(TM)在已重构的序列中找出与当前残差块有高度相关性的数据集,得到基于此编码单元的自适应KLT,从而改进编码效率。此种方法避免了训练集的预选取造成的当训练集与当前编码单元相关性较弱的问题。尽管如此,在编码时,由于对每一块编码单元均使用TM进行逐像素搜索,其编码复杂度较高。
技术实现思路
本专利技术的技术解决问题是:克服现有技术的不足,提供一种基于视频编码模式的方向变换方法,其能够根据当前序列不同模式的残差的统计特性,使得残差数据在变换之后能量更加集中,从而得到更小的码流,提升编码效率。本专利技术的技术解决方案是:这种基于视频编码模式的方向变换方法,该方法包括编码和解码,在编码端,首先对其进行数据的收集,对其进行训练,得到KLT集合;在编码时,通过RDO在KLT和DCT中选取对于当前编码单元更好的变换方法;在解码端,首先对传输到解码端的字典进行解码,再进行整个视频的解码。本专利技术充分地利用了同一个视频序列中非局部信息之间的相关性,从而得到性能更好的KLT集合,同时避免了过高的计算复杂度。本专利技术中,对于同一模式下,不同块大小的残差块进行训练得到非分离或分离的KLT集合,此KLT集合能够使其对于当前序列的残差块能量更加集中,在量化之后得到更小的码流,从而提升了编码效率。附图说明图1示出了残差绝对值量级标准化分布。图2示出了使用垂直预测模式下的残差块。图3是根据本专利技术的基于视频编码模式的方向变换方法的流程图。图4是根据本专利技术的编码的一个优选实施例的流程图。图5是根据本专利技术的解码的一个优选实施例的流程图。图6示出了相同序列以及不同序列之间残差的像素间的相关性。具体实施方式如图3所示,这种基于视频编码模式的方向变换方法,该方法包括编码和解码,在编码端,首先对其进行数据的收集,对其进行训练,得到KLT集合;在编码时,通过RDO在KLT和DCT中选取对于当前编码单元更好的变换方法;在解码端,首先对传输到解码端的字典进行解码,再进行整个视频的解码。本专利技术充分地利用了同一个视频序列中非局部信息之间的相关性,从而得到性能更好的KLT集合,同时避免了过高的计算复杂度。本专利技术中,对于同一模式下,不同块大小的残差块进行训练得到非分离或分离的KLT集合,此KLT集合能够使其对于当前序列的残差块能量更加集中,在量化之后得到更小的码流,从而提升了编码效率。优选地,所述编码包括以下步骤:(1)数据的收集:通过HEVC压缩得到需要训练的残差集,其根据QP、块大小、模式进行分类,得到每一类的残差数据集;(2)变换的生成:在全I帧编码时,对QP数据集进行训练,分别得到每一种块大小的每一种模式的KLT,从而形成KLT集合;形成的分数非分离KLT将其使用尺度为210进行放大变为整型KLT,而分离KLT使用尺度为25进行放大变为整型KLT,作为需要传输的变换;(3)变换的使用:在RDO对KLT集和DCT进行比较时,在使用量化前,根据当前模式选取的扫描方法对其进行排序,使扫描时先扫到统计意义上能量更加集中的系数;对其量化,得到需要传输的码流;对其量化过的码流进行反量化,反量化之后的数据,根据排序方法,使其符合扫描的顺序,进而反变换,得到重建的图像;(4)变换的传输:传输KLT时,将KLT写入到二进制码流,从而对此二进制码流使用行程编码进行压缩。优选地,所述解码包括以下步骤:(5)解码得到整型KLT集合,读取二进制码本文档来自技高网
...
一种基于视频编码模式的方向变换方法

【技术保护点】
一种与视频相关的基于预测模式的方向变换的帧内编解码方法,其特征在于:该方法包括编码和解码,在编码端,首先对残差数据进行收集,对其根据预测模式训练,得到KLT集合;在编码时,通过RDO在KLT和DCT中选取对于当前编码单元更好的变换方法,同时将KLT集合传输到解码端;在解码端,首先对传输到解码端的字典进行解码,再进行整个视频的解码。

【技术特征摘要】
1.一种与视频相关的基于预测模式的方向变换的帧内编解码方法,其特征在于:该方法包括编码和解码,在编码端,首先对残差数据进行收集,对其根据预测模式训练,得到KLT集合;在编码时,通过RDO在KLT和DCT中选取对于当前编码单元更好的变换方法,同时将KLT集合传输到解码端;在解码端,首先对传输到解码端的字典进行解码,再进行整个视频的解码。2.根据权利要求1所述的与视频相关的基于预测模式的方向变换的帧内编解码方法,所述编码包括以下步骤:(1)残差数据的收集:通过HEVC压缩得到需要训练的残差集,其根据块大小、预测模式进行分类,得到每一类的残差数据集;(2)变换的生成:在全I帧编码时,对数据集进行训练,分别得到不同块大小的每一种模式的KLT,从而形成KLT集合;形成的浮点数非分离KLT将其使用尺度为210进行放大变为整型KLT,而浮点数分离KLT使用尺度为25进行放大变为整型KLT,作为需要传输的变换;(3)变换的使用:在RDO对KLT集和DCT进行比较时,根据当前模式选取的扫描方法对其进行排序,使扫描时先扫到统计意义上能量更加集中的系数,进而对其量化,得到需要传输的码流;对其量化过的码流进行反量化,反量化之后的数据,根据排序方法,使其符合扫描的顺序,进而反变换,得到...

【专利技术属性】
技术研发人员:施云惠李晓雷丁文鹏尹宝才
申请(专利权)人:北京工业大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1