选择扫描顺序的方法和装置制造方法及图纸

技术编号:19077635 阅读:27 留言:0更新日期:2018-09-29 18:42
本发明专利技术提出了一种用于解码比特流中视频序列的块的系数的解码器。所述解码器包括:解码模块,用于解码所述比特流中每个块的一个或多个系数矢量。所述解码器包括:校验模块,用于为至少一个块重建所述块的一个或多个系数的隐藏信息,其中,所述隐藏信息构成或形成部分与所述块相关联的扫描顺序信息。所述解码器包括:扫描顺序选择器,用于在与每个块相关联的扫描顺序信息的基础上从一组扫描顺序中为所述块选择扫描顺序,优选地,从一组预定义的和生成的扫描顺序中选择。所述解码器包括:解串器,用于根据为每个块选择的扫描顺序逆扫描所述块的一个或多个系数矢量,以便获得系数矩阵。

【技术实现步骤摘要】
【国外来华专利技术】选择扫描顺序的方法和装置
本专利技术大体涉及视频处理领域,以及选择扫描顺序的方法和装置,特别是内容自适应扫描顺序选择,并且具体地,涉及一种用于对视频序列的块的系数进行解码的解码器,以及一种用于对视频序列的块的系数进行编码的编码器。
技术介绍
数字视频通信和存储应用通过数字相机、蜂窝无线电话、笔记本计算机、广播系统和视频电话会议系统等多种数字设备来实现。视频压缩是这些应用中最重要的和最具挑战性的任务之一。视频压缩的任务是复杂的,并受到两个相互矛盾的参数的约束:压缩效率和计算复杂度。ITU-TH.264/AVC或者高效视频编码(HighEfficiencyVideoCoding,简称HEVC)标准ITU-TH.265/HEVC等视频编码标准很好地权衡了这些参数。由于这个原因,支持视频编码标准几乎是对任意视频压缩应用的强制性要求。现有技术的视频编码标准是将源图片分割成块。对这些块的处理取决于它们的大小、空间位置和编码器指定的编码模式。根据预测类型,可将编码模式分为两组:帧内和帧间预测模式。帧内预测模式使用相同图片的像素来生成参考样本以计算正在重构的块的像素的预测值。帧内预测也可以称为空间预测。帧间预测模式旨在用于时间预测,并使用前一个或后一个图片的参考样本来预测当前图片的块的像素。在预测阶段之后,对原始信号与预测信号之间的差值即预测误差进行变换编码。然后,通过用于AVC/H.264和HEVC/H.265的基于上下文的自适应二进制算术编码(context-adaptivebinaryarithmeticcoding,简称CABAC)等的熵编码器对变换系数和边信息进行编码。显然,针对不同的预测模式,预测误差具有不同的统计数字,并且预测误差强烈依赖于待预测的内容。因此,从不同情况下的压缩性能的角度来看,不同的变换是有益的。为了提高变换编码阶段的编码效率,针对不同的特定情况可以使用具有不同能量压缩的多个变换。ISO/IEC_23008-2-2013中2013年11月的《信息技术-异构环境中高效编码和媒体分发第2部分:高效视频编码》中已知的ITU-TH.265/HEVC标准宣布了一套现有技术的视频编码工具,合理地权衡了编码效率和计算复杂度。在《IEEE视频技术电路和系统汇刊》2012年12月第22卷第12期中的GaryJ.Sullivan的论文《高效视频编码(HighEfficiencyVideoCoding,简称HEVC)标准概述》中给出了ITU-TH.265/HEVC标准概述。其全部内容通过引用并入本文。与ITU-TH.264/AVC视频编码标准类似,HEVC/H.265视频编码标准将源图片划分成块,例如编码单元(codingunit,简称CU)。可以进一步地将每个CU分成更小的CU或预测单元(predictingunit,简称PU)。PU可以根据应用于PU的像素的处理类型进行帧内或帧间预测。在帧间预测的情况下,PU表示运动补偿通过为PU指定的运动矢量处理的像素面积。对于帧内预测,PU指定一组变换单元(transformunit,简称TU)的预测模式。TU可以具有不同的大小(例如,4×4、8×8、16×16和32×32像素),并且可以采用不同的方式进行处理。TU中进行变换编码,即HEVC/H.265标准中利用离散余弦变换或离散正弦变换对预测误差进行变换。将变换编码应用于帧内编码块,并对帧内编码块进行量化。因此,重建像素包含量化噪声和可能影响预测精度的阻塞伪像。除了HEVC/H.265,在所有现有视频编码标准中都仅使用一个变换以保持设计简单。HEVC/H.265标准指定了用于帧内编码的两个变换:用于4×4块的DST,该变换为小的帧内预测块提供更好的能量压缩;以及用于其它块的DCT。另外,HEVC/H.265标准采用依赖模式系数扫描(mode-dependentcoefficientscan,简称MDCS)技术。其基本思想是选择受限于所选帧内预测模式的扫描顺序。对于帧内编码块,通过帧内预测模式来确定4×4变换块(transformblock,简称TB)和8×8亮度TB的扫描顺序,参见JoelSole、RajanJoshi、NguyenNguyen、TianyingJi、MartaKarczewicz、GordonClare、FelixHenry和AlbertoDueňas发表在《IEEE视频技术电路和系统汇刊》2012年12月第22卷第12期第1765-1777页的《HEVC变换系数编码》。35个帧内预测模式中的每一个帧内预测模式都使用三种可能的扫描顺序中的一种:对角扫描、水平扫描或垂直扫描。查找表将帧内预测模式映射到其中一种扫描。该工具根据帧内预测模式利用残余的水平或垂直相关性。例如,水平预测模式中,变换系数能量聚集在前几列,所以垂直扫描导致只有较少数分组进行了熵编码。与垂直预测类似,水平扫描也是有益的。实验表明,对较大TB进行水平和垂直扫描时,压缩效率特别低,所以这些扫描仅限应用于那两种较小的TB。在Yung-LyulLee、Ki-HunHan、Dong-GyuSim、和JeongilSeo发表在《ETRIJournal》2006年10月第28卷第5期第668-671页的文档《H.264/AVC帧内编码自适应扫描》中、在Byeong-DooChoi、Jin-HyungKim和Sung-JeaKo发表在《ETRIJournal》2007年10月第29卷第5期第694-696页的文档《基于帧内预测模式的自适应系数扫描》中以及在Md.SalahUddinYusuf和MohiuddinAhmad发表在《国际电气电子与仪表工程高级研究期刊》2013年8月第2卷第8期第4120-4126页的文档《一种新的AVS帧内编码方向空间预测扫描方案》中考虑了类似于MDCS的技术。这些扫描顺序不同于HEVC/H.265标准中的扫描顺序。此外,提出将帧内预测模式映射到扫描顺序。另外,BaeKeunLee、JaeCheolKwon和JooYoungKim于2012年11月8日在美国专利申请出版物发表的专利号为PCT/KR2012/009373的专利US2014/0314143A1《基于预测单元的分区模式的系数扫描方法和装置》中的分割模式以及Thai-HaNguyen、YoichiYagasaki和AliTabatabai于2011年4月1日在美国专利申请出版物发表的专利US2011/0249726A1《QP自适应系数扫描和应用》中的量化参数(quantizationparameter,简称QP)可以用作选择帧内编码和帧间编码扫描顺序的特征。因此,扫描顺序有很多种,且可以对相同的模式和TU大小有效。这就主要解释了为什么基于或类似于比率失真优化(Rate-DistortionOptimization,简称RDO)如基于失真或活动分析的程序可以用于最终决定应该选择怎样的潜在扫描顺序。MuhammedZeydCoban和MartaKarczewicz于2011年10月17日在美国专利申请出版物发表的专利US2012/0099646A1《视频编码变换系数的自适应扫描》中有如何在基于RDO的程序中选择扫描顺序的例子。因此,这种方法的主要优本文档来自技高网...

【技术保护点】
1.一种用于解码比特流(207)中视频序列的块的系数的解码器(200),其特征在于:所述解码器包括:解码模块(206),用于解码所述比特流(207)中每个块的一个或多个系数矢量;校验模块(212),用于为至少一个块重建所述块的一个或多个系数的隐藏信息,其中,所述隐藏信息构成或形成部分与所述块相关联的扫描顺序信息(SCAN_IDX);扫描顺序选择器(209),用于在与每个块相关联的扫描顺序信息(SCAN_IDX)的基础上从一组扫描顺序中为所述块选择扫描顺序;解串器(204),用于根据为每个块选择的扫描顺序逆扫描所述块的一个或多个系数矢量,以便获得系数矩阵。

【技术特征摘要】
【国外来华专利技术】1.一种用于解码比特流(207)中视频序列的块的系数的解码器(200),其特征在于:所述解码器包括:解码模块(206),用于解码所述比特流(207)中每个块的一个或多个系数矢量;校验模块(212),用于为至少一个块重建所述块的一个或多个系数的隐藏信息,其中,所述隐藏信息构成或形成部分与所述块相关联的扫描顺序信息(SCAN_IDX);扫描顺序选择器(209),用于在与每个块相关联的扫描顺序信息(SCAN_IDX)的基础上从一组扫描顺序中为所述块选择扫描顺序;解串器(204),用于根据为每个块选择的扫描顺序逆扫描所述块的一个或多个系数矢量,以便获得系数矩阵。2.根据权利要求1所述的解码器,其特征在于:所述校验模块(212)用于基于从为所述块获得的一个或多个系数矢量中选择的至少一个隐藏系数矢量为至少一个块重建所述的隐藏信息。3.根据权利要求2所述的解码器,其特征在于:所述校验模块(212)用于根据隐藏条件为至少一个块重建隐藏系数矢量的隐藏信息;所述隐藏条件包括取决于所述隐藏系数矢量的参数与阈值的比较。4.根据权利要求3所述的解码器,其特征在于:所述参数为:所述隐藏系数矢量中的多个非零系数;所述隐藏系数矢量中第一个和最后一个非零系数之间的距离;或所述隐藏系数矢量内的系数的最大绝对值和最小非零绝对值的比率,其中如果所述参数高于阈值,则所述隐藏条件为真;如果所述参数低于阈值,则所述隐藏条件为假。5.根据权利要求3或4所述的解码器,其特征在于:所述校验模块(212)用于校验所述隐藏条件,如果所述隐藏条件为真,则重建所述隐藏系数矢量的隐藏信息。6.根据权利要求3至5中任一项所述的解码器,其特征在于:如果所述隐藏条件为假,则所述扫描顺序选择器(209)用于选择预定义的默认扫描顺序。7.根据权利要求2至6中任一项所述的解码器,其特征在于:所述校验模块(212)用于通过将校验函数应用于所述隐藏系数矢量来重构所述隐藏系数矢量的隐藏信息;所述校验函数的结果就是所述隐藏信息。8.根据权利要求7所述的解码器,其特征在于:所述校验函数的结果取决于所述系数矩阵内所述隐藏系数矢量的所述最后一个非零系数的坐标(x,y);特别是当所述校验函数是以下函数:mod(x+y+R,2),其中x和y为所述坐标,且R为整数值。9.根据权利要求1至8中任一项所述的解码器,其特征在于:所述校验模块(212)用于为第一块重建所述第一块的一个或多个系数的隐藏信息,其中,所述隐藏信息构成或形成部分与所述第一块相关联的扫描顺序信息(SCAN_IDX);所述扫描顺序选择器(209)用于在与所述第一块相关联的所述扫描顺序信息(SCAN_IDX)的基础上为所述第一块和至少一个第二块选择扫描顺序。10.一种用于解码比特流(207)中视频序列的块的系数的方法,其特征在于:所述方法包括:解码比特流(207)中每个块的一个或多个系数矢量;为至少一个块重建所述块的一个或多个系数的隐藏信息,其中,所述隐藏信息构成或形成部分与所述块相关联的扫描顺序信息(SCAN_IDX);在与每个块相关联的扫描顺序信息(SCAN_IDX)的基础上从一组扫描顺序中为所述块选择扫描顺序;根据为每个块选择的扫描顺序逆扫描所述块的一个或多个系数矢量,以便获得系数矩阵。11.一种用于将视频序列的块的系数编码入比特流(107)的编码器(100),其特征在于,每个块的系数包含在各自的系数矩阵中,其中所述编码器包括:扫描顺序选择器(109),用于从一组扫描顺序中为每个块选择扫描顺序;串行器(104),用于根据为每个块选择的扫描顺序扫描所述块的系数矩阵,以便获得一个或多个系数矢量;隐藏模块(112),用于:针对至少一个块,将至少部分用于识别为所述块选择的扫描顺序的扫描顺序信息(SCAN_IDX)隐藏在所述块的一个或多个系数中;编码模块(106),用于将所述系数矢量编码入所述比特流(107)。12.根据权利要求11所述的编码器,其特征在于:所述隐藏模块(112)用于:针对至少一个块,将所述扫描顺序信息(SCAN_IDX)隐藏在从为所述块获取的一个或多个系数矢量中选择的至少一个隐藏系数矢量中。13.根据权利要求12所述的编码器,其特征在于:所述隐藏模块(112)用于:针对至少一个块,基于隐藏条件将所述扫描顺序信息(SCAN_IDX)隐藏在所述隐藏系数矢量中;所述隐藏条件包括取决于所述隐藏系数矢量的参数与阈值的比较。14.根据权利要求13所述的编码器,其特征在于:所述参数为:所述隐藏系数矢量中的多个非零系数;所述隐藏系数矢量中第一个和最后一个非零系数之间的距离;或所述隐藏系数矢量内的系数的最大绝对值和最小非零绝对值的比率,其中如果所述参数高于阈值,则所述隐藏条件为真;如果所述参数低于阈值,则所述隐藏条件为假。15.根据权利要求13或14所述的编码器,其特征在于:所述隐藏模块(112)用于校验所述隐藏条件,如果所述隐藏条件为真,则将所述扫描顺序信息(SCAN_IDX)隐藏在所述隐藏系数矢量中。16.根据权利要求13至15中任一项所述的编码器,其特征在于:如果所述隐藏条件为假,则所述扫描顺序选择器(109)用于从该组扫描顺序中递归选择其它扫描顺序,直到选择的其它扫描顺序的隐藏条件为真。17.根据权利要求13至16中任一项所述的编码器,其特征在于:如果所述隐藏条件为假并且所选扫描顺序是预定义的默认扫描顺序,则所述隐藏模块(112)不将所述扫描顺序信息(SCAN_IDX)隐藏在所述隐藏系数矢量中。18.根据权利要求12至17中任一项所述的编码器,其特征在于:所述隐藏模块(112)用于:针对至少一个块,通过以下步骤将所述扫描顺序信息(SCAN_IDX)隐藏在所述隐藏系数矢量中:将校验函数应用于所述隐藏系数矢量,以便获得所述校验函数的结果;确定所述校验函数的结果是否与所述扫描顺序信息(SCAN_IDX)对应;如果所述校验函数的结果不与所述扫描顺序信息(SCAN_IDX)对应,则修改所述隐藏系数矢量使得所述校验函数的结果与所述扫描顺序信息(SCAN_IDX)对应。19.根据权利要求18所述的编码器,其特征在于:所述校验函数的结果取决于所述系数矩阵内所述隐藏系数矢量的所述最后一个非零系数的坐标(x,y);特别是当所述校验函数是以下函数:mod(x+y+R,2),其中x和y为所述坐标,且R为整数值。20.根据权利要求11至19中任一项所述的编码器,其特征在于:如果所述扫描顺序选择器(109)为所述第一块和至少一个第二块选择了相同的扫描顺序,则所述隐藏模块(112)用于将用于识别所述相同扫描顺序的扫描顺序信息(SCAN_IDX)仅隐藏在所述第一块的一个或多个系数中。21.一种用于将视频序列的块的系数...

【专利技术属性】
技术研发人员:阿列克谢·康斯坦丁诺维奇·菲利波夫瓦西里·亚历斯维奇·拉夫特斯基
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1