具有大字母表的源样本的熵编码与熵解码的方法技术

技术编号:16309727 阅读:42 留言:0更新日期:2017-09-27 03:22
本发明专利技术揭露了一种通用的针对源符元的熵编码方法。该方法决定该当前符元的前缀部分与任意的后缀部分。该方法通过比较与前缀部分相关的测试值与一个阈值,来将源符元的前缀部分分割为两个部分。如果该测试值大于或者等于该阈值,该方法通过使用第一可变长度代码二进制化与该前缀部分相关的第一前缀部分,获得第一二进制字符串。如果该测试值小于该阈值,通过使用第二可变长度代码或者第一固定长度代码二进制化与该前缀部分相关的第二前缀部分,获得第二二进制字符串。使用基于文本的适应性二进制算术编码模式编码该第一二进制字符串与该第二二进制字符串中的至少一个。

Entropy encoding method and apparatus for source samples with large alphabet

The invention discloses a universal entropy coding method for a source symbol element. This method determines the prefix part of the current symbol and any suffix part. The method divides the prefix part of the source element into two parts by comparing the test value associated with the prefix part and a threshold. If the test value is greater than or equal to the threshold, the method obtains the first binary string by using the first variable length code to prefix the first prefix part associated with the prefix portion. If the test value is less than the threshold, a second binary string is obtained by using the second variable length code or the first fixed length code binary to prefix the second prefix part associated with the prefix portion. The first binary string is encoded with at least one of the second binary string using a text based adaptive binary arithmetic encoding pattern.

【技术实现步骤摘要】
【国外来华专利技术】具有大字母表的源样本的熵编码的方法与装置优先权声明本申请主张在2015年1月30日提出申请的美国临时专利申请第62/109,853号,以及在2015年10月5日提出申请的美国临时专利申请第62/237,279号的权利,且上述美国专利申请以引用方式并入本文中。
本专利技术是有关于熵编码。具体来说,本专利技术是用于减少针对具有大字母表(alphabet)的源(source)的熵编码的复杂度的编码技术。
技术介绍
基于文本的适应性二进制算术编码(Context-basedadaptivebinaryarithmeticcoding,CABAC)是一种高效率的熵编码工具,其在先进视频编码(例如H.264与高效率视频编码(HighEfficiencyVideoCoding,HEVC))中具有广泛地应用。举例来说,HEVC标准的多种语法元素是在CABAC模式下编码,其中熵编码是基于与当前语法元素相关的文本适应性地应用于二进制的语法元素。图1是该CABAC处理的示例性区块图。由于在CABAC引擎中的算术编码器能够仅仅编码二进制符元值,该CABAC处理需要使用一个二值化(binarizer)110将语法元素的值转换为二进制字符串。该转换过程通常称为二进制化(binarization)。在编码的过程中,从针对不同上下文的编码的符元(symbol)中逐步建立起该多个可能性模型(probabilitymodel)。上下文模型化(contextmodeler)(120)用于模型化的目的。在正常的基于编码的上下文中,使用该常规的编码引擎(codingengine)(130),其对应二进制算术编码器。针对编码下一二进制符元的模型化上下文的选择可通过该编码的信息来决定。符元也可不经过上下文模型化阶段而编码,并且假设一个相等的概率分布,通常称为旁通模式(bypassmode),来减少复杂度。针对旁通符元,使用旁通编码引擎(bypasscodingengine)(140)。如图1所示,开关(S1、S2与S3)是用来在常规的CABAC模式与旁通模式之间控制数据流的方向。当选择常规的CABAC模式时,该多个开关是较上连接。当选择旁通模式时,该多个开关是较下连接,如图1所示。如上所述,CABAC是一种熵编码形式。CABAC能够应用至源符元(sourcesymbol)以减少代表源符元所需的数据。当CABAC应用至一视频编码系统时,源符元可对应于预测残余(predictionresiduals)、运动信息(motioninformation)、编码参数等等。举例来说,CABAC是在HEVC中使用,其中该标准是基于传统的混合编码途径。依据HEVC,一个图像被分割为多个非重叠的最大的编码单元(largestcodingunit,LCU),也称为编码树区块(codingtreeblock,CTB)。一个编码单元(codingunit,CU)的像素值是通过空间或者时间来预测。转换获得的残余信号来进行进一步的冗余去除。接着转换系数被量化以及熵编码。重建的图像是从该解码的残余信号与预测信号中回复。在重建之后,重建的图像进一步地通过环内滤波来处理以减少编码伪影(codingartifact)。图2是针对基于HEVC编码器的示例性区块图。图2是依据HEVC结合环内处理的适应性帧间/帧内编码系统的示意图。对于帧间预测,运动估计(ME)/运动补偿(MC)212是用来提供来自其他图像或者其他多个图像的基于视频数据的预测数据。开关214选择帧内预测210或者帧间预测数据,并且选择的预测数据是提供至加法器216来形成预测错误,也称为残余(residues)。接着预测错误是通过转换(T)218以及后续的量化(Q)220处理。该转换的以及量化的冗余接着被熵编码器222编码,以形成对应于压缩的视频数据的视频比特流。该与残余相关的比特流接着与旁侧信息(sideinformation)一同封包,举例来说,旁侧信息是运动、模式以及其他与图像区域相关的信息。该旁侧信息也可以进行熵编码来减少所需的频宽。据此,与旁侧信息相关的数据是提供给如图2所示的熵编码器222。在帧内模式中,可使用重建区块来形成空间相邻区块的帧内预测。因此,来自REC228的重建区块可提供给帧内预测210。当帧内预测模式被使用时,一个参考图像或者多个参考图像也需要在编码器端重建。所以,该转换的以及量化的残余被逆量化(IQ)224以及逆转换(IT)226处理,以恢复残余。该残余接着在重建(REC)228被加回至预测数据236,以重建视频数据。该重建的视频数据可存储在参考图像缓冲器234中,并用于其他帧的预测。如图2所述,输入的视频数据在编码系统中经过了一系列的处理。由于一系列的处理,来自REC228的重建视频数据可能具有多种损失。据此,在重建视频数据存储至参考图像缓冲器234之前,引用多种环内处理至重建视频数据,以增强视频质量。在HEVC标准中,发展了去块(deblocking,DF)处理模块230、样本自适应偏移(SampleAdaptiveOffset,SAO)处理模块231以增强图像质量。该环内滤波信息将需要组合至比特流中,从而解码器能够正确地恢复所需的信息。因此,来自SAO的环内滤波信息是提供给熵编码器222以组合至比特流中。在图2中,DF230是首先应用至重建的视频,接着应用至DF处理的视频(即已去块的视频)。目前,JCT标准化主体在开发HEVC屏幕内容编码(SCC)扩展的过程中。与传统的具有连续的色调(colortone)的正常视频相比较,屏幕内容视频通常包含较少的试色(pilotcolor)以及尖锐边缘与边界。目前一些新型工具,例如帧内区块复制(Intrablockcopy,IBC)、调色板编码(palettecoding)、帧内线复制(Intralinecopy)与帧内串复制(Intrastringcopy,ISC),在开发中,潜在的在未来被采用至HEVCSCC扩展中。再次,CABAC可应用至残余或者与这些新型工具相关的编码信息。IBC与调色板编码的细节可在JCTVC-S1005(Joshi,etal.,HighEfficiencyVideoCoding(HEVC)ScreenContentCoding:Draft2,JointCollaborativeTeamonVideoCoding(JCT-VC)ofITU-TSG16WP3andISO/IECJTC1/SC29/WG11,19thMeeting:Strasbourg,FR,17–24Oct.2014,Document:JCTVC-S1005)中找到。帧内线复制与帧内串复制(ISC)的细节可以在JCTVC-S1103(Chen,etal.,DescriptionofCoreExperiment3(CE3):IntraLineCopyandIntraStringCopy,JointCollaborativeTeamonVideoCoding(JCT-VC)ofITU-TSG16WP3andISO/IECJTC1/SC29/WG11,19thMeeting:Strasbourg,FR,17–24Oct.2014,Document:JCTVC-本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/62/201680007248.html" title="具有大字母表的源样本的熵编码与熵解码的方法原文来自X技术">具有大字母表的源样本的熵编码与熵解码的方法</a>

【技术保护点】
一种在编码器中执行的针对多个源符元的熵编码方法,包含:接收具有当前符元的当前源符元;决定该当前符元的前缀部分与任意的后缀部分;如果与该前缀部分相关的测试值大于或者等于一个阈值,通过使用第一可变长度代码二进制化与该前缀部分相关的第一前缀部分,获得第一二进制字符串;如果与该前缀部分相关的该测试值小于该阈值,通过使用第二可变长度代码或者第一固定长度代码二进制化与该前缀部分相关的第二前缀部分,获得第二二进制字符串;如果任何后缀存在,通过使用第二固定长度代码或者第一截断二进制代码二进制化该后缀部分,获得第三二进制字符串;以及使用基于文本的适应性二进制算术编码模式编码该第一二进制字符串与该第二二进制字符串中的至少一个。

【技术特征摘要】
【国外来华专利技术】2015.01.30 US 62/109,853;2015.10.05 US 62/237,2791.一种在编码器中执行的针对多个源符元的熵编码方法,包含:接收具有当前符元的当前源符元;决定该当前符元的前缀部分与任意的后缀部分;如果与该前缀部分相关的测试值大于或者等于一个阈值,通过使用第一可变长度代码二进制化与该前缀部分相关的第一前缀部分,获得第一二进制字符串;如果与该前缀部分相关的该测试值小于该阈值,通过使用第二可变长度代码或者第一固定长度代码二进制化与该前缀部分相关的第二前缀部分,获得第二二进制字符串;如果任何后缀存在,通过使用第二固定长度代码或者第一截断二进制代码二进制化该后缀部分,获得第三二进制字符串;以及使用基于文本的适应性二进制算术编码模式编码该第一二进制字符串与该第二二进制字符串中的至少一个。2.根据权利要求1所述的方法,其特征在于,该前缀部分是通过应用k阶指数哥伦布二进制处理至该当前符元而获得。3.根据权利要求1所述的方法,其特征在于,该前缀部分是通过应用Rice二进制处理至该当前符元而获得。4.根据权利要求1所述的方法,其特征在于,该前缀部分对应该当前符元的当前符元值的最大有效位索引,如果任何的后缀部分存在,该后缀部分对应该当前符元值的一个或者多个细化位,该测试值对应该最大有效位索引加1,并且该当前符元值属于多个符元值的一个集合。5.根据权利要求4所述的方法,其特征在于,该第一前缀部分对应该最大有效位索引加1减该阈值,并且该第二前缀部分对应该最大有效位索引加1。6.根据权利要求4所述的方法,其特征在于,第一语法旗标被信号化来指示该最大有效位索引加1是大于该阈值的。7.根据权利要求6所述的方法,其特征在于,第二语法旗标被信号化以指示该最大有效位索引加1是大于0,其中仅仅当该第二语法旗标指示该最大有效位索引加1是大于0时,该最大有效位索引与该阈值比较。8.根据权利要求7所述的方法,其特征在于,该第一前缀部分对应该最大有效位索引加1减该阈值,并且该第二前缀部分对应该最大有效位索引或者该阈值减1减一个代表该最大有效位索引加1的语法元素。9.根据权利要求4所述的方法,其特征在于,该第一前缀部分是使用第一一元代码或者第一截断的一元代码来二进制化为该第一二进制字符串。10.根据权利要求9所述的方法,其特征在于,第二前缀部分是使用第二截断的一元代码或者该第一固定长度代码二进制化为该第二二进制字符串。11.根据权利要求10所述的方法,其特征在于,该第一二进制字符串或者该第二二进制字符串的一个或多个先导二进制码是使用基于文本的适应性二进制算术编码模式来编码。12.根据权利要求11所述的方法,其特征在于,针对该多个源符元的多个不同的二进制码索引或者多个不同的语法类型,选择该基于文本的适应性二进制算术编码模式的多个分别的上下文。13.根据权利要求11所述的方法,其特征在于,针对多个不同的二进制码索引,选择该基于文本的适应性二进制算术编码模式的多个分别的上下文。14.根据权利要求11所述的方法,其特征在于,该第一二进制字符串或者该第二二进制字符串中的该一个或者多个先导二进制码之后的剩余二进制码是使用旁通模式来编码。15.根据权利要求4所述的方法,其特征在于,如果该多个符元值的该集合对应多个有符号的值,该当前符元值是通过一个当前符元绝对值与一个当前符号值来表达,并且该最大有效位索引以及任何的细化位是依据该当前符元绝对值来决定。16.根据权利要求1所述的方法,其特征在于,该第三二进制字符串是使用旁通模式来编码或者具有在上下文编码的二进制码的最大数量的限制或者上下文最大数量的限制。17.根据权利要求1所述的方法,其特征在于,该多个源符元对应多个区块向量差的多个水平分量或者多个垂直分量,或者针对帧内区块复制、帧内线复制、帧内串复制编码的多个水平分量或者多个垂直分量,或者针对帧间预测编码的多个运动向量差。18.根据权利要求17所述的方法,其特征在于,该基于文本的适应性二进制算术编码模式是应用至从对应该多个水平分量的多个源符元产生的一个或者多个第一语法元素、或者是应用至从对应该多个垂直分量的多个源符元产生的一个或者多个第二语法元素,并且其中该基于文本的适应性二进制算术编码模式的多个分别的上下文是被该一个或者多个第一语法元素与该一个或者多个第二语法元素选择的。19.根据权利要求17所述的方法,其特征在于,该基于文本的适应性二进制算术编码模式是应用至从对应该多个水平分量的多个源符元产生的一个或者多个第一语法元素、或者是应用至从对应该多个垂直分量的多个源符元产生的一个或者多个第二语法元素,并且其中该基于文本的适应性二进制算术编码模式的至少一个上下文是被该一个或者多个第一语法元素与该一个或者多个第二语法元素共享的。20.根据权利要求17所述的方法,其特征在于,该第一后缀部分对应于相应于一个水平分量的当前第一符元值的一个或者多个第一细化位,并且该第二后缀部分对应于相应于一个垂直分量的当前第二符元值的一个或者多个第二细化位,并且其中来自该第一后缀部分的多个第一二进制码与来自该第二后缀部分的第二二进制码是组合进行旁通模式处理。21.根据权利要求1所述的方法,其特征在于,该阈值对应一个预先定义的或者固定的值。22.根据权利要求1所述的方法,其特征在于,该阈值是在比特流的序列参数集、图像参数集或者切片标头中信号化。23.根据权利要求1所述的方法,其特征在于,该编码器通过估计与一个或者多个语法元素相关的比特率选择编码参数,该一个或者多个语法元素是依据查找表自该多个源符元产生,其中该查找表将与一个或者多个产生的语法元素相关的二进制码字符串映射至多个各自的估计的比特成本。24.根据权利要求23所述的方法,其特征在于,如果与一个语法元素相关的一个语法值的一个前缀部分的一个对应的二进制码字符串是在基于文本的适应性二进制算术编码模式下编码,针对一个对应的二进制码字符串的一个各自的估计的比特成本是基于在每一编码单元的开始的基于文本的适应性二进制算术编码状态来估计的。25.一种在解码器中执行的针对多个源符元的熵解码方法,包含:接收输入编码的比特流,该输入编码的比特流包含针对当前源符元的压缩数据;解码该输入编码的比特流以恢复第一二进制字符串、第二二进制字符串与任何的第三二进制字符串;通过使用第一可变长度代码解码该第一二进制字符串来恢复与该当前符元的前缀部分相关的第一前缀部分,如果与该前缀部分相关的一个测试值大于或者等于一个阈值;通过使用第二可变长度代码或者第一固定长度代码解码该第二二进制字符串来恢复与该当前符元的该前缀部分相关的第二前缀部分,如果与该前缀部分相关的该测试值小于该阈值;通过使用第二固定长度代码或者第一截断的二进制代码解码该第三二进制字符串来恢复该当前符元的一个后缀部分,如果任何的第三二进制字符串存在;以及如果任何的后缀部分存在,基于该前缀部分以及任何的后缀部分来恢复该当前源符元,其中该前缀部分是由该第一前缀部分与该第二前缀部分组成。26.根据权利要求25所述的方法,其特征在于,该前缀部分对应于二进制化的当前符元的前缀部分,其中该二进制化的当前符元应用k阶指数哥伦布二进制处理。27.根据权利要求25所述的方法,其特征在于,该前缀部分对应于二进制化的当前符元的前缀部分,其中该二进制化的当前符元应用Rice二进制处理。28.根据权利要求25所述的方法,其特征在于,该前缀部分对应该当前符元的当前符元值的最大有效位索引,如果任何的后缀部分存在,该后缀部分对应该当前符元值的一个或者多个细化位,该测试值对应该最大有效位索引加1,并且该当前符元值属于多个符元值的一个集合。29.根据权利要求28所述的方法,其特征在于,该第一前缀部分对应该最大有效位索引加1减该阈值,并且该第二前缀部分对应该该最大有效位索引加1。30.根据权利要求28所述的方法,其特征在于,第一语法旗标被解析来指示该最大有效位索引加1是大于该阈值的。31.根据权利要求28所述的方法,其特征在于,第二语法旗标被解析以指示该最大有效位索引加1是大于0,其中如果该第二语法旗标指示该最大有效位索引加1是大于0时,该第一语法旗标被解析来决定该最大有效位索引加1是否大于该阈值。32.根据权利要求31所述的方法,其特征在于,该第一前缀部分对应该最大有效位索引加1减该阈值,并且该第二前缀部分对应该最大有效位索引或者该阈值减1减一个代表该最大有效位索引加1的语法元素。33.根据权利要求28所述的方法,...

【专利技术属性】
技术研发人员:向时达
申请(专利权)人:联发科技股份有限公司
类型:发明
国别省市:中国台湾,71

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1