用于上下文自适应可变长度译码(CAVLC)的速率-失真量化制造技术

技术编号:8863749 阅读:158 留言:0更新日期:2013-06-29 00:51
本申请涉及用于上下文自适应可变长度译码(CAVLC)的速率-失真量化。大体来说,本发明专利技术提供用于以可实现速率与失真的所要平衡的方式量化视频块的系数的技术。所述所描述技术可分析与每一个别系数相关联的多个量化层级,以为所述个别系数选择导致最低译码成本的量化层级。由于CAVLC不独立编码每一系数,所以所述技术可基于为先前经量化系数所选择的量化层级和用于系数向量的随后系数的所估计(或预测)的量化层级来为与所述个别系数相关联的候选量化层级中的每一者计算所述译码成本。所述系数中的每一者的所述量化层级基于所计算的译码成本来进行选择,以获得最小化速率-失真模型的一组经量化系数。

【技术实现步骤摘要】

本专利技术涉及数字视频译码,且更特定来说涉及用于视频译码的量化技术。
技术介绍
可将数字视频能力并入到较广范围的装置中,包括数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或台式计算机、数码相机、数字记录装置、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话等。数字视频装置实施例如MPEG-2、MPEG-4或ITU-T H.264/MPEG-4、第10部分、高级视频译码(AVC)等视频压缩技术以较有效地发射和接收数字视频信息。视频压缩技术执行空间预测和时间预测以减少或移除视频序列中固有的冗余。帧内译码依赖于空间预测以减少或移除给定经译码单元内视频块之间的空间冗余,给定经译码单元可包含视频帧、视频帧的片段、图片的群组或视频块的另一所定义单元。相比之下,帧间译码依赖于时间预测以减少或移除视频序列的连续经译码单元的视频块之间的时间冗余。对于帧内译码来说,视频编码器可执行空间预测以基于相同经译码单元内的其它数据来压缩数据。对于帧间译码来说,视频编码器执行运动估计和运动补偿以追踪两个或两个以上相邻经译码单元的对应视频块的移动。经译码视频块可由可用以创建或识别预测块和指示正经译码的块与预测块之间的差异的数据的残余块的预测信息来表示。在帧间译码的情形下,一个或一个以上运动向量用以识别数据的预测块,而在帧内译码的情形下,预测模式可用以产生预测块。帧内译码和帧间译码两者可定义若干不同预测模式,其可定义不同块大小和/或译码中使用的预测技术。还可包括额外类型的语法元素作为经编码视频数据的一部分以便控制或定义译码过程中使用的译码技术或参数。在基于块的预测译码之后,视频编码器可应用变换、量化和熵译码过程以进一步减少与残余块的通信相关联的位速率。变换技术可包含离散余弦变换或概念上相似的过程。或者,可使用子波变换、整数变换或其它类型的变换。在离散余弦变换(DCT)过程中,作为一实例,变换过程将一组像素值转换成变换系数,所述变换系数可表示频域中像素值的能量。将量化应用于变换系数,且量化通常涉及限制与任何给定变换系数相关联的位数目的过程。熵译码包含共同地压缩经量化变换系数的序列的一个或一个以上过程。上下文自适应可变长度译码(CAVLC)是当前在一些译码标准中支持的一种类型的熵译码技术,例如国际电信联盟标准化组(ITU-T)H.264/移动图片专家组(MPEG)-4、第10部分高级视频译码(AVC)(下文中为“H.264/MPEG-4第10部分AVC标准”)。根据如H.264/MPEG-4、第10部分AVC标准中所定义的CAVLC,编码器编码表示系数向量的多个语法元素。语法元素可包括系数向量中的系数的总数、系数向量中尾随一(trailing one)的数目、尾随一中的每一者的正负号、除了尾随一之外的非零系数的量值(或层级)、所有行程(run)的总和(即,最后非零系数之前的行程的总数),已经每一非零系数之前的零的行程长度。由于编码器基于系数向量的特定特性而自适应地选择VLC译码表而用于编码语法元素,所以CAVLC是自适应的。
技术实现思路
大体来说,本专利技术描述用于以可实现速率与失真的所要平衡的方式来量化视频块的系数的技术。所描述的技术可分析与每一个别系数相关联的多个量化层级以为个别系数选择导致最低译码成本的量化层级。由于CAVLC不独立编码每一系数,所以所述技术可基于为先前经量化系数选择的量化层级和用于系数向量的随后系数的所估计(或预测)的量化层级而计算与个别系数相关联的候选量化层级中的每一者的译码成本。系数中的每一者的量化层级基于所计算的译码成本进行选择以获得最小化速率-失真模型的一组经量化系数。在一个实例中,本专利技术提供在视频译码过程中量化视频块的系数的至少一部分的方法。所述方法包括为视频块的系数的部分中的每一者确定与相应系数相关联的多个候选量化层级的译码成本,以及基于译码成本为系数中的每一者选择所述多个候选量化层级中的一者以获得一组经量化系数。在另一实例中,本专利技术提供用于在视频译码过程中量化视频块的系数的至少一部分的设备。所述设备包括量化单元,其为视频块的系数的部分中的每一者确定与相应系数相关联的多个候选量化层级的译码成本,且基于译码成本为系数中的每一者选择所述多个候选量化层级中的一者以获得一组经量化系数。在另一实例中,提供用于在视频译码过程中量化视频块的系数的至少一部分的装置。所述装置包含:用于为视频块的系数的部分中的每一者确定与相应系数相关联的多个候选量化层级的译码成本的装置;以及用于基于译码成本为系数中的每一者选择所述多个候选量化层级中的一者以获得一组经量化系数的装置。本专利技术中所描述的技术可以硬件、软件、固件或其任何组合来实施。如果以软件实施,那么软件可执行于一个或一个以上处理器(例如,微处理器、专用集成电路(ASIC)JI场可编程门阵列(FPGA)或数字信号处理器(DSP))中。执行所述技术的软件最初可存储于计算机可读媒体中且经载入并执行于处理器中。因此,本专利技术还预期包含指令的计算机可读媒体,所述指令在执行时使装置在视频译码过程中量化视频块的系数的至少一部分。所述指令使所述装置:为视频块的系数的部分中的每一者确定与相应系数相关联的多个候选量化层级的译码成本;且基于译码成本为系数中的每一者选择所述多个候选量化层级中的一者以获得一组经量化系数。在附图和以下描述中阐述本专利技术的一个或一个以上方面的细节。本专利技术中所描述的技术的其它特征、目的和优点将从所述描述和图式以及从权利要求书而显而易见。附图说明图1是说明可实施本专利技术的技术中的一者或一者以上的视频编码和解码系统的示范性框图。图2是说明符合本专利技术的视频编码器的实例的框图。图3是说明4X4视频块的Z字形(zig-zag)扫描的概念图。图4是说明符合本专利技术的量化网格(trellis)的框图。图5-8是说明符合本专利技术的技术的流程图。具体实施例方式图1是说明可实施本专利技术的技术的示范性视频编码和解码系统10的框图。如图1中所展示,系统10包括将经编码视频经由通信信道16发射到目的地装置14的源装置12。源装置12和目的地装置14可包含广泛范围的有线或无线装置中的任一者。在一些情况下,源装置12和目的地装置14包含无线通信装置,例如无线手持机、所谓的蜂窝式或卫星无线电电话,或可在通信信道16上传递视频信息的任何无线装置。虽然贯穿本专利技术在无线应用或设定的上下文中进行了描述,但本专利技术的技术不应限于此。所述技术还可用于有线应用或设定中。在图1的实例中,源装置12可包括视频源20、视频编码器22、调制器/解调器(调制解调器)23和发射器24。目的地装置14可包括接收器26、调制解调器27、视频解码器28和显示装置30。根据本专利技术,源装置12的视频编码器22可经配置以应用本专利技术中描述的量化技术。以此方式,源装置12可实现量化的所要层级且借此改进编码过程。大体来说,源装置12产生用于发射到目的地装置14的经译码视频数据。然而,在一些情况下,装置12、14可以大体上对称的方式进行操作。举例来说,装置12、14中的每一者可包括视频编码和解码组件以及发射和接收组件。因此,系统10 (例如)对于视频串流、视频重放、视频广播或视频电话可支持装置12、14之间的单向或双向视频发射。源装置1本文档来自技高网
...

【技术保护点】
一种在视频译码过程中量化视频块的系数的至少一部分的方法,所述方法包含:为所述视频块的所述系数的所述部分中的每一者确定与相应系数相关联的多个候选量化层级的译码成本,其中与相应系数相关联的每个候选量化层级的译码成本至少部分地基于随后未经量化系数的预测的量化层级,其中随后未经量化系数的预测的量化层级至少部分地基于一随后未经量化系数的系数值;以及基于所述译码成本来为所述系数中的每一者选择所述多个候选量化层级中的一者以获得一组经量化系数,其中随后未经量化系数的预测的量化层级至少部分地基于估计的最大量化层级。

【技术特征摘要】
2008.04.11 US 61/044,232;2008.12.18 US 12/338,8381.一种在视频译码过程中量化视频块的系数的至少一部分的方法,所述方法包含: 为所述视频块的所述系数的所述部分中的每一者确定与相应系数相关联的多个候选量化层级的译码成本,其中与相应系数相关联的每个候选量化层级的译码成本至少部分地基于随后未经量化系数的预测的量化层级,其中随后未经量化系数的预测的量化层级至少部分地基于一随后未经量化系数的系数值;以及 基于所述译码成本来为所述系数中的每一者选择所述多个候选量化层级中的一者以获得一组经量化系数,其中随后未经量化系数的预测的量化层级至少部分地基于估计的最大量化层级。2.一种在视频译码过程中量化视频块的系数的至少一部分的方法,所述方法包含: 为所述视频块的所述系数的所述部分中的每一者确定与相应系数相关联的多个候选量化层级的译码成本,其中与相应系数相关联的每个候选量化层级的译码成本至少部分地基于随后未经量化系数的预测的量化层级,其中随后未经量化系数的预测的量化层级至少部分地基于一随后未经量化系数的系数值;以及 基于所述译码成本来为所述系数中的每一者选择所述多个候选量化层级中的一者以获得一组经量化系数,其中随后未经量化系数的预测的量化层级至少部分地基于系数统计。3.一种在视频译码过程中量化视频块的系数的至少一部分的设备,所述设备包含:量化单元,其: 为所述视频块的所述系数的所述部分中的每一者确定与相应系数相关联的多个候选量化层级的译码成本,其中与相应系数相关联的每个候选量化层级的译码成本至少部分地基于随后未经量化系数的 预测的量化层级,其中随后未经量化系数的预测的量化层级至少部分地基于一随后未经量化系数的系数值;以及 基于所述译码成本来为所述系数中的每一者选择所述多个候选量化层级中的一者以获...

【专利技术属性】
技术研发人员:马尔塔·卡切维奇陈培松叶琰
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1