视频编解码方法和装置制造方法及图纸

技术编号:39181270 阅读:13 留言:0更新日期:2023-10-27 08:29
利用率失真优化量化(Rate

【技术实现步骤摘要】
视频编解码方法和装置


[0001]本专利技术涉及用于视频编解码系统,更具体地,本专利技术涉及专门为硬件友好实现而设计的变换系数的率失真优化量化。

技术介绍

[0002]通用视频编解码(Versatile Video Coding,简称VVC)标准是由ITU

T视频编解码专家组(Video Coding Experts Group,简称VCEG)和ISO/IEC运动图片专家组(Moving Picture Experts Group,简称MPEG)组成的联合视频专家组开发的最新视频编解码标准。该标准已作为ISO标准发布:ISO/IEC 23090

3:2021,信息技术

沉浸式媒体的编解码表示

第3部分:多功能视频编解码,2021年2月发布。VVC是基于其前身高效视频编解码(High Efficiency Video Coding,简称HEVC)通过添加更多的编解码工具来提高编解码效率以及处理包括3维(three

dimensional,简称3D)视频信号在内的各种类型的视频源。
[0003]图1提供了VVC编码系统的简化系统框图的示例,其中虚线框150内的块对应于对应解码器的主要块。输入视频信号由预测信号(136)预测,该预测信号(136)使用帧间预测、帧内预测或组合帧内/帧间预测(110)导出。使用加法器116,预测残差信号被导出为输入信号和预测信号136之间的差值。然后预测残差信号由变换(118)处理。来自变换118的变换系数由量化器120量化以及由熵编码器122进行熵编码。其他辅助信息(side information)和相关编解码参数也可以被熵编解码以及包括在比特流中。重构块128将预测信号和来自逆变换(126)的重构残差信号相加,其中逆变换126从去量化器124接收去量化的变换系数。来自重构块128的重构信号进一步由环路滤波器130处理以减少编解码伪影(artifacts)。解码图片存储在帧缓冲器(134)中,用于预测输入视频信号中的未来图片。在解码器侧,参考图片可被提供作为输出图片。预测块110在编码器侧和解码器侧不同地操作。在编码器端,块将执行帧间预测的运动估计或选择实现最佳编解码性能的帧内预测模式。在解码器端,该块将执行帧间预测的运动补偿或使用编码器确定的模式的帧内预测。
[0004]根据VVC,类似于HEVC,输入图片被划分为称为编解码树单元的(Coding Tree Unit,简称CTU)的非重叠方形块区域。每个CTU可以划分为一个或多个较小尺寸的编解码单元(coding unit,简称CU)。生成的CU分区可以是正方形或矩形。此外,VVC将CTU划分为预测单元(prediction unit,简称PU)作为一个单元来应用预测处理,例如帧间预测、帧内预测等。
[0005]VVC标准结合了各种新的编解码工具,以进一步提高HEVC标准的编解码效率。例如,仿射运动估计被VVC标准采用。仿射运动估计和ALF简要回顾如下。
[0006]率失真优化量化(Rate

distortion Optimized Quantization,简称RDOQ)
[0007]在VVC的视频测试模型中(Adrian Browne,et al.,“Algorithm description for Versatile Video Coding and Test Model 14(VTM 14)”,Joint Video Experts Team(JVET)of ITU

T SG 16 WP 3 and ISO/IEC JTC 1/SC 29,23rd Meeting,by teleconference,7

16 July 2021,Document:JVET

W2002

v1),率失真优化量化(RDOQ)应
用于变换系数。根据RDOQ,变换系数被直接量化到级别l
ceil
。然后直接量化的变换系数被调整到优化级别或最佳级别(l
best
)。最佳级别(l
best
)根据RD

成本确定如下:
[0008]如果l
ceil
=0,最佳级别=0
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0009]如果l
ceil
=1,最佳级别=0或1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0010]如果l
ceil
=2,最佳级别=0,1或2
ꢀꢀꢀꢀꢀꢀꢀ
(3)
[0011]如果l
ceil
>2,最佳级别=l
ceil
或l
ceil
‑1ꢀꢀꢀ
(4)
[0012]例如,当l
ceil
>2时,最佳级别(l
best
)在l
ceil
和l
ceil

1之间选择,具体取决于哪个可以实现更好的RD性能(即更低的RD成本)。根据VTM,当前系数的率根据5个相邻的最终量化级别估计。最终量化级别被定义为RDOQ处理的系数。5个相邻的最终量化级别的位置如图2所示,其中位置210对应于当前系数,标有“X”的5个位置对应于5个相邻的最终量化级别,用于估计当前系数的比特率。如图2所示,5个相邻量化系数由两个右侧相邻量化系数、一个右下相邻量化系数和两个底部相邻量化系数组成。比特率估计包括计算5个相邻最终量化级别的总和以及计算非零级别的数量以用于上下文选择。因此,RDOQ对硬件(hardware,简称HW)实现提出了挑战,因为由于数据依赖性,一个变换块(TB)中的变换系数不能同时并行处理。当符号数据隐藏(sign data hiding,简称SDH)被应用时,关键路径变得更糟。
[0013]数据相关性也出现在系数组(CG)有效标志的率估计中。根据VTM,当前CG有效标志的率基于两个相邻的CG(一个在右侧,一个在底部)估计,如图3所示,其中CG 310是当前CG,CG 320是右侧CG以及CG 330是底部CG。当前的CG有效标志估计参考右侧CG和底部CG的有效标志来确定率估计的对应上下文。CG有效标志基于CG中的最终量化系数。同样,这对硬件(HW)实现提出了挑战,因为由于数据依赖性,一个TB中的CG不能同时并行处理。
[0014]VTM还支持符号数据隐藏(sign data hiding,简称SDH),从而可以节省1比特。VVC使用与之前的高效视频编解码(High Efficiency Video Coding,简称HEVC)标准相同的SDH技术。如果CG内最后一个和第一个非零级别(按编解码顺序)的扫描索引之间的差值大于3,则CG的最后一个非零级别的符号不被编解码,而是CG的最后一个非零级本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频编解码方法,包括:接收与当前图片中的变换块相关联的多个变换系数;将所述多个变换系数量化为多个量化变换系数;基于当前量化变换系数的一个或多个相邻量化系数和当前系数组,对属于所述当前系数组的所述当前量化变换系数的级别集合的级别估计第一率;以及从所述当前量化变换系数的所述级别集合中选择所述当前量化变换系数的最佳级别,其中所述最佳级别获得最佳率失真成本。2.如权利要求1所述的视频编解码方法,其特征在于,所述方法进一步包括:基于所述当前量化变换系数的所述一个或多个相邻量化系数和所述当前系数组估计与零或非零系数组相关联的语法的第二率。3.如权利要求1所述的视频编解码方法,其特征在于,如果所述当前量化变换系数等于0,则所述当前量化变换系数的所述级别集合由0组成;如果所述当前量化变换系数等于1,则所述当前量化变换系数所述级别集合由0和1组成;如果所述当前量化变换系数等于2,则所述当前量化变换系数的所述级别集合由0、1和2组成;如果所述当前量化变换系数大于2,则所述当前量化变换系数的所述级别集合由所述当前量化变换系数和(所述当前量化变换系数

1)组成。4.如权利要求1所述的视频编解码方法,其特征在于,如果所述当前量化变换系数等于0,则所述当前量化变换系数的所述级别集合由0组成;如果所述当前量化变换系数大于0,则所述当前量化变换系数的所述级别集合由所述当前量化变换系数和(所述当前量化变换系数

1)组成。5.如权利要求1所述的视频编解码方法,其特征在于,所述当前量化变换系数的所述一个或多个相邻量化系数包括两个右侧相邻量化系数、一个右下相邻量化系数和两个底部相邻量化系数。6.如权利要求1所述的视频编解码方法,其特征在于,所述当前系数组的所述一个或多个相邻量化系数由右侧相邻系数组中的所述多个量化系数和底部相邻系数组中的所述多个量化系数组成。7.如权利要求6所述的视频编解码方法,其特征在于,所述方法进一步包括:基于所述相邻系数组的所述一个或多个相邻量化系数估计当前系数组有效标志的第三率。8.如权利要求1所述的视频编解码方法,其特征在于,所述一个或多个相邻量化系数与所述一个或多个相邻量化系数的多个非零量化系数的总和被用来估计属于所述当前量化变换系数的所述级别集合的所述级别的所述第一率。9.如权利要求1所述的视频编解码方法,其特征在于,当符号数据隐藏被用来保存所述变换块的一个系数组中的所述多个变换系数的符号数据的一个比特以及一个系数组中的多个最佳级别之总和的奇偶不满足符号数据隐藏假设时,符号数据隐藏处理检查目标量化变换系数的所述级别集合中除了等于最佳级别的所述级别之外的所有级别。10.如权利要求9所述的视频编解码方法,其特征在于,对于对大于1的所述目标量化变换系数选择的每个最佳级别,当所述最佳级别等于(所述目标量化变换系数

1),则所述符号数据隐藏处理检查所述目标量化变换系数的符号隐藏,以及当所述最佳级别等于所述目标量化变换系数,则所述符号数据隐藏处理检查(所述目标量化变换系数

1)。
11.一种视频编解码装置,包括一个或多个电子电路或处理器,用于:接收与当前图片中的变换块相关联的多个变换系数;将所述多个变换系数量化为多个量化变换系数;基于当前量化变换系数的一个或多个相邻量化系数和当前系数组,对属于所述当前系数组的所述当前量化变换系数的级别集合的级别估计第一率;以及从所述当前量化变换系数的所述级别集合中选择所述当前量化变换系...

【专利技术属性】
技术研发人员:赖贞延庄子德陈庆晔陈俊嘉徐志玮黄毓文
申请(专利权)人:联发科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1