视频编解码方法及装置制造方法及图纸

技术编号:37632196 阅读:16 留言:0更新日期:2023-05-20 08:53
一种视频编解码方法和装置,包括接收与当前块相关的输入数据,当当前块的大小大于或等于阈值大小时,通过禁用几何分区模式(Geometric PartitioningMode,简称GPM)来确定当前块的编码模式,以及根据确定的编解码模式对当前块进行编码或解码。在通过并行处理元件(processing element,简称PE)执行率失真优化(Rate Distortion Optimization,简称RDO)的高吞吐量视频编码器中,所有或部分PE以广播形式接收搜索范围参考样本。并行PE在当前块的各种分区上测试多种编解码模式,决定将当前块划分为一个或多个编解码块的块分区结构,以及决定每个编解码块的编解码模式。决定每个编解码块的编解码模式。决定每个编解码块的编解码模式。

【技术实现步骤摘要】
Motion Vector Difference,简称MMVD)通过发送运动向量差(Motion Vector Difference,简称MVD)信息来进一步细化选择的合并候选。MMVD标志在常规合并标志之后立即发送,以指定MMVD模式是否用于CU。在比特流中发送的MMVD信息包括MMVD候选标志、指定运动幅度的索引和用于指示运动方向的索引。在MMVD模式中,合并列表中的前两个候选之一被选择作为MV基础。MMVD候选标志被发送以指定前两个合并候选中的哪一个被使用。距离索引指定运动幅度信息以及指示距起点的预定偏移。偏移量被添加到起始MV的水平或垂直分量。距离索引与预定偏移量的关系如表1所示。
[0007]表1

距离索引与预定偏移量的关系
[0008]距离索引01234567偏移量(以亮度样本为单位)1/41/212481632
[0009]方向索引表示MVD相对于起点的方向。方向索引表示沿水平和垂直方向的四个方向之一。需要注意的是,MVD符号的含义可以根据起始MV的信息而变化。例如,当起始MV是单向预测MV或双向预测MV,其中两个列表都指向当前图片的相同方向时,表2所示的符号指定添加到起始MV的MV偏移量的符号。如果两个参考图片的图片顺序计数(Picture Order Count,简称POC)都大于当前图片的POC,或者两个参考图片的POC都小于当前图片的POC,则两个列表都指向当前图片的相同方向。当起始MV是双向预测MV,其中两个MV指向当前图片的不同方向,以及列表0中的POC的差值大于列表1中的POC时,表2中的符号指定添加到起始MV的列表0MV分量的MV偏移量的符号,以及列表1MV的符号具有相反的符号。否则,当列表1中的POC的差值大于列表0中的POC时,表2中的符号指定添加到起始MV的列表1MV分量的MV偏移量的符号,以及列表0MV的符号具有相反的符号。MVD根据每个方向上POC的差值进行缩放。如果两个列表中POC的差值相同,则缩放不被需要;否则,如果列表0中的POC差值大于列表1的POC差值,则通过将列表0的POC差值定义为td以及将列表1的POC差值定义为tb来缩放列表1的MVD。如果列表1的POC差值大于列表0,则列表0的MVD以相同的方式缩放。如果起始MV是单向预测的,则MVD被添加到可用MV。
[0010]表2

方向索引指定的MV偏移量的符号
[0011]方向IDX00011011x

axis+

N/AN/Ay

axisN/AN/A+

[0012]具有CU级别权重(Bi

prediction with CU

level Weight,简称BCW)的双向预测在HEVC标准中,通过对从两个不同参考图片获得的两个预测信号进行平均和/或使用的两个不同运动向量,双向预测信号被生成。在VVC标准中,双向预测模式被扩展到简单平均之外,以允许对两个预测信号进行加权平均。
[0013]P
bi

pred
=((8

w)*P0+w*P1+4)>>3
[0014]在VVC标准中,加权平均双向预测中允许有五个权重w∈{

2,3,4,5,10}。在每个双向预测的CU中,权重w以下两种方式之一确定:1)对于非合并CU,权重索引在运动向量差之后发送;2)对于合并CU,权重索引基于合并候选索引从相邻块中推断出来。BCW仅适用于具有256或更多亮度样本的CU,这意味着CU宽度乘以CU高度必须大于或等于256。对于低延迟图片,所有5个权重被使用。对于非低延迟图片,仅3个权重w∈{3,4,5}被使用。
[0015]快速搜索算法被用来找到权重索引,而不会显著增加视频编码器处的编码器复杂
度。当BCW与适应性运动向量分辨率(Adaptive Motion Vector Resolution,简称AMVR)相结合时,如果当前图片是低延迟图片,则仅对1像素和4像素运动向量精度有条件地检查不相等的权重。当BCM与仿射模式相结合时,只有当仿射模式被选为当前最佳模式时,仿射运动估计(affine Motion Estimation,简称ME)才会被执行用于不相等的权重。只有当双向预测中的两个参考图片相同时,不相等的权重才会被有条件地检查。当特定条件被满足时,不相等的权重不被搜索,这取决于当前图片与其参考图片之间的POC距离、编解码QP和时间级别。
[0016]BCW权重索引使用一个上下文编解码的二进制位(bin)进行编解码,然后是旁路编解码的二进制位。第一上下文编解码的bin指示是否使用相等的权重;以及如果不相等的权重被使用,则额外的bin使用旁路编解码发送,以指示哪个不相等的权重被使用。加权预测(weighted prediction,简称WP)是一种受H.264/AVC和HEVC标准支持的编解码工具,可有效编解码具有衰落的视频内容。对WP的支持也被添加到VVC标准中。WP允许对每个参考图片列表L0和L1中的每个参考图片发送加权参数(权重和偏移量)。在运动补偿期间,相应参考图片的权重和偏移量被应用。WP和BCW被设计用于不同类型的视频内容。为了避免WP和BCW之间的交互(这会使VVC解码器设计复杂化),如果CU使用WP,则BCW权重索引不被通知,以及w被推断为4,意味着相等的权重被应用。对于合并CU,权重索引从基于合并候选索引的相邻块中推断。这可以应用于普通合并模式(normal Merge mode)和继承仿射合并模式(inherited affine Merge mode)。对于构建的仿射合并模式,仿射运动信息基于最多3个块的运动信息构建。使用构建的仿射合并模式的CU的BCW索引被简单地设置为等于第一控制点MV的BCW索引。在VVC标准中,组合帧间和帧内预测(Combined Inter and Intra Prediction,简称CIIP)和BCW不能联合应用于CU。当CU使用CIIP模式编解码时,当前CU的CBW索引被设置为4,意味着相等的权重被应用。
[0017]几何分区模式(Geometric Partitioning Mode,简称GPM)在VVC标准中,GPM被支持用于帧间预测。GPM的应用使用CU级别标志作为一种合并模式发送,其他合并模式包括常规合并模式、MMVD模式、CCIP模式和子块合并模式。整个地,对于每个可能的CU大小w
×
h=2m
×
2n,GPM总共支持64个分区,其中m,n∈{3

6}不包括8x64和64x8。以前,当这种模式被使用时,CU被一条几何定位的直线分成两部分,如图2所示。分割线的位置在数学上从特定分区的角度和偏移参数得出。CU中几何分区的每个部分都使用自己的运动信息进行帧间预测;每个分区只允许单向预测,即每个部分有一个运动向量和一个参考索引。单向预测运动约束被用来确保仅两个运动补偿预测子被计算用于每个本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频编解码方法,用于视频编码系统或视频解码系统,所述方法包括:接收与当前块相关的输入数据;将所述当前块的大小与阈值大小进行比较;确定所述当前块的编解码模式,其中当所述当前块的所述大小大于或等于所述阈值大小时,对所述当前块禁用几何分区模式;以及通过确定的所述编解码模式对所述当前块进行编码或解码,其中,当所述编解码模式为几何分区模式时,所述当前块包括第一部分、第二部分和第三部分,所述当前块的所述第一部分基于第一组预测子进行帧间预测,所述当前块的所述第二部分基于第二组预测子进行帧间预测,所述第三部分基于第三组预测子进行帧间预测,其中所述第三组预测子通过基于所述第一组预测子和所述第二组预测子进行混合导出。2.如权利要求1所述的视频编解码方法,其特征在于,所述阈值大小是2048个样本。3.如权利要求2所述的视频编解码方法,其特征在于,所述当前块的所述大小为64x64、64x32或32x64个样本时,对所述当前块禁用几何分区模式。4.如权利要求1所述的视频编解码方法,其特征在于,所述方法进一步包括确定所述当前块的合并候选列表中的一候选数量,将所述当前块的所述合并候选列表中的所述候选数量与阈值数量进行比较,当所述候选数量大于所述阈值数量时,对所述当前块禁用几何分区模式。5.如权利要求4所述的视频编解码方法,其特征在于,当所述当前块的所述大小小于所述阈值大小或所述当前块的所述大小大于或等于所述阈值大小且所述合并候选列表中的所述候选数量小于或等于所述阈值数量时,几何分区模式被致能用于所述当前块。6.如权利要求4所述的视频编解码方法,其特征在于,所述阈值数量是3。7.一种视频编码方法,用于在视频编码系统中通过多个并行处理元件确定块分区结构和编码模式,所述方法包括:接收与当前块相关的输入数据;由所述多个并行处理元件处理与所述当前块相关的所述输入数据以确定所述当前块的所述块分区结构和所述当前块中每个编解码块的编解码模式,其中在一个或多个运行中,每个处理元件执行与编解码模式或编解码模式的一个或多个候选相关的多个任务,包括:读取搜索范围内存以获取所述多个处理元件的多个搜索范围参考样本,其中两个或多个处理元件以广播形式接收多个搜索范围参考样本;由所述多个处理元件测试所述当前块的多个分区和多个子分区上的多个编解码模式;根据与所述多个处理元件测试的所述多个编解码模式相关的多个率失真成本,决定将所述当前块分割为一个或多个编解码块的所述块分区结构以及每个编解码块对应的编解码模式;以及根据对应的所述编解码方式对所述当前块中的每个编解码块进行编码。8.如权利要求7所述的视频编码方法,其特征在于,所述搜索范围内存为三层搜索范围内存结构,包括第二层搜索范围内存、多个第二层搜索范围内存和至少一个广播搜索范围内存,其中所述多个搜索范围参考样本从所述第三层搜索范围内存按时间交错读取方式输出到所述多个第二层搜索范围内存,以将所述多个搜索范围参考样本分发给对应的多个处
理元件,至少一个第二层搜索范围内存将所述多个搜索范围参考样本输出到至少一个广播搜索范围内存,以及每个广播搜索范围内存将所述多个搜索范围参考样本广播到两个或多个处理元件。9.如权利要求8所述的视频编码方法,其特征在于,第三层缓存埠由两个或多个第二层搜索范围内存共享。10.如权利要求8所述的视频编码方法,其特征在于,每个广播搜索范围内存的扫描顺序...

【专利技术属性】
技术研发人员:陈俊嘉徐志玮庄子德陈庆晔黄毓文
申请(专利权)人:联发科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1