视频编解码器中用信号通知的方法技术

技术编号:32170927 阅读:29 留言:0更新日期:2022-02-08 15:28
视频编解码器中视频数据的编码涉及残差的变换。这可以由主变换和二次变换组成。二次变换的选择是通过考虑要编码的块的特性来实现的。可以向解码器用信号通知二次变换的选择,或在解码器中推断。或在解码器中推断。

【技术实现步骤摘要】
【国外来华专利技术】视频编解码器中用信号通知的方法


[0001]本公开涉及视频编码,并且具体地但不排他地涉及为存储或传输做准备的视频数据的编码。

技术介绍

[0002]已经开发了各种视频编码技术,以处理数字视频演示和其他类似的媒体对象。用于创建视频演示的技术的最新发展已导致这样的演示的精确度、清晰度、细节和复杂程度的进步和增强。因此,用于构建视频演示的数据量已显著增加。
[0003]随着视频录制和创建技术的这些进步,现在用户越来越期望获取数字格式的视频演示,这激发有效的文件大小。例如,存储介质的大小是有限的,并且如果要创建特别高清晰度的电影,而没有某种形式的编码和/或压缩,则该电影的数字文件可能大于存储介质的容量。
[0004]读者将理解,数字媒体编码和压缩的关键驱动因素是媒体的分发越来越受通信信道影响的事实。为此,通过物理技术(例如,激光光纤通信)的进步,以及通过数据在这样的信道上通信的方式的更高的效率,通信信道的速度和容量有了实质性的改进。
[0005]然而,仍然普遍需要考虑提高视频编码效率的方式。这既是从减少将视频演示传输到特定清晰度级别所需的数据量的角度出发,也是从管理在编码器处对视频演示进行编码以及在解码器处对编码数据进行解码所需的计算复杂度级别的角度出发。
[0006]以这种方式提高编码效率也对数据存储具有潜在的积极影响。这将对订阅服务的任何提供商产生影响,因为需要存储大量视频演示以提供给可能在存储容量有限的装置上观看这样的视频演示的订阅者或广播员以及接收者。
[0007]更广泛地说,期望减少要在传输器与接收器之间传输的数据量,减少对网络使用的影响,并减少在公共网络上下载大量数据对用户的任何潜在的财务影响。
[0008]帧内预测包括通过使用从同一帧内的其他块提取的参考样本在视频帧中的样本块中执行预测。这样的预测可以通过不同的技术(在传统的编解码器架构中被称为“模式”)获得。
[0009]在由联合视频专家组(JVET)开发的提议的VVC(通用视频编码)技术中,旨在定义多种可能的帧内预测模式。因此,这些模式中的一个可以用于帧内预测,并且可以在比特流中用信号通知或者在解码器处以其他方式确定特定选择的模式。
附图说明
[0010]图1是根据实施例的通信网络的示意图;
[0011]图2是图1的通信网络的发射器的示意图;
[0012]图3是图示出在图2的发射器上实现的编码器的图;
[0013]图4是根据第一特定实施例的在图3的编码器的变换模块处执行的变换选择过程的流程图;
[0014]图5是根据第二特定实施例的在图3的编码器的变换模块处执行的变换选择过程的流程图;
[0015]图6是根据第三特定实施例的在图3的编码器的变换模块处执行的变换选择过程的流程图;
[0016]图7是图1的通信网络的接收器的示意图;
[0017]图8是图示出在图7的接收器上实现的解码器的图;
[0018]图9是根据第一配置的在图8的解码器处的二次逆变换过程的流程图;以及
[0019]图10是根据第二配置的在图8的解码器处的二次逆变换过程的流程图。
具体实施方式
[0020]本公开的方面可以对应于所附权利要求的主题。
[0021]一般而言,帧内预测涉及对给定块的残差数据执行主变换和可选的二次变换以产生系数信息。系数信息相对于原始帧数据通常采用压缩形式。
[0022]在当前的VVC草案规范中,二次变换的集合(在VVC规范中被称为“低频不可分离变换”)可以应用于帧内编码的主变换系数以进一步减少残差信号的能量。为每个块编码标志以确定该块是否使用二次变换。在块使用二次变换的情况下,在解码器处应用逆二次变换矩阵以恢复主变换系数。
[0023]对于(在编码器处使用的)每个二次变换矩阵,存在(在解码器处使用的)对应的逆二次变换矩阵。特定二次变换矩阵的选择由用于生成残差信号的帧内预测模式确定。此外,为每个二次变换块编码标志以在与帧内预测模式相对应的两个可能的二次变换矩阵中的一个之间作出决定。在当前的VVC草案规范中,无论主变换类型如何,都使用二次变换。
[0024]本专利技术的方面涉及以流线化的方式简化在视频编解码器中使用的二次变换的方法,流线化的方式可以去除变换/量化管道对预测管道的不必要的依赖,从而实现两个管道的独立操作。在对应的主变换能够自行恢复大部分编码性能的情况下,实施例可以进一步消除二次变换的使用,这简化了编码过程和解码过程两者。
[0025]在本文中描述的实施例被设想为对设想的通用视频编码(VVC)规范中提出的编解码器的修改。然而,读者将意识到本文公开的原理对VVC范围之外的其他场景具有潜在的适用性。VVC的范围不应被视为对本公开的范围的限制。
[0026]本文中描述的第一实施例包括在帧内预测中推导二次变换集的方法,该二次变换集包括用于产生残差数据和对应的系数的二次变换的集合。
[0027]这可以看作是VVC草案规范中现有的基于帧内模式的二次变换集推导过程的替代。在该实施例中,通过基于块尺寸的过程来执行二次变换集推导。这利用了以下事实,即在VVC架构中,块尺寸在变换/量化管道中很容易获得,并且因此这可以防止管道间的依赖性。除了块尺寸之外,信道id(亮度或色度)也被进一步合并以增强所提出的二次变换集推导过程的准确性。
[0028]在实施例中,进行鉴别步骤以确定已采用哪个主变换。除了主变换是作为在水平方向和垂直方向两者上的DCT2(离散余弦变换,类别2)的整数近似而被获得的情况之外,实施例禁止使用二次变换。该简化允许更短的编码时间以及减少解码器的复杂性。与当前的VVC提案相比,这将完全去除当前VVC草案规范中的一个上下文模型。
[0029]本公开的方面可以从所附权利要求中确定。
[0030]如图1中所图示,图示出了包括示意性视频通信网络10的布置,其中发射器20和接收器30经由通信信道40进行通信。在实践中,通信信道40可以包括卫星通信信道、有线网络、地面无线电广播网络、诸如用于向家庭和小型商业场所提供互联网服务的电话通信信道、光纤通信系统或者上述任何一种和任何其他可想到的通信介质的组合。
[0031]此外,本公开还扩展到通过物理传送将存储介质传递到能够读取该介质并从中获得比特流的适当配置的接收器的通信,在该存储介质上存储有被编码的比特流的机器可读记录。这方面的示例是提供数字多功能光盘(DVD)或等同物。以下描述集中于诸如通过电子或电磁信号载体的信号传输,但不应被理解为排除上述涉及存储介质的方法。
[0032]如图2中所示,发射器20在结构和功能上是计算机设备。它可以与通用计算机设备共享某些特征,但是给定发射器20将被放置用于的专用功能,一些特征可以是实现特定的。读者将了解哪些功能可以是通用类型,并且哪些可能需要特定配置以用于视频发射器。
[0033]因此,发射器20包括被配置用于在处理图形和类似操作中的特定用途的图形处理单元(GPU)202本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种编码器,可操作以将视频帧的块编码到比特流上,所述编码器包括:帧内预测模块,可操作以根据多个帧内预测模式中的选择的帧内预测模式参考所述帧中的一个或多个其他块来预测所述块,所述多个帧内预测模式包括多个方向模式,以参考所述一个或多个其他块形成残差信息;和变换模块,可操作以将矩阵变换应用于所述残差信息,所述矩阵变换由主变换矩阵和二次变换矩阵管制,其中,基于被编码的所述块的特性,从变换矩阵列表中选择所述二次变换矩阵。2.根据权利要求1所述的编码器,其中,所述变换模块可操作以基于要编码的所述块的特性确定候选二次变换矩阵的集合,并且然后基于性能标准从所述候选二次变换矩阵的集合中选择所述二次变换矩阵。3.根据权利要求2所述的编码器,其中,所述变换模块可操作以确定候选数量,所述候选数量确定在所述候选二次变换矩阵的集合中要确定多少个候选二次变换矩阵,所述候选数量是基于被编码的所述块的特性确定的。4.根据权利要求2或权利要求3所述的编码器,其中,所述性能标准是压缩效率。5.根据前述权利要求中任一项所述的编码器,其中,所述特性包括所述块是包括色度数据还是亮度数据。6.根据前述权利要求中任一项所述的编码器,其中,所述特性包括被包含在所述块中的非零系数的数量。7.根据前述权利要求中任一项所述的编码器,其中,所述特性包括在所述块的指定部分内的非零系数的数量。8.根据前述权利要求中任一项所述的编码器,其中,所述特性包括所述块的尺寸特性。9.根据权利要求8所述的编码器,其中,所述尺寸特性包括所述块的高度或宽度中的至少一个。10.根据权利要求8或权利要求9所述的编码器,其中,所述尺寸特性包括所述块的高度与宽度的比率。11.根据前述权利要求中任一项所述的编码器,其中,所述变换模块可操作以基于所述主变换矩阵的选择来选择所述二次变换矩阵。12.根据权利要求11所述的编码器,其中,所述变换模块可操作以根据是预定字符的所述主变换矩阵来选择不应用二次变换。13.根据权利要求12所述的编码器,其中,所述主变换的所述预定字符包括它被推导为在水平方向和垂直方向上使用的离散余弦变换的整数近似。14.根据权利要求13所述的编码器,其中,所述离散余弦变换是DCT2。15.根据前述权利要求中任一项所述的编码器,其中,所述变换模块可操作以根据被包含在块内或所述块的指定部分内的非零系数的数量来选择要应用或不应用二次变换。16.根据前述权利要求中任一项所述的编码器,其中,所述二次变换矩阵是基于应用于所述残差信息中的一个或多个的计算操作来选择的。17.根据权利要求16所述的编码器,其中,所述计算操作是应用于所述残差信息中的一个或多个的模操作。18.根据权利要求17所述的编码器,其中,所述模操作被应用于所述残差信息中的一个
或多个预定残差信息。19.一种将视频帧的块编码到比特流上的方法,所述方法包括:根据多个帧内预测模式中的选择的帧内预测模式参考所述帧中的一个或多个其他块来对所述块进行编码,所述多个帧内预测模式包括多个方向模式,以参考所述一个或多个其他块形成残差信息;和将矩阵变换应用于所述残差信息,所述矩阵变换由主变换矩阵和二次变换矩阵管制,其中,基于被编码的所述块的特性,从变换矩阵列表中选择所述二次变换矩阵。20.根据权利要求18所述的方法,包括基于要编码的所述块的特性确定候选二次变换矩阵的集合,并且然后基于性能标准从所述候选二次变换矩阵的集合中选择所述二次变换矩阵。21.根据权利要求20所述的方法,包括确定候选数量,所述候选数量确立在所述候选二次变换矩阵的集合中要确定多少个候选二次变换矩阵,所述候选数量是基于被编码的所述块的特性确定的。22.根据权利要求20或权利要求21所述的方法,其中,所述性能标准是压缩效率。23.根据权利要求19至22中任一项所述的方法,其中,所述特性包括所述块是包括色度数据还是亮度数据。24.根据权利要求19至23中任一项所述的方法,其中,所述特性包括被包含在所述块中的非零系数的数量。25.根据权利要求19至24中任一项所述的方法,其中,所述特性包括在所述块的指定部分内的非零系数的数量。26.根据权利要求19至25中任一项所述的方法,其中,所述特性包括所述块的尺寸特性。27.根据权利要求26所述的方法,其中,所述尺寸特性包括所述块的高度或宽度中的至少一个。28.根据权利要求26或权利要求27所述的方法,其中,所述尺寸特性包括所述块的高度与宽度的比率。29.根据权利要求19至28中任一项所述的方法,包括基于所述主变换矩阵的选择来选择所述二次变换矩阵。30.根据权利要求29所述的方法,包括根据是预定字符的所述主变换矩阵来选择不应用二次变换。31.根据权利要求30所述的方法,其中,所述主变换的所述预定字符包括它被推导为在水平方向和垂直方向上使用的离散余弦变换的整数近似。32.根据权利要求31所述的方法,其中,所述离散余弦变换是DCT2。33.根据权利要求19至32中任一项所述的方法,包括根据被包含在块内或所述块的指定部分内的非零系数的数量来确定是否应用二次变换。34.根据权利要求19至33中任一项所述的方法,其中,所述二次变换矩阵是基于应用于所述残差信息中的一个或多个的计算操作来选择的。35.根据权利要求34所述的方法,其中,所述计算操作是应用于所述残差信息中的一个或多个的模操作。
36.根据权利要求35所述的方法,其中,所述模操作被应用于所述残差信息中的一个或多个预定残差信息。37.一种计算机可读介质,包括计算机可执行指令,所述计算机可执行指令当在计算机上执行时,使该计算机被配置成执行根据权利要求19至36中任一项所述的方法。38.一种由根据权利要求19至36中任一项所述的方法编码的数据集。39.一种存储根据权利要求38所述的数据集的存储介质。40.一种承载计算机可执行指令的信号,所述计算机可执行指令当在计算机上执行时,使该计算机被配置成执行根据权利要求19至36中任一项所述的方法。41.一种承载根据权利要求38所述的数据集的信号。42.一种用于对表示视频帧的块的被...

【专利技术属性】
技术研发人员:萨韦里奥
申请(专利权)人:英国广播公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1