用于逐块图片编码的帧内预测模式概念制造技术

技术编号：25054657 阅读：64 留言：0更新日期：2020-07-29 05:41

根据第一方面，通过使逐块图片编解码支持帧内预测模式的集合来实现改善的压缩效率，根据该帧内预测模式的集合，通过将图片的当前块的相邻样本的集合应用于神经网络，确定当前块的帧内预测信号。本申请的第二方面在于，在使用基于神经网络的帧内预测模式之外或作为替代，通过对帧内预测模式的集合中的每个帧内预测模式使用专用于确定排名或概率值的神经网络可以使模式选择更有效，这通过将相邻样本的集合应用于该神经网络来进行，其中，排名或概率值用于从包括该帧内预测模式的集合在内的或与该帧内预测模式的集合一致的多个帧内预测模式中选择一个帧内预测模式。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于逐块图片编码的帧内预测模式概念
本申请涉及用于逐块图片编码的改进的帧内预测模式概念，该逐块图片编码例如可用于视频编解码(例如HEVC或HEVC的任何后续)。
技术介绍
帧内预测模式广泛用于图片和视频编码中。在视频编码中，帧内预测模式与诸如帧间预测模式之类的其他预测模式(诸如运动补偿的预测模式)相竞争。在帧内预测模式中，基于相邻样本来预测当前块，即，就提及编码器侧而言已被编码的样本，并且就提及解码器侧而言已被解码的样本。坦白地说，将相邻样本值外推到当前块中，以形成当前块的预测信号，并在数据流中传输针对当前块的预测残差。预测信号越好，预测残差就越低，因此对预测残差进行编码所需的比特数就越少。为了更有效，应当考虑几个方面，以便形成用于在逐块图片编码环境中的帧内预测的有效帧。例如，编解码支持的帧内预测模式的数量越大，则为了将选择发信号通知给解码器，辅助信息率消耗就越大。另一方面，支持的帧内预测模式的集合应该能够提供良好的预测信号，即导致较低的预测残差的预测信号。
技术实现思路
本申请意在提供一种帧内预测模式概念，如果使用改进的帧内预测模式概念，则允许对逐块图片编解码进行更有效的压缩。该目的通过本申请的独立权利要求的主题来实现。根据本申请的第一方面，通过使逐块图片编解码支持帧内预测模式的集合来实现改善的压缩效率，根据该帧内预测模式的集合，通过将图片的当前块的相邻样本的集合应用于神经网络，确定针对当前块的帧内预测信号。该集合可以形成完全支持的多个帧内预测模式或者仅形成多个帧内预测模...

【技术保护点】
1.一种用于从数据流(12)中逐块解码图片(10)的装置，所述装置支持至少包括帧内预测模式的集合(72)在内的多个(66)帧内预测模式，根据所述帧内预测模式的集合，通过将所述图片的当前块(18)的相邻样本的第一集合(60)应用于神经网络(80)来确定所述当前块(18)的帧内预测信号，所述装置被配置为：/n针对所述当前块(18)选择(68)所述多个(66)帧内预测模式中的一个帧内预测模式，并且/n使用所述一个帧内预测模式来预测(71)所述当前块(18)。/n

【技术特征摘要】
【国外来华专利技术】20171013 EP 17196402.61.一种用于从数据流(12)中逐块解码图片(10)的装置，所述装置支持至少包括帧内预测模式的集合(72)在内的多个(66)帧内预测模式，根据所述帧内预测模式的集合，通过将所述图片的当前块(18)的相邻样本的第一集合(60)应用于神经网络(80)来确定所述当前块(18)的帧内预测信号，所述装置被配置为：
针对所述当前块(18)选择(68)所述多个(66)帧内预测模式中的一个帧内预测模式，并且
使用所述一个帧内预测模式来预测(71)所述当前块(18)。

2.根据权利要求1所述的装置，被配置为：
使用可变长度码，从所述数据流(12)中解码索引(70b)，并且
使用所述索引(70b)来执行所述选择。

3.根据权利要求1或2所述的装置，被配置为：
取决于与所述当前块(18)的邻域有关的所述数据流(12)的第一部分(97)，确定所述帧内预测模式的集合(72)的排名，以便获得帧内预测模式的有序列表，并且
基于除所述第一部分之外的所述数据流(12)的第二部分(98)，从所述帧内预测模式的有序列表中选择所述一个帧内预测模式。

4.根据权利要求1或2所述的装置，被配置为：
针对所述帧内预测模式的集合(72)中的每个帧内预测模式，通过将相邻样本的第二集合(86)应用于另一神经网络来确定排名，以获得帧内预测模式的有序列表，
从所述数据流(12)中将索引(70b)解码到所述有序列表中，并且
使用所述索引(70b)和所述有序列表来执行所述选择。

5.根据权利要求4所述的装置，被配置为：使用可变长度码从所述数据流(12)中将所述索引(70b)解码到所述有序列表中。

6.根据权利要求1或2所述的装置，被配置为：
针对所述帧内预测模式的集合(72)中的每个帧内预测模式，通过将相邻样本的第二集合(86)应用于另一神经网络，确定概率值(120)，
使用所述概率值(120)，从所述数据流(12)中熵解码所述帧内预测模式的集合(72)的索引(70b)，并且
使用所述索引(70b)来执行所述选择。

7.根据权利要求3至6中任一项所述的装置，其中，所述相邻样本的第一集合(60)与所述相邻样本的第二集合(86)重合。

8.根据前述权利要求中任一项所述的装置，其中，所述帧内预测模式的集合(72)中的每个帧内预测模式排他地根据所述当前块(18)的相邻样本的第一集合(60)，唯一地确定所述当前块(18)的帧内预测信号。

9.根据前述权利要求中任一项所述的装置，其中，所述多个帧内预测模式还包括包含DC模式或方向模式中的一个或多个在内的帧内预测模式的另一集合，根据所述DC模式，所述当前块(18)被填充有DC值，根据所述方向模式，通过将从所述当前块(18)的相邻样本的第三集合中导出的所述当前块(18)旁边的空间样本值分布沿预定方向投影到所述当前块(18)中来确定所述帧内预测信号。

10.根据前述权利要求中任一项所述的装置，其中，所述多个帧内预测模式还包括帧内预测模式的另一集合，根据所述帧内预测模式的另一集合，使用线性函数从所述当前块(18)的相邻样本的第三集合中确定所述当前块(18)的帧内预测信号，其中，所述相邻样本的第一集合(60)的基数高于所述相邻样本的第三集合的基数。

11.根据权利要求10或11所述的装置，被配置为：在从所述多个帧内预测模式中选择所述一个帧内预测模式时，响应于所述数据流(12)中的一个标志，以便从所述帧内预测模式的集合或所述帧内预测模式的另一集合中选择所述一个帧内预测模式。

12.一种用于将图片(10)逐块编码到数据流(12)中的装置，所述装置支持至少包括帧内预测模式的集合(72)在内的多个(66)帧内预测模式，根据所述帧内预测模式的集合，通过将所述图片(10)的当前块(18)的相邻样本的第一集合(60)应用于神经网络(80)来确定所述当前块(18)的帧内预测信号，所述装置被配置为：
针对所述当前块(18)选择(90)所述多个帧内预测模式中的一个帧内预测模式，并且
使用所述一个帧内预测模式来预测所述当前块(18)。

13.根据权利要求12所述的装置，被配置为：
使用可变长度码来将索引(70b)编码到所述数据流(12)中，所述索引(70b)指示所述选择。

14.根据权利要求12或13所述的装置，被配置为：
取决于与所述当前块(18)的邻域有关的所述数据流(12)的第一部分(97)，确定所述帧内预测模式的集合(72)的排名，以便获得帧内预测模式的有序列表，并且
从帧内预测模式的有序列表中选择所述一个帧内预测模式，并且
除了所述第一部分(97)之外，还形成所述数据流(12)的第二部分(98)，以便指示从所述帧内预测模式的有序列表中的选择。

15.根据权利要求12或14所述的装置，被配置为：
针对所述帧内预测模式的集合(72)中的每个帧内预测模式，通过将相邻样本的第二集合(86)应用于另一神经网络来确定排名，以获得帧内预测模式的有序列表，并且
将所述有序列表的索引(70b)编码到所述数据流(12)中，
其中，所述索引(70b)从所述有序列表中选择所述一个帧内预测模式。

16.根据权利要求15所述的装置，被配置为：使用可变长度码从所述数据流(12)中将所述索引解码到所述有序列表中。

17.根据权利要求12或13所述的装置，被配置为：
针对所述帧内预测模式的集合(72)中的每个帧内预测模式，通过将相邻样本的第二集合(86)应用于另一神经网络，确定概率值(120)，
使用所述概率值(120)来将所述帧内预测模式的集合(72)的索引(70b)熵编码到所述数据流(12)中，所述索引(70b)指向所述一个帧内预测模式。

18.根据权利要求14至17中任一项所述的装置，其中，所述相邻样本的第一集合(60)与所述相邻样本的第二集合(86)重合。

19.根据权利要求12至18中任一项所述的装置，其中，所述帧内预测模式的集合(72)中的每个帧内预测模式排他地根据所述当前块(18)的相邻样本的第一集合(60)，唯一地确定所述当前块(18)的帧内预测信号。

20.根据权利要求12至19中任一项所述的装置，其中，所述多个帧内预测模式还包括包含DC模式或方向模式中的一个或多个在内的帧内预测模式的另一集合，根据所述DC模式，所述当前块(18)被填充有DC值，根据所述方向模式，通过将从所述当前块(18)的相邻样本的第三集合中导出的所述当前块(18)旁边的空间样本值分布沿预定方向投影到所述当前块(18)中来确定所述帧内预测信号。

21.根据权利要求12至20中任一项所述的装置，其中，所述多个帧内预测模式还包括帧内预测模式的另一集合，根据所述帧内预测模式的另一集合，使用线性函数从所述当前块(18)的相邻样本的第三集合中确定所述当前块(18)的帧内预测信号，其中，所述相邻样本的第一集合(60)的基数高于所述相邻样本的第三集合的基数。

22.根据权利要求19或20所述的装置，被配置为：向所述数据流(12)提供一个标志，所述一个标志指示所述一个帧内预测模式是所述帧内预测模式的集合(72)的成员还是所述帧内预测模式的另一集合的成员。

23.一种用于针对基于块的图片编码设计帧内预测模式的集合(72)的装置，所述装置被配置为：
将与第一图片测试块(114)相邻的相邻样本(116)的第一集合(60)应用于第一神经网络(80)，以便针对所述帧内预测模式的集合(72)中的每个帧内预测模式获得针对所述第一测试块的预测信号(118)，并且将与所述第一图片测试块相邻的相邻样本的第二集合(86)应用于第二神经网络(84)，以便针对所述帧内预测模式的集合(72)中的每个帧内预测模式获得指示相应帧内预测模式的概率的概率值(120)；
针对所述帧内预测模式的集合(72)中的每个帧内预测模式，使用针对相应帧内预测模式所获得的预测信号(118)，来确定(122)与预测误差编码和模式信号化相关的编码成本的成本估计(124)；
更新(110)所述第一神经网络(80)的第一参数(113)和所述第二神经网络(84)的第二参数(111)，以便减小具有第一加数和第二加数的编码成本函数，所述第一加数取决于针对具有最低编码成本估计的帧内预测模式所获得的预测信号(118)而形成残差率估计，所述第二加数取决于针对具有最低编码成本估计的所述帧内预测模式所获得的概率值(120)和预测信号(118)而形成模式信令辅助信息率估计；
将与第二图片测试块相邻的相邻样本应用于具有更新的第一参数(113)的第一神经网络(80)和具有更新的第二参数(111)的第二神经网络(84)。

24.根据权利要求23所述的装置，其中，
所述第一神经网络(80)和所述第二神经网络(84)是
线性函数和非线性函数的序列，其中，所述第一参数(113)和所述第二参数(111)包括线性函数的权重。
形成一系列神经元层的线性函数和非线性函数的序列，或
神经元层的序列，其中，所述第一参数(113)和所述第二参数(111)包括控制互连神经元之间的信号强度转发的权重。

25.根据权利要求23或24所述的装置，被配置为：
针对所述帧内预测模式的集合(72)中的每个帧内预测模式，使用针对相应帧内预测模式所获得的所述概率值(120)和所述预测信号(118)，来确定与预测误差编码和模式信号化相关的编码成本的成本估计。

26.根据权利要求23至25中任一项所述的装置，被配置为：
针对所述帧内预测模式的集合(72)中的每个帧内预测模式，将与预测误差编码和模式信号化相关的编码成本的成本估计确定为第一加数与第二加数之和，所述第一加数将针对相应帧内预测模式所获得的预测信号(118)和所述第一图片测试块的原始未失真版本映射到预测误差编码估计上，所述第二加数将针对相应帧内预测模式所获得的概率值(120)映射到模式信号化率估计上。

27.根据权利要求23至26中任一项所述的装置，其中，
所述编码成本函数的第二加数根据针对所有帧内预测模式所获得的概率值(120)，取决于针对具有最低编码成本估计的所述帧内预测模式所获得的预测信号(118)而形成所述模式信令辅助信息率估计作为，针对所有帧内预测模式所获得的概率值(120)指示具有最低编码成本估计的所述帧内预测模式的交叉熵。

28.根据权利要求23至27中任一项所述的装置，其中，
所述编码成本函数的第一加数根据针对相应帧内预测模式所获得的预测信号(118)和所述第一图片测试块的原始未失真版本，取决于针对具有最低编码成本估计的所述帧内预测模式所获得的预测信号(118)而形成所述残差率估计。

29.根据权利要求23至28中任一项所述的装置，被配置为：
使用所述第一参数(113)和所述第二参数(111)顺序地重复针对多个图片测试块的施加、确定和更新，所述第一参数(113)和所述第二参数(111)针对一个图片测试块被更新以用于所述多个图片测试块中的下一图片测试块的施加。

30.根据权利要求23至29中任一项所述的装置，被配置为：
将所述多个图片测试块细分为能够更有效地编码的未细分的第一集合、以及能够更有效地编码的细分为子块的第二集合，并使用所述第一参数(113)和所述第二参数(111)顺序地重复针对所述第一集合的图片测试块的施加、确定和更新，所述第一参数(113)和所述第二参数(111)针对一个图片测试块被更新以用于所述第一集合的下一图片测试块的施加。

31.根据权利要求23至30中任一项所述的装置，被配置为：
使用梯度下降来执行所述更新。

32.根据权利要求23至31中任一项所述的装置，其中，所述相邻样本的第一集合(60)与所述相邻样本的第二集合(86)重合。

33.一种用于从数据流(12)中逐块解码图片(10)的装置，所述装置支持多个帧内预测模式，所述装置被配置为：
针对所述多个(66)帧内预测模式中的帧内预测模式的至少一集合(72)中的每个帧内预测模式，通过将与当前块(18)相邻的相邻样本的第一集合(68)应用于神经网络(80)来确定排名或概率值(120)，
使用所述排名或所述概率值(120)，针对所述当前块(18)在所述多个帧内预测模式中选择一个帧内预测模式，...

【专利技术属性】
技术研发人员：乔纳森·普法夫，菲利普·赫勒，多米尼克·马尼里，托马斯·威甘德，沃耶西·萨梅克，史蒂芬·卡滕斯塔德勒，海科·施瓦茨，德特勒夫·马尔佩，米沙·斯科曼，马丁·温肯，
申请(专利权)人：弗劳恩霍夫应用研究促进协会，
类型：发明
国别省市：德国;DE

全部详细技术资料下载我是这个专利的主人