具有自适应迭代帧内预测的视频压缩制造技术

技术编号：35503697 阅读：16 留言：0更新日期：2022-11-09 14:14

一种在视频编码器处进行视频编码的方法包括：接收与当前第一块相关联的一个或多个语法元素，所述当前第一块属于从图片划分出的多个第一块，所述一个或多个语法元素用于指示：最佳分区，所述最佳分区指示如何将所述当前第一块划分成用于帧内预测的多个第二块、一组块选择信号，其中所述当前第一块被重新划分成多个第三块，每个块选择信号对应于所述多个第三块中的一个，并且指示相应的第三块是使用第一编码方法还是第二编码方法编码的、以及一组压缩表示，每个压缩表示对应于所述多个第三块中的一个。可以基于所述一个或多个语法元素重建所述当前第一块，以生成重建的当前第一块。以生成重建的当前第一块。以生成重建的当前第一块。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】具有自适应迭代帧内预测的视频压缩
引用并入
[0001]本公开要求于2021年9月27日提交的、申请号为17/486,533、名称为“具有自适应迭代帧内预测的视频压缩”的美国专利申请的优先权，其要求于2021年1月27日提交的、申请号为63/142,377、名称为“具有自适应迭代帧内预测的神经图像压缩”的美国临时申请的优先权。在先申请的公开内容通过引用整体并入本文。

[0002]本公开描述了总体上涉及基于人工神经网络的视频编解码的实施例。

技术介绍

[0003]本文所提供的背景描述旨在总体上呈现本公开的背景。在
技术介绍
部分以及本说明书的各个方面中所描述的目前已署名的专利技术人的工作所进行的程度，并不表明其在本公开提交时作为现有技术，且从未明示或暗示其被承认为本公开的现有技术。
[0004]神经网络基于一组连接的节点(也称为神经元)，这些节点松散地模拟生物大脑中的神经元。神经元可以组织成多个层。一个层的神经元可以连接到紧邻的前一层和紧邻的后一层的神经元。
[0005]两个神经元之间的连接，就像生物大脑中的突触一样，可以将信号从一个神经元传输到另一个神经元。接收信号的神经元随后处理该信号，并可以向其它连接的神经元发出信号。在一些示例中，为了找到神经元的输出，通过从输入到神经元的连接的权重对神经元的输入进行加权，并对加权输入求和，以生成加权和。可以将偏差(bias)添加到加权和。进一步地，加权和随后通过激活函数，以生成输出。
[0006]国际标准化组织(ISO)和国际电工委员会(IE...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种在视频解码器处进行视频解码的方法，其特征在于，包括：接收与当前第一块相关联的一个或多个语法元素，所述当前第一块属于从图片划分出的多个第一块，所述一个或多个语法元素用于指示：最佳分区，所述最佳分区指示如何将所述当前第一块划分成用于帧内预测的多个第二块，一组块选择信号，其中所述当前第一块被重新划分成多个第三块，每个块选择信号对应于所述多个第三块中的一个，并且指示相应的第三块是使用第一编码方法还是第二编码方法编码的，以及一组压缩表示，每个压缩表示对应于所述多个第三块中的一个；以及基于所述一个或多个语法元素重建所述当前第一块，以生成重建的当前第一块。2.根据权利要求1所述的方法，其特征在于，所述重建包括：对于使用所述第一编码方法编码的每个第三块，基于神经解压缩神经网络NN生成重建的第三块，所述第一编码方法由所述一组块选择信号中的相应一个来指示，所述第三块的相应的压缩表示作为所述神经解压缩神经网络NN的输入；以及对于使用所述第二编码方法编码的每个第三块，基于残差神经解压缩神经网络NN生成残差第三块，所述第二编码方法由所述一组块选择信号中的相应一个来指示，所述第三块的相应的压缩表示作为所述残差神经解压缩神经网络NN的输入。3.根据权利要求2所述的方法，其特征在于，所述重建进一步包括：对于使用所述第二编码方法编码的每个第三块，基于相应的残差第三块和相应的预测的第三块生成重建的第三块。4.根据权利要求3所述的方法，其特征在于，所述重建进一步包括：对于使用所述第二编码方法编码的每个第三块，基于帧内预测神经网络NN执行帧内预测，以生成与所述相应的第三块对应的一组预测的第二块，多个先前重建的第一块和多个先前生成的重建的第三块作为所述帧内预测神经网络NN的输入。5.根据权利要求4所述的方法，其特征在于，与所述相应的第三块对应的所述一组预测的第二块形成所述相应的预测的第三块。6.根据权利要求5所述的方法，其特征在于，所述重建进一步包括：对于使用所述第二编码方法编码的每个第三块，使用所述最佳分区执行相应的帧内预测，所述最佳分区作为所述帧内预测神经网络NN的输入，并指示如何将所述当前第一块划分成用于帧内预测的多个第二块。7.根据权利要求2所述的方法，其特征在于，所述重建进一步包括：合并所述多个重建的第三块，以生成所述重建的当前第一块，所述多个重建的第三块与使用所述第一编码方法或所述第二编码方法编码的所述多个第三块相对应。8.一种在视频解码器处进行视频解码装置，其特征在于，包括电路，被配置为：接收与当前第一块相关联的一个或多个语法元素，所述当前第一块属于从图片划分出的多个第一块，所述一个或多个语法元素用于指示：最佳分区，所述最佳分区指示如何将所述当前第一块划分成用于帧内预测的多个第二块，一组块选择信号，其中所述当前第一块被重新划分成多个第三块，每个块选择信号对
应于所述多个第三块中的一个，并且指示相应的第三块是使用第一编码方法还是第二编码方法编码的，以及一组压缩表示，每个压缩表示对应于所述多个第三块中的一个；以及基于所述一个或多个语法元素重建所述当前第一块，以生成重建的当前第一块。9.根据权利要求8所述的装置，其特征在于，所述电路被进一步配置为：对于使用所述第一编码方法编码的每个第三块，基于神经解压缩神经网络NN生成重建的第三块，所述第一编码方法由所述一组块选择信号中的相应一个来指示，所述第三块的相应的压缩表示作为所述神经解压缩神经网络NN的输入；以及对于使用所述第二编码方法编码的每个第三块，基于残差神经解压缩神经网络NN生成残差第三块，所述第二编码方法由所述一组块选择信号中的相应一个来指示，所述第三块的相应的压缩表示作为所述残差神经解压缩神...

【专利技术属性】
技术研发人员：蒋薇，王炜，丁鼎，刘杉，许晓中，
申请(专利权)人：腾讯美国有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人