在视频编解码中使用神经网络滤波制造技术

技术编号：33197897 阅读：14 留言：0更新日期：2022-04-24 00:27

描述了在视频编解码中使用神经网络滤波。还描述了用于媒体处理的方法、系统、装置。数字媒体处理的一种示例方法包括针对视觉媒体数据与视觉媒体数据的比特流之间的转换，根据规则确定如何将一个或多个卷积神经网络滤波器应用于视觉媒体数据的视频单元的至少一些样点，以及基于该确定执行转换。以及基于该确定执行转换。以及基于该确定执行转换。

全部详细技术资料下载

【技术实现步骤摘要】
在视频编解码中使用神经网络滤波
[0001]相关申请的交叉引用
[0002]根据适用的《专利法》和/或符合《巴黎公约》的规定，本申请及时要求于2020年10月02日提交的美国临时专利申请第63/087,113号的优先权和权益。出于法律规定的所有目的，将上述申请的全部公开内容以引用方式并入作为本申请的公开的一部分。

[0003]本专利文件涉及数字媒体编解码和解码。

技术介绍

[0004]数字视频占互联网和其他数字通信网络上最大的带宽使用。随着能够接收和显示视频的连接用户设备数量的增加，预计对数字视频使用的带宽需求将继续增长。

技术实现思路

[0005]本文件公开了可由图像、音频或视频编码器和解码器使用以确保编码操作、解码操作和编码的数字媒体片段的完整性的技术。
[0006]在一个示例方面，公开了一种处理视觉媒体数据的方法。该方法包括针对视觉媒体数据和视觉媒体数据的比特流之间的转换，根据规则确定如何将一个或多个卷积神经网络滤波器应用于视觉媒体数据的视频单元的至少一些样点；以及基于该确定执行转换。
[0007]在另一个示例方面，公开了一种视频处理装置。该视频处理装置包括被配置为实现上述方法的处理器。
[0008]在又一个示例方面，公开了一种将视觉媒体数据存储到包括一个或多个比特流的文件的方法。该方法对应于上述方法并且还包括将一个或多个比特流存储到非暂时性计算机可读记录介质。
[0009]在又一个示例方面，公开了一种存储比特流的计算机可读介质。该比特流是根据上述...

【技术保护点】

【技术特征摘要】
1.一种处理视觉媒体数据的方法，包括：针对视觉媒体数据和所述视觉媒体数据的比特流之间的转换，根据规则确定如何将一个或多个卷积神经网络滤波器应用于所述视觉媒体数据的视频单元的至少一些样点；以及基于所述确定执行所述转换。2.根据权利要求1所述的方法，其中，使用卷积神经网络来实现所述卷积神经网络滤波器。3.根据权利要求1所述的方法，其中，所述规则指定所述确定基于与所述视频单元相关联的解码的信息，其中所述解码的信息包括预测模式、变换类型、跳过标志或编解码块标志(CBF)值中的至少一个。4.根据权利要求1所述的方法，其中，所述规则指定以小于所述视频单元的粒度控制与所述一个或多个卷积神经网络滤波器相关的信息。5.根据权利要求4所述的方法，其中，所述视频单元是条带或图片或片或子图片或编解码树块或编解码树单元。6.根据权利要求4所述的方法，其中，在样点或像素级别控制所述信息。7.根据权利要求4所述的方法，其中，在行、列或线级别控制所述信息。8.根据权利要求4所述的方法，其中，所述规则指定卷积神经网络滤波器集合是基于所述视觉媒体数据的视频单元内的样点的值或位置来确定的。9.根据权利要求1所述的方法，其中，所述规则指定卷积神经网络滤波器集合的选择取决于所述视频单元的时域层标识和/或所述视频单元的图片组(GOP)大小。10.根据权利要求9所述...

【专利技术属性】
技术研发人员：李跃，张莉，张凯，
申请(专利权)人：脸萌有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人