使用深度生成性模型的视频压缩制造技术

技术编号:41795009 阅读:16 留言:0更新日期:2024-06-24 20:19
本公开的某些方面涉及用于使用深度生成性模型来压缩视频内容的方法和装置。一种示例方法一般包括:接收供压缩的视频内容。所接收的视频内容一般通过可由第一人工神经网络实现的编码器被编码到隐性码空间中。经编码视频内容的经压缩版本一般通过可由第二人工神经网络实现的经训练概率性模型来生成并输出以供传输。

【技术实现步骤摘要】


技术介绍


技术实现思路

【技术保护点】

1.一种用于压缩视频的方法,包括:

2.如权利要求1所述的方法,其中,与所接收的视频内容有关的所述信息包括指示要在压缩所接收的视频内容的在语义上不同的区域时使用的有损压缩量的内容掩码。

3.如权利要求2所述的方法,其中,所述内容掩码包括区分基于机器学习模型生成的第一分段和第二分段的二元掩码,所述机器学习模型是基于在多个训练视频中标识的前景内容和背景内容来训练的。

4.如权利要求3所述的方法,其中,将所接收的视频内容编码到所述隐性码空间中包括:

5.如权利要求2所述的方法,进一步包括:使用递归卷积神经网络来生成所述内容掩码,其中所述内容掩码区...

【技术特征摘要】

1.一种用于压缩视频的方法,包括:

2.如权利要求1所述的方法,其中,与所接收的视频内容有关的所述信息包括指示要在压缩所接收的视频内容的在语义上不同的区域时使用的有损压缩量的内容掩码。

3.如权利要求2所述的方法,其中,所述内容掩码包括区分基于机器学习模型生成的第一分段和第二分段的二元掩码,所述机器学习模型是基于在多个训练视频中标识的前景内容和背景内容来训练的。

4.如权利要求3所述的方法,其中,将所接收的视频内容编码到所述隐性码空间中包括:

5.如权利要求2所述的方法,进一步包括:使用递归卷积神经网络来生成所述内容掩码,其中所述内容掩码区分所接收的视频内容中至少在语义上不同的内容。

6.如权利要求5所述的方法,进一步包括:基于通过掩码递归卷积神经网络对所接收的视频内容进行处理来生成标识所接收的视频内容中在语义上不同的内容的信息。

7.如权利要求1所述的方法,其中,与所接收的视频内容有关的所述信息包括来自从中捕获所述视频内容的固定环境的数据。

8.如权利要求7所述的方法,其中:

9.如权利要求8所述的方法,其中,在所述固定环境内捕获的所述多个视频剪辑包括由位于固定位置中的相机捕获的固定周围场景的视频剪辑。

10.如权利要求8所述的方法,其中,在所述固定环境内捕获的所述多个视频剪辑包括从移动平台上的固定有利位置捕获的视频剪辑。

11.如权利要求1所述的方法,其中:

12.如权利要求11所述的方法,其中,所述一个或多个附加数据通道包括一个或多个色彩通道并包括深度信息通道。

13.如权利要求11所述的方法,其中,所述一个或多个附加数据通道包括捕获可见波长范围内的数据的一个或多个通道以及捕获所述可见波长范围之外的数据的一个或多个通道。

14.如权利要求11所述的方法,其中,所述视频内容包括从不同角度捕获的主体的视频,其中所述视频是由所述第一相机和一个或多个第二相机捕获的。

15.如权利要求1所述的方法,其中,所述概率性模型包括四维张量上的概率分布的自回归模型,所述概率分布说明不同码能够被用于压缩所述经编码视频内容的似然性。

16.如权利要求15所述的方法,其中...

【专利技术属性】
技术研发人员:A·哈比比安T·J·范罗森达尔T·S·科恩
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1