当前位置: 首页 > 专利查询>辉达公司专利>正文

使用一个或更多个神经网络进行视频合成制造技术

技术编号:42400233 阅读:22 留言:0更新日期:2024-08-16 16:22
本发明专利技术公开了使用一个或更多个神经网络进行视频合成,具体公开了用于合成一致的图像或视频的装置、系统和技术。在至少一个实施例中,一个或更多个神经网络被用于至少部分地基于一个或更多个第一图像的一个或更多个点云表示来生成一个或更多个第二图像。

【技术实现步骤摘要】

至少一个实施例涉及用于执行和促进人工智能的处理资源。例如,至少一个实施例涉及用于根据本文描述的各种新颖技术来训练神经网络的处理器或计算系统。


技术介绍

1、随着越来越多的媒体内容被数字化生成,并且随着用于呈现该内容的技术不断提高,存在相应的期望来改善该内容的质量。例如,机器学习可以用于基于所捕获的针对源三维世界的输入视频来生成照片级逼真的视频,例如可能涉及运动捕获技术。然而,先前在这种视频生成上的尝试是不一致的,使得所生成的视频的对象和元素的颜色和外观将随着时间以及通过相机和通过视角而变化,这降低了观看或以其他方式消费所生成内容的总体体验。


技术实现思路

1、本专利技术涉及一种处理器,其包括:一个或更多个电路,用于使用一个或更多个神经网络来至少部分地基于一个或更多个第一图像的一个或更多个点云表示生成一个或更多个第二图像。

【技术保护点】

1.一种处理器,包括:

2.根据权利要求1所述的处理器,其中所述一个或更多个电路进一步用于至少部分地基于分配给所述一个或更多个第一图像的相应像素的颜色,将颜色分配给所述一个或更多个点云表示或一个或更多个运动向量表示的一个或更多个部分。

3.根据权利要求2所述的处理器,其中所述一个或更多个第一图像和所述一个或更多个第二图像是使用图像编码器网络以及图像生成器网络生成的,所述图像编码器网络用于对所述一个或更多个第一图像的先前生成的图像进行编码,所述图像生成器网络用于至少部分地基于由所述图像编码器网络输出的所述一个或更多个第二图像的向量表示来生成所述一个或更多个第二图像的...

【技术特征摘要】

1.一种处理器,包括:

2.根据权利要求1所述的处理器,其中所述一个或更多个电路进一步用于至少部分地基于分配给所述一个或更多个第一图像的相应像素的颜色,将颜色分配给所述一个或更多个点云表示或一个或更多个运动向量表示的一个或更多个部分。

3.根据权利要求2所述的处理器,其中所述一个或更多个第一图像和所述一个或更多个第二图像是使用图像编码器网络以及图像生成器网络生成的,所述图像编码器网络用于对所述一个或更多个第一图像的先前生成的图像进行编码,所述图像生成器网络用于至少部分地基于由所述图像编码器网络输出的所述一个或更多个第二图像的向量表示来生成所述一个或更多个第二图像的下一个生成的图像。

4.根据权利要求3所述的处理器,其中所述图像生成器网络包括转换块和放大层的序列,所述转换块用于基于一个或更多个输入来生成图像,并且每个转换块包括转换层序列,所述序列中的至少一个转换层用于接收通过将所述一个或更多个点云表示投影到所述下一个生成的图像的下一个视角上而生成的引导图像作为输入。

5.根据权利要求4所述的处理器,其中所述转换层序列中的至少一个转换层用于接收由标签嵌入网络生成的一个或更多个样式嵌入作为输入,所述标签嵌入网络接收级联的语义数据作为输入,所述语义数据包括从一个或更多个输入图像确定的分段数据、深度数据、姿态数据或...

【专利技术属性】
技术研发人员:A·马尔雅王鼎鈞刘洺堉K·司巴乐
申请(专利权)人:辉达公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1