当前位置: 首页 > 专利查询>辉达公司专利>正文

使用一个或更多个神经网络生成图像制造技术

技术编号:33809885 阅读:10 留言:0更新日期:2022-06-16 10:19
介绍了用于生成图像或视频内容的装置、系统和技术。在至少一个实施例中,一个或更多个神经网络用于至少部分地基于第一对象的一个或更多个图像来生成第二对象的一个或更多个时间推移图像。时间推移图像。时间推移图像。

【技术实现步骤摘要】
【国外来华专利技术】使用一个或更多个神经网络生成图像
[0001]相关申请的交叉引用
[0002]这是2020年7月8日提交的美国专利申请第16/923,227号的PCT申请。该申请的公开内容出于所有目的通过引用全文并入本文。


[0003]至少一个实施例涉及用于执行和促进人工智能的处理资源。例如,至少一个实施例涉及用于根据本文描述的各种新颖技术来训练神经网络的处理器或计算系统。

技术介绍

[0004]越来越多的内容以数字方式生成,从电影和游戏内容到发布到社交媒体的内容或个人照片。在创建图像时,用户可能希望该图像看起来好像是在特定时代或时间点捕获的。在某些情况下,用户可能能够应用过滤器以使图像看起来像是来自不同的时间点,但这些过滤器不会导致该图像中表示的对象属于适合时期的类型。
附图说明
[0005]将参考附图描述根据本公开的各个实施例,其中:
[0006]图1A、图1B、图1C和图1D示出了根据至少一个实施例的图像;
[0007]图2示出了根据至少一个实施例的内容生成系统;
[0008]图3示出了根据至少一个实施例的图像生成器的组件;
[0009]图4示出了根据至少一个实施例的用于生成具有一个或更多个对象的时间适当外观的图像的过程;
[0010]图5示出了根据至少一个实施例的用于生成时间推移图像的过程;
[0011]图6A示出了根据至少一个实施例的推理和/或训练逻辑;
[0012]图6B示出了根据至少一个实施例的推理和/或训练逻辑;
[0013]图7示出了根据至少一个实施例的示例数据中心系统;
[0014]图8示出了根据至少一个实施例的计算机系统;
[0015]图9示出了根据至少一个实施例的计算机系统;
[0016]图10示出了根据至少一个实施例的计算机系统;
[0017]图11示出了根据至少一个实施例的计算机系统;
[0018]图12A示出了根据至少一个实施例的计算机系统;
[0019]图12B示出了根据至少一个实施例的计算机系统;
[0020]图12C示出了根据至少一个实施例的计算机系统;
[0021]图12D示出了根据至少一个实施例的计算机系统;
[0022]图12E和图12F示出了根据至少一个实施例的共享编程模型;
[0023]图13示出了根据至少一个实施例的示例性集成电路和相关联的图形处理器;
[0024]图14A

14B示出了根据至少一个实施例的示例性集成电路和相关联的图形处理
器;
[0025]图15A

15B示出了根据至少一个实施例的附加的示例性图形处理器逻辑;
[0026]图16示出了根据至少一个实施例的计算机系统;
[0027]图17A示出了根据至少一个实施例的并行处理器;
[0028]图17B示出了根据至少一个实施例的分区单元;
[0029]图17C示出了根据至少一个实施例的处理集群;
[0030]图17D示出了根据至少一个实施例的图形多处理器;
[0031]图18示出了根据至少一个实施例的多图形处理单元(GPU)系统;
[0032]图19示出了根据至少一个实施例的图形处理器;
[0033]图20示出了根据至少一个实施例的处理器的微架构;
[0034]图21示出了根据至少一个实施例的深度学习应用处理器;
[0035]图22示出了根据至少一个实施例的示例神经形态处理器;
[0036]图23和图24示出了根据至少一个实施例的图形处理器的至少部分;
[0037]图25示出了根据至少一个实施例的图形处理器核心的至少部分;
[0038]图26A

26B示出了根据至少一个实施例的图形处理器核心的至少部分;
[0039]图27示出了根据至少一个实施例的并行处理单元(“PPU”);
[0040]图28示出了根据至少一个实施例的通用处理集群(“GPC”);
[0041]图29示出了根据至少一个实施例的并行处理单元(“PPU”)的存储器分区单元;
[0042]图30示出了根据至少一个实施例的流式多处理器;
[0043]图31是根据至少一个实施例的用于高级计算管线的示例数据流程图;
[0044]图32是根据至少一个实施例的用于在高级计算管线中训练、适配、实例化和部署机器学习模型的示例系统的系统图;
[0045]图33A示出了根据至少一个实施例的用于训练机器学习模型的过程的数据流程图;以及
[0046]图33B是根据至少一个实施例的用于利用预训练的注释模型来增强注释工具的客户端

服务器架构的示例图示。
具体实施方式
[0047]在至少一个实施例中,用户可以捕获或获得包括一个或更多个对象的图像,例如图1A的图像100中表示的电视102和计算机104。在至少一个实施例中,该用户可能想要获得该图像的版本,该版本看起来好像是在不同时代或时间段中捕获的。在至少一个实施例中,这可以包括获得如图1B中所示的图像110,其中表示了电视112和计算机114,并且这些表示适用于指定的时间段或时代,在对应于1960年代的该图像中。在至少一个实施例中,可以看出,这些对象属于同一类对象,但是是适合时期的不同对象。在至少一个实施例中,这可以包括由带盘运行的房间大小的计算机,以及在打算放置在地板上的大型外壳中的控制台电视。在至少一个实施例中,可以生成另一图像120,其包括这些对象在1980年代的表示,包括在较小外壳中的电视122和可以设置在家具上的台式计算机124。在至少一个实施例中,这些图像可以至少部分地通过学习这些对象类别随时间的变化或模式来生成。在至少一个实施例中,这可以包括图1A至1C中所示的学习模式,随着时间的推移,电视屏幕的尺寸和分辨
率普遍增加,但电视屏幕的外壳尺寸变得更小更时尚。在至少一个实施例中,还说明了一种模式,即计算机在设计上也变得更小更时尚。在至少一个实施例中,这些模式可以用于生成如图1D所示的图像130,其包括这些对象在未来时间点的表示,例如在2030年。在至少一个实施例中,这些模式可以用于说明电视132和计算机134的潜在未来设计,其中各种形状因数的模式被应用。在至少一个实施例中,可以看出朝向更时尚和更简约设计的模式导致电视机132本质上是没有外壳或其他可用组件的透明屏幕,并且计算机134也可能仅显示为具有仍然使该设备有用的尺寸。在至少一个实施例中,可以看出在这些图像中呈现了来自诸如“计算机”类别的不同对象,而不仅仅是对输入图像100中的笔记本电脑104的外观修改。在至少一个实施例中,这种方法帮助这些其他图像110、120中的至少一些看起来逼真,因为即使是看起来很旧的笔记本电脑至少在1960年代也不存在,因此类别等级的视图可以提供更高的逼真度。
[0048]在至少一个实施例中,可以将一个或更多个约本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种处理器,包括:一个或更多个电路,用于使用一个或更多个神经网络至少部分地基于第一对象的一个或更多个图像来生成第二对象的一个或更多个时间推移图像。2.根据权利要求1所述的处理器,其中所述一个或更多个神经网络包括卷积神经网络(CNN)以从所述第一对象的所述一个或更多个图像中提取所述第一对象的特征,其中所述特征被转换为遵循模式的一个或更多个特征向量。3.根据权利要求2所述的处理器,其中所述一个或更多个神经网络包括一个或更多个变分自动编码器(VAE)以将所述第一对象的所述特征编码到潜在空间以在生成所述一个或更多个时间推移图像中作为约束。4.根据权利要求3所述的处理器,其中所述一个或更多个神经网络包括门控网络以从一组VAE中选择所述一个或更多个VAE,每个VAE针对不同类别的对象进行训练,所述门控网络使用分层的专家混合方法来选择所述一个或更多个VAE。5.根据权利要求3所述的处理器,其中所述一个或更多个神经网络包括生成网络以生成所述第二对象的所述一个或更多个时间推移图像,所述第二类对象属于与所述第一对象相同的对象类别,所述第二对象的所述一个或更多个时间推移图像具有适合于与所述一个或更多个时间推移图像相对应的一个或更多个时间点或时间段的外观。6.根据权利要求1所述的处理器,其中与所述一个或更多个时间推移图像相对应的一个或更多个时间或时间段是使用一个或更多个时间向量确定的,每个时间向量包括时间偏移的幅度和时间上前进或倒退的方向。7.一种系统,包括:一个或更多个处理器,用于使用一个或更多个神经网络至少部分地基于第一对象的一个或更多个图像来生成第二对象的一个或更多个时间推移图像。8.根据权利要求7所述的系统,其中所述一个或更多个神经网络包括卷积神经网络(CNN)以从所述第一对象的所述一个或更多个图像中提取所述第一对象的特征,其中所述特征被转换为遵循模式的一个或更多个特征向量。9.根据权利要求8所述的系统,其中所述一个或更多个神经网络包括一个或更多个变分自动编码器(VAE)以将所述第一对象的所述特征编码到潜在空间以在生成所述一个或更多个时间推移图像中作为约束。10.根据权利要求9所述的系统,其中所述一个或更多个神经网络包括门控网络以从一组VAE中选择一个或更多个VAE,每个VAE针对不同类别的对象进行训练,所述门控网络使用分层的专家混合方法来选择所述一个或更多个VAE。11.根据权利要求9所述的系统,其中所述一个或更多个神经网络包括生成网络以生成所述第二对象的所述一个或更多个时间推移图像,所述第二类对象属于与所述第一对象相同的对象类别,所述第二对象的所述一个或更多个时间推移图像具有适合于与所述一个或更多个时间推移图像相对应的一个或更多个时间点或时间段的外观。12.根据权利要求7所述的系统,其中与所述一个或更多个时间推移图像相对应的一个或更多个时间或时间段是使用一个或更多个时间向量确定的,每个时间向量包括时间偏移的幅度和时间上前进或倒退的方向。13.一种方法,包括:
使用一个或更多个神经网络至少部分地基于第一对象的一个或更多个图像来生成第二对象的一个或更多个时间推移图像。14.根据权利要求13所述的方法,其中所述一个或更多个神经网络包括卷积神经网络(CNN)以从所述第一对象的所述一个或更多个图像中提取所述第一对象的特征,其中所述特征被转换为遵循模式的一个或更多个特征向量。15.根据权利要求14所述的方法,其中所述一个或更多个神经网络包括一个或更多个变分自动编码器(VAE)以将所述第一对象的所述特征编码到潜在空间以在生成所述一个或更多个时间推移图像中作为约束。16.根据权利要求15所述的方法,其中所述一个或更多个神经网络包括门控网络以从一组VAE中选择一个或更多个VAE,每个VAE针对不同类别的对象进行训练,所述门控网络使用分层的专家混合方法来选择所述一个或更多个VAE。...

【专利技术属性】
技术研发人员:S
申请(专利权)人:辉达公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1