【技术实现步骤摘要】
【国外来华专利技术】使用一个或更多个神经网络的图像生成
[0001]相关申请的交叉引用
[0002]本申请是于2020年8月31日提交的第17/007,079号美国专利申请的PCT申请。该申请的公开内容通过全文引用并入本文以用于所有目的。
[0003]至少一个实施例涉及用于执行和促进人工智能的处理资源。例如,至少一个实施例涉及用于根据本文描述的各种新颖技术来训练神经网络的处理器或计算系统。
技术介绍
[0004]主要使用数字成像来捕获或生成图像和视频内容。数字图像或视频数据的优点是,与基于胶卷的成像相比,它更易于编辑或处理。然而,在许多情况下,编辑或处理数字图像内容仍然需要大量的手动操作才能产生既满足预期目标又具有视觉吸引力或真实的结果。例如,各种图像增强技术是不够好的,因为它们不能以受约束的方式自动修改图像中的特定对象,并且没有考虑这些对象之间的关系以保持一致性。
附图说明
[0005]将参照附图描述根据本公开的各个实施例,在附图中:
[0006]图1A、图1B、图1C和图1D示出了根据至少一个实施例的输入和输出图像;
[0007]图2示出了根据至少一个实施例的用于生成图像或视频内容的设备;
[0008]图3示出了根据至少一个实施例的图像增强模块;
[0009]图4示出了根据至少一个实施例的用于生成增强图像的过程;
[0010]图5示出了根据至少一个实施例的用于修改图像中的一个或多个对象的过程;
[0011]图6A示出了根据至少一个实施例的推理和/或训练逻 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种处理器,包括:一个或更多个电路,用于使用一个或更多个神经网络以至少部分地基于要对图像中的一个或更多个第二对象进行的修改来修改所述图像中的一个或更多个第一对象。2.根据权利要求1所述的处理器,其中所述一个或更多个电路进一步用于使用所述一个或更多个神经网络以在确定修改所述一个或更多个第一对象之前进一步确定所述一个或更多个第一对象和所述一个或更多个第二对象之间的至少一种关系,所述至少一种关系包括逻辑关系或物理关系中的至少一者。3.根据权利要求2所述的处理器,其中所述一个或更多个电路进一步用于使用所述神经网络来识别所述图像中对象的特征、位置、和状态信息,所述对象包括所述一个或更多个第一对象和所述一个或更多个第二对象,并且其中所述一个或更多个神经网络包括多个变分自动编码器(VAE),所述多个变分自动编码器被训练以将所述特征、位置、状态信息和至少一种关系编码到隐空间中。4.根据权利要求3所述的处理器,其中所述一个或更多个神经网络包括生成式对抗网络(GAN),所述生成式对抗网络用于基于所述图像的图像内容来生成输出图像,并且使用所述隐空间作为约束以使得所述输出图像包括对所述一个或更多个第一对象和所述一个或更多个第二对象的所述修改。5.根据权利要求1所述的处理器,其中所述一个或更多个电路进一步用于使用所述神经网络以在对所述一个或更多个第一对象和所述一个或更多个第二对象进行修改后检测所述图像中的一个或更多个异常,并且使得所述图像被重新生成以尝试去除所述一个或更多个异常。6.根据权利要求1所述的处理器,其中要对所述一个或更多个第二对象进行的所述修改包括对对象位置、方向或状态中的至少一者的修改,并且其中所述修改至少部分地基于输入参考图像来确定,所述输入参考图像包括与所述一个或更多个第二对象类似的至少一个对象分类中的至少一个对象。7.一种系统,包括:一个或更多个处理器,用于使用一个或更多个神经网络以至少部分地基于要对图像中的一个或更多个第二对象进行的修改来修改所述图像中的一个或更多个第一对象。8.根据权利要求7所述的系统,其中所述一个或更多个处理器进一步用于使用所述一个或更多个神经网络以在确定修改所述一个或更多个第一对象之前进一步确定所述一个或更多个第一对象和所述一个或更多个第二对象之间的至少一种关系,所述至少一种关系包括逻辑关系或物理关系中的至少一者。9.根据权利要求8所述的系统,其中所述一个或更多个处理器进一步用于使用所述神经网络来识别所述图像中对象的特征、位置和状态信息,所述对象包括所述一个或更多个第一对象和所述一个或更多个第二对象,并且其中所述一个或更多个神经网络包括多个变分自动编码器(VAE),所述多个变分自动编码器被训练以将所述特征、位置、状态信息和至少一种关系编码到隐空间中。10.根据权利要求9所述的系统,其中所述一个或更多个神经网络包括生成式对抗网络(GAN),所述生成式对抗网络用于基于所述图像的图像内容来生成输出图像,并且使用所述隐空间作为约束以使得所述输出图像包括对所述一个或更多个第一对象和所述一个或更
多个第二对象的所述修改。11.根据权利要求7所述的系统,其中所述一个或更多个处理器进一步用于使用所述神经网络以在对所述一个或更多个第一对象和所述一个或更多个第二对象进行修改后检测所述图像中的一个或更多个异常,并且使得所述图像被重新生成以尝试去除所述一个或更多个异常。12.根据权利要求7所述的系统,其中要对所述一个或更多个第二对象进行的所述修改包括对对象位置、方向或状态中的至少一者的修改,并且其中所述修改至少部分地基于输入参考图像来确定,所述输入参考图像包括与所述一个或更多个第二对象类似的至少一个对象分类中的至少一个对象。13.一种方法,包括:使用一个或更多个神经网络以至少部分地基于要对图像中的一个或更多个第二对象进行的修改来修改所述图像中的一个或更多个第一对象。14.根据权利要求13所述的方法,进一步包括:在确定修改所述一个或更多个第一对象之前,确定所述一个或更多个第一对象和所述一个或更多个第二对象之间的至少一种关系,所述至少一种关系包括逻辑关系或物理关系中的至少一者。15.根据权利要求14所述的方法,进一步包括:识别所述图像中的对象的特征、位置、和状态信息,所述对象包括所述一个或更多个第一对象和所述一个或更多个第二对象,并且其中所述一个或更多个神经网络包括多个变分自动编码器(VAE),所述多个变分自动编码器被训练以将所述特征、位置、状态信息和至少一种关系编码到隐空间中。16.根据权利要求15所述的方法,其中所述一个或更多个神经网络包括生成式对抗网络(GAN),所述生成式对抗网络用于基于所述图像的图像内容来生成输出图像,并且使用所述隐空间...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。