【技术实现步骤摘要】
【国外来华专利技术】使用细分缩放和深度上缩放的图像生成
技术介绍
本说明书涉及使用神经网络生成图像。神经网络是机器学习模型,其采用一层或多层非线性单元来预测针对接收到的输入的输出。一些神经网络除了输出层外还包括一个或多个隐藏层。每个隐藏层的输出用作所述网络中的下一层(即,下一个隐藏层或输出层)的输入。所述网络的每一层根据相应的参数集的当前值从所接收的输入生成输出。
技术实现思路
本说明书描述了一种系统,该系统被实现为在一个或多个位置的一个或多个计算机上的计算机程序,其使用生成性神经网络生成图像。在一些实现方式中,系统实现细分缩放。特别地,系统通过将输出图像的H乘W像素网格分割成K个不相交的交错子图像来生成HxWxCxD输出图像(其中H和W分别是图像的以像素数为单位的高度和宽度;C是通道数,例如3,并且D是每个通道中的位数),其中K是小于H的整数。子图像被称为交错的是因为一个子图像内的像素通常通过另一子图像中的像素与同一子图像内的其他像素分开。例如,如果存在4个子图像,则沿着水平尺寸的每一第4个像素将在同一子图像中并且沿着垂直尺寸的每一第4个像素将在同一子图像中。系统然后使用生成性神经网络即遵循子图像的排序例如光栅扫描排序来逐子图像地生成输出图像。在一些实现方式中,作为细分缩放的补充或替代,系统还实现深度上缩放(诸如例如由相机捕获的真实世界的图像的深度上缩放)。特别地,当生成包括N位强度值的图像时,系统首先生成具有b位强度值(其中b小于N)的初始输出图像,然后以该初始输出图像为条件生成每个强度值的剩余N-b位。为了生成初始输 ...
【技术保护点】
1.一种生成具有被布置在H乘W像素网格中的多个像素的输出图像的方法,其中每个像素包括根据颜色通道次序排序的一个或多个颜色通道中的每一个的相应的强度值,并且其中所述方法包括:/n获得数据,所述数据指定(i)将所述H乘W像素网格分割成K个不相交的交错子图像,其中K是小于H的整数,和(ii)所述子图像的排序;和/n根据所述子图像的排序逐个子图像地生成强度值,包括:/n对于每个特定子图像中的每个特定像素的每个特定颜色通道,使用生成性神经网络,以针对下述各项的强度值为条件来生成所述特定颜色通道的强度值:(i)在所述子图像的排序中在所述特定子图像之前的子图像中的任何像素;(ii)遍及所述输出图像按照光栅扫描次序在所述特定像素之前的所述特定子图像内的任何像素;以及(iii)按照所述颜色通道次序在所述特定颜色通道之前的任何颜色通道的所述特定像素。/n
【技术特征摘要】
【国外来华专利技术】20180927 US 62/737,8141.一种生成具有被布置在H乘W像素网格中的多个像素的输出图像的方法,其中每个像素包括根据颜色通道次序排序的一个或多个颜色通道中的每一个的相应的强度值,并且其中所述方法包括:
获得数据,所述数据指定(i)将所述H乘W像素网格分割成K个不相交的交错子图像,其中K是小于H的整数,和(ii)所述子图像的排序;和
根据所述子图像的排序逐个子图像地生成强度值,包括:
对于每个特定子图像中的每个特定像素的每个特定颜色通道,使用生成性神经网络,以针对下述各项的强度值为条件来生成所述特定颜色通道的强度值:(i)在所述子图像的排序中在所述特定子图像之前的子图像中的任何像素;(ii)遍及所述输出图像按照光栅扫描次序在所述特定像素之前的所述特定子图像内的任何像素;以及(iii)按照所述颜色通道次序在所述特定颜色通道之前的任何颜色通道的所述特定像素。
2.根据任意一项前述权利要求所述的方法,其中,对于每个特定子图像中的每个特定像素的每个特定颜色通道,所述特定颜色通道的所述强度值不是以针对以下各项的任何强度值为条件:(i)在所述子图像的排序中在所述特定子图像之后的子图像中的任何像素;(ii)遍及所述输出图像按照光栅扫描次序在所述特定像素之后的所述特定子图像内的任何像素;以及(iii)按照所述颜色通道次序在所述特定颜色通道之后的任何颜色通道的所述特定像素。
3.根据任意一项前述权利要求所述的方法,其中,基于所述输出图像中的每个子图像的左上角像素的位置,所述子图像的排序按照光栅扫描次序对所述子图像进行排序。
4.根据任意一项前述权利要求所述的方法,其中,生成所述强度值包括:
对于每个特定子图像:
使用嵌入神经网络来处理嵌入输入以生成编码子图像张量,所述嵌入输入包括针对在所述排序中在所述特定子图像之前的子图像已经生成的强度值;和
使用解码器神经网络,以所述编码子图像张量为条件来自回归地生成所述特定子图像中的所述像素的所述强度值。
5.根据权利要求4所述的方法,其中所述嵌入输入包括沿着深度尺寸级联的已经生成的子图像。
6.根据权利要求5所述的方法,其中,所述嵌入输入包括空白填补的子图像,以保留每个已经生成的子图像相对于所述特定子图像的排序。
7.根据权利要求4-6中任一项所述的方法,其中,所述嵌入输入包括指定所述特定子图像在所述排序中的方位的数据。
8.根据权利要求4-7中的任一项所述的方法,其中,所述嵌入神经网络是具有残差块的卷积神经网络。
9.根据权利要求4-8中任一项所述的方法,其中,所述解码器神经网络在所述特定子图像内按照光栅扫描次序生成所述特定子图像中的所述像素的强度值。
10.根据权利要求4-9中任一项所述的方法,其中,所述解码器神经网络以方位保留方式将所述编码子图像张量作为输入。
11.根据权利要求4-10中任一项所述的方法,其中,所述解码器对解码器输入进行处理,所述解码器输入包括所述编码子图像张量并且具有与所述子图像相同的空间尺寸。
12.根据权利要求4-11中任一项所述的方法,其中,所述解码器神经网络具有混合架构,所述混合架构组合掩蔽卷积和自我注意力。
13.根据前述权利要求中任一项所述的方法,进一步包括:获得调节输入,并且其中生成强度值包括:在所述调节输入上调节每个强度值。
14.根据权利要求13所述的方法,其中,所述调节输入包括较低分辨率的图像,并且其中生成强度值包括:将所述较低分辨率的图像设置为所述排序中的所述第一子图像。
15.根据权利要求13或14所述的方法,其中所述调节输入包括低位深度H乘W图像。
16.根据当从属于权利要求4-12中的任一项时的权利要求15所述的方法,其中生成所述强度值包括:将来自所述低位深度H乘W图像的子图像包括在用于所述编码器神经网络的所述嵌入输入中。
17.根据权利要求13-15所述的方法,其中,所述调节输入是表征所述输出图像的期望内容的调节张量,其中,所述生成性神经网络包括一个或多个卷积层,并且其中生成...
【专利技术属性】
技术研发人员:纳尔·埃默里赫·卡尔赫布伦纳,雅各布·李·米尼克,
申请(专利权)人:渊慧科技有限公司,
类型:发明
国别省市:英国;GB
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。