【技术实现步骤摘要】
一种基于多尺度特征解耦的多层级细粒度图像生成方法
[0001]本专利技术属于计算机视觉与图像处理
,涉及一种图像生成方法,特别涉及一种基于多尺度特征解耦的多层级细粒度图像生成方法。
技术介绍
[0002]计算机视觉是指利用计算机及相关设备对生物视觉进行模拟,从而像人类一样通过视觉观察进而理解世界。常见的计算机视觉应用领域包括图像分类、语义分割、目标检测、图像生成、面部识别等。由于在现实条件下,通过图像采集工具采集到的图像与人们的要求是有一定差距的,为了获得更多细节丰富、内容全面的有价值图像,人们希望可以利用机器进行创作,因此图像生成领域成为了一个具有重大研究价值的课题。
[0003]图像生成技术的研究最早可以追溯到20世纪80年代。早期计算机的运算能力有限,因此算法模型主要依赖于手工设计的特征,比如利用马尔科夫随机场、KL变换等技术进行图像生成。但是这些方法只有在目标图像简单、形状规则时才会有比较好的效果,当目标图像的背景和前景过于复杂且他们之间有较大的差异时,这些传统的图像生成方法就不是很有效了。随着梯度方向 ...
【技术保护点】
【技术特征摘要】
1.一种基于多尺度特征解耦的多层级细粒度图像生成方法,其特征在于,包括如下步骤:步骤1,对公开数据集图像进行预处理操作;步骤2,确定图像的层次划分,构建多尺度特征解耦网络,提取图像背景以及图像前景的形状和外观的多尺度特征,将真实图像映射到隐变量空间;步骤3,构建多层级生成对抗网络,将步骤2提取的特征编码作为多层级生成对抗网络的输入数据;步骤4,设计多尺度特征融合机制,将多尺度特征解耦网络得到的中间层特征图与多层级生成对抗网络中对应尺度的特征图进行跳跃连接,实现多尺度特征融合;步骤5,设计损失函数并设置参数,训练多尺度特征解耦网络和多层级生成对抗网络,得到训练好的细粒度图像生成模型,保存模型结构和参数;步骤6,将真实图像输入训练好的细粒度图像生成模型,生成丰富多彩的细粒度图像。2.根据权利要求1所述基于多尺度特征解耦的多层级细粒度图像生成方法,其特征在于,所述步骤1中,数据集图像表示为X={x1,x2,
…
,x
N
},对数据集图像进行预处理具体包括随机裁剪、缩放和翻转操作,实现对数据样本的扩充。3.根据权利要求1所述基于多尺度特征解耦的多层级细粒度图像生成方法,其特征在于,所述步骤2中,将一张图像首先分为背景和前景两层,然后再将前景分成形状和外观,即图像最终分为背景以及前景的形状和外观三个层次。4.根据权利要求1所述基于多尺度特征解耦的多层级细粒度图像生成方法,其特征在于,所述多尺度特征解耦网络,由三个编码器构成,分别为背景编码器、形状编码器和外观编码器,各编码器根据真实图像分别提取背景以及前景的形状和外观的浅层与深层特征,输入到多层级生成对抗网络中,实现多尺度特征解耦和融合。5.根据权利要求4所述基于多尺度特征解耦的多层级细粒度图像生成方法,其特征在于,所述三个编码器均由依次连接的卷积层、Batch Normalization层和LeakyReLU激活函数层构成。6.根据权利要求1所述基于多尺度特征解耦的多层级细粒度图像生成方法,其特征在于,所述多层级生成对抗网络由背景层、形状层和外观层构成,每一层包含一个生成对抗网络;所述背景层由背景编码作为输入,输出一张背景图像,所述背景图像不包含任何前景信息,为后续的形状层和外观层生成的前景提供一个拼接的模板;所述形状层以形状编码作为输入,输出一张只含前景形状的图像;所述外观层以外观编码与形状特征拼接后的向量作为输入,输出的图像在前景形状的基础上填充了前景的外观,包含颜色细节和纹理细节;将三层输出的结果拼接后即得到完整的细粒度图像。7.根据权利要求1或6所述基于多尺度特征解耦的多层级细粒度图像生成方法,其特征在于,所述生成对抗网络由生成器和判别器构成,生成器的输入为特征编码,网络结构包含多个依次连接的上采样层、卷积层、Batch Normal...
【专利技术属性】
技术研发人员:杜友田,沈逸如,陈中奇,陈思源,张新明,
申请(专利权)人:西安交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。