【技术实现步骤摘要】
一种基于行人掩模和多尺度判别的行人生成方法
本专利技术涉及图像生成
,具体涉及一种基于行人掩模和多尺度判别的行人生成方法。
技术介绍
图像处理的很多问题都是将一张输入的图片转变为一张对应的输出图片,比如灰度图、梯度图、彩色图之间的转换等。通常每一种问题都使用特定的算法如:使用CNN来解决图像转换问题时,要根据每个问题设定一个特定的损失函数来让CNN优化。这些方法的本质其实都是从像素到像素的映射。“翻译”常用于语言之间的翻译,就比如中文和英文的之间的翻译。但是图像翻译的意思是以不同形式在图与图之间转换。比如,一张场景可以转换为RGB全彩图,也可以转化成素描,也可以转化为灰度图。一张夜景图也可以转化为这个地方的日景图。常规的图像处理方法输出的行人图像较为不清晰,行人轮廓与背景边界较为模糊。
技术实现思路
针对上述技术问题,本专利技术提供了解决上述问题的一种基于行人掩模和多尺度判别的行人生成方法,利于生成具有特定掩模姿态的行人且生成图像更精细化,行人轮廓与背景边界更清晰。本专利技术通过下述技术方案 ...
【技术保护点】
1.一种基于行人掩模和多尺度判别的行人生成方法,其特征在于,包括以下步骤:/nS1.将包含行人掩模的原始信息输入到基于pix2pix网络结构的生成器中生成行人图像;/nS2.通过多个判别器均接收一组内容相同的图像,每个判别器接收的图像尺度大小不同,用于判别输入图像的真假,并通过损失函数将判别信息反馈给生成器,指导生成器生成行人图像,最终生成并输出具有掩模姿态特征的行人图像;/n所述判别器接收的一组图像包括输入生成器的行人掩模和生成器输出的行人图像。/n
【技术特征摘要】
1.一种基于行人掩模和多尺度判别的行人生成方法,其特征在于,包括以下步骤:
S1.将包含行人掩模的原始信息输入到基于pix2pix网络结构的生成器中生成行人图像;
S2.通过多个判别器均接收一组内容相同的图像,每个判别器接收的图像尺度大小不同,用于判别输入图像的真假,并通过损失函数将判别信息反馈给生成器,指导生成器生成行人图像,最终生成并输出具有掩模姿态特征的行人图像;
所述判别器接收的一组图像包括输入生成器的行人掩模和生成器输出的行人图像。
2.根据权利要求1所述的一种基于行人掩模和多尺度判别的行人生成方法,其特征在于,所述判别器包括多层卷积层,采用了基于图像块patch的判别方法,将图像切分为多个固定大小的patch输入进判别器进行判断。
3.根据权利要求1所述的一种基于行人掩模和多尺度判别的行人生成方法,其特征在于,所述多个判别器依次以倍数逐渐减小的下采样来创造多个不同尺度的图像金字塔,判别器分别对相应尺度的行人掩模和行人图像、进行判别。
4.根据权利要求1所述的一种基于行人掩模和多尺度判别的行人生成方法,其特征在于,所述生成器使用u-Net结构,包括编码器和解码器;
所述编码器以卷积的形式进行下采样对输入的原始信息进行编码;
所述解码器以反卷积的形式进行上采样还原生成图像;
在编码器和解码器中加入了跳转连接,将编码后的特征图和解码之后同样大小的特征图按通道连接在一起,用于补充输入图像的信息。
5.根据权利要求1所述的一种基于行人掩模和多尺度判别的行人生成方法,其特征在于,所述编码器包括多层卷积层,在卷积层后加入批归一化处理;所述解码器包括多层反卷积层。
6.根据权利要求1所述的一种基于行人掩模和多尺度判别的行人生成方法,其特征在于,输入到生成器的行人掩模大小为256*256。
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。