一种任意姿态行人图片生成方法技术

技术编号：19009563 阅读：181 留言：0更新日期：2018-09-22 09:22

本发明专利技术公开了一种基于生成对抗网络的任意姿态行人图片生成方法，仅通过将人物图片、图中行人的姿态以及目标迁移姿态的热力图输入生成器网络，即可得到前一位目标姿态的相同人物的图片。由于该方法的生成器中引入了姿态注意力机制，且采用了两个不同的判别器分别进行外貌一致性和姿态一致性的判别，使其能够应对图像变形、几何变换、视角转移等多种复杂情况。并且可以端到端训练。本发明专利技术提出的任意姿态的人物图片生成方法在现有技术思路的基础上进行了创新，采用新颖的结构进行网络模型搭建，相较于之前的方法，所合成的图片更加真实、自然，有很强的实际应用价值。

A method for generating arbitrary pose pedestrian pictures

The invention discloses a method for generating pedestrian pictures with arbitrary postures based on a generating antagonistic network. The method can obtain pictures of the same person with the previous target posture only by inputting the thermodynamic pictures of the person pictures, the pedestrian postures in the pictures and the moving postures of the objects into the generator network. Because of introducing Attitude Attention Mechanism into the generator of this method, and using two different discriminators to discriminate appearance consistency and attitude consistency respectively, it can deal with complex situations such as image deformation, geometric transformation, angle shift and so on. And you can end to end training. Based on the existing technical ideas, the method for generating images of characters with arbitrary postures is innovated and a novel structure is adopted to build a network model. Compared with the previous method, the synthesized images are more realistic and natural, and have a strong practical application value.

全部详细技术资料下载

【技术实现步骤摘要】
一种任意姿态行人图片生成方法
本专利技术属于计算机视觉
，更具体地，涉及一种任意姿态行人图片生成方法。
技术介绍
在计算机视觉领域中，可以生成看上去更为现实、自然的图片的算法变得越来越受欢迎，这得益于现实生活中对于高质量合成图像的需求变得越来越高。而人物姿态迁移又是一个在该领域中非常活跃的主题。基于人物的姿态迁移的任意姿态行人图片的生成方法具有很多有价值的应用，例如，将不同姿态的行人图片作为视频的某一帧，以此使用同一个人物的姿态图片序列来合成视频。又如，将任意姿态的人物图片生成方法作为数据扩增的一种手段，该手段在进行人物二次识别等任务中尤为有用。随着深度神经网络在计算机视觉中的广泛应用，近几年来，各种新颖的生成式网络结构，例如变分自编码网络和生成对抗网络在图像生成领域都取得了一定的成就。然而，生成高质量的任意姿态的行人图片是一个具有挑战性的任务：由于自然场景下的行人图片往往存在着姿态变形、几何变换以及观察视角的不确定性等因素的影响，使用以前的这些网络结构往往不能达到理想的效果。
技术实现思路
本专利技术的目的在于提供一种任意姿态行人图片生成方法，该图片生成方法使用姿态注意力迁移网络进行编码，再将图像特征编码送入解码器进行姿态迁移行人图片的生成，生成的行人图像平滑、自然，具有很高的质量。为实现上述目的，本专利技术在原有理论基础上进行创新，搭建一种全新的网络结构来解决行人图片的姿态迁移问题，提供了一种任意姿态行人图片生成方法，包括下述步骤：(1)训练任意姿态行人图片生成网络模型，包括如下子步骤：(1.1)对原始姿态行人图片数据集中所有行人的姿态进行评估，得到...

【技术保护点】
1.一种任意姿态行人图片生成方法，其特征在于，所述方法包括下述步骤：(1)训练任意姿态行人图片生成网络模型，包括如下子步骤：(1.1)对原始姿态行人图片数据集中所有行人的姿态进行评估，得到每个原始姿态行人图片对应的姿态热力图谱，由原始姿态行人图片以及原始姿态行人图片对应的姿态热力图谱构成标准训练数据集；(1.2)定义任意姿态行人图片生成网络模型，所述网络模型由生成器和判别器组成，其中生成器包括编码器和解码器，编码器由N层卷积神经网络和姿态注意力迁移网络组成，解码器由N层反卷积网络组成，用于完成对图像特征编码的上采样生成特定姿态图片；判别器由外貌一致性判别器和姿态一致性判别器组成，分别用于处理图像特征和姿态特征；(1.3)将标准训练数据集中的原始姿态行人图片以及原始姿态行人图片对应的姿态热力图谱输入生成器来生成姿态迁移行人图片，然后将生成的姿态迁移行人图片和标准训练数据集中的目标姿态行人图片分别作为“假图片”和“真图片”输入至多重判别器中，得到对应的一致性得分；设计相应的损失函数，通过对抗训练分别训练生成器和判别器，得到任意姿态行人图片生成网络模型；(2)利用上述训练好的网络模型对给定的...

【技术特征摘要】
1.一种任意姿态行人图片生成方法，其特征在于，所述方法包括下述步骤：(1)训练任意姿态行人图片生成网络模型，包括如下子步骤：(1.1)对原始姿态行人图片数据集中所有行人的姿态进行评估，得到每个原始姿态行人图片对应的姿态热力图谱，由原始姿态行人图片以及原始姿态行人图片对应的姿态热力图谱构成标准训练数据集；(1.2)定义任意姿态行人图片生成网络模型，所述网络模型由生成器和判别器组成，其中生成器包括编码器和解码器，编码器由N层卷积神经网络和姿态注意力迁移网络组成，解码器由N层反卷积网络组成，用于完成对图像特征编码的上采样生成特定姿态图片；判别器由外貌一致性判别器和姿态一致性判别器组成，分别用于处理图像特征和姿态特征；(1.3)将标准训练数据集中的原始姿态行人图片以及原始姿态行人图片对应的姿态热力图谱输入生成器来生成姿态迁移行人图片，然后将生成的姿态迁移行人图片和标准训练数据集中的目标姿态行人图片分别作为“假图片”和“真图片”输入至多重判别器中，得到对应的一致性得分；设计相应的损失函数，通过对抗训练分别训练生成器和判别器，得到任意姿态行人图片生成网络模型；(2)利用上述训练好的网络模型对给定的原始姿态行人图片进行目标姿态人物图片生成：向训练好的网络模型的生成器输入给定原始姿态行人图片以及该行人的姿态热力图谱，并输入目标姿态的热力图谱，生成器的输出即为合成的目标姿态行人图片。2.如权利要求1所述的任意姿态行人图片生成方法，其特征在于，所述步骤(1.2)中的编码器由N层卷积神经网络和姿态注意力迁移网络组成，姿态注意力迁移网络由完全相同的T个姿态注意力迁移模块连接成的序列组成；N层卷积神经网络用于将原始姿态行人图片Pc处理成图像特征图将原始姿态热力图谱Sc和目标姿态热力图谱St处理为姿态特征图之后的T个姿态注意力迁移模块引入姿态注意力机制，每一个姿态注意力迁移模块中都有两个由conv1-BN-ReLU-conv2-BN组成的小型神经网络convs用于分别处理图像特征和姿态特征。3.如权利要求1所述的任意姿态行人图片生成方法，其特征在于，在所述姿态注意力迁移模块中采用sigmoid函数转化姿态特征图中的值使其范围为0到1，由此得到了姿态注意力权重Wt。4.如权利要求1或2所述的任意姿态行人图片生成方法，其特征在于，所述步骤(1.2)中的判别器由两个部分组成：外貌一致性判别器和姿态一致性判别器，分别用于处理图像特征和姿态特征；两个判别器采用相同的网络结构：在下采样的2层卷积网络之后，后接3个残差模块，并不采用所有的dropout模块，将ReLu激活函数换成负数区域激活值值为0.2的LeakyReLu，最后后接softmax层，用于将得到的特征图谱转换为一致性得分。5.如权利要求1或2所述的任意姿态行人图片生成方法，其特征在于，所述步骤(1.3)中将标准训练数据集中的原始姿态行人图片以及原始姿态行人图片对应的原始姿态热力图谱输入生成器来生成姿态迁移行人图片，具体包括：将原始姿态行人图片Pc作为生成器的输入，经过N层卷积神经网络得到了行人图像特征图将原始姿态热力图谱Sc和目标姿态热力图谱St在深度的维度上进行串接得到新的特征图，将该特征图输入N层卷积层得到将上述特征图输入姿态注意力迁移网络，姿态注意力迁移网络将以上两个特征分别处理，该姿态注意力迁移网络由T个完全一样的姿态注意力迁移模块组成，在每个姿态注意力迁移模块中，先分别将和输入到由conv1-BN-ReLU-conv2-BN组成的小型卷积网络convs中，得到两个输出特征图以及将代表姿态信息的特征图经过sigmoid函数，使其值的范围为0到1，由此得到了姿态注意力权重Wt；将Wt和行人图像特征图进行点积操作，得到注意力机制进行局部增强之后的特征图，之后再...

【专利技术属性】
技术研发人员：白翔，朱臻，黄腾腾，石葆光，周漾，高宇哲，
申请(专利权)人：华中科技大学，
类型：发明
国别省市：湖北,42

全部详细技术资料下载我是这个专利的主人