基于生成对抗网络的行人重识别检测方法技术

技术编号：21454575 阅读：23 留言：0更新日期：2019-06-26 04:58

本发明专利技术提供基于生成对抗网络的行人重识别检测方法，旨在快速并准确在视频监控中每一帧中的不同行人里检索到特定目标，提高视频监控中行人重识别检测精度。首先使用triple loss函数训练编码器网络，使得相同身份的行人类内距离减小，不同身份的行人类间距离增大；其次利用GAN网络的博弈对抗思维联合训练身份判别网络，引导身份判别网络的判别能力，再进一步联合训练编码器网络，更新编码器网络参数，使得编码器网络对于行人有更好的编码能力；将检测模型YOLO‑V3与本发明专利技术模型统一到一个框架完成端到端的目标检索。本发明专利技术致力于平衡行人重识别检测识别率和实时性，并将行人检测与行人重识别统一到一个框架，完成视频序列中特定目标检索。

全部详细技术资料下载

【技术实现步骤摘要】
基于生成对抗网络的行人重识别检测方法
本专利技术属于图像视觉领域。尤指特定目标行人检测及定位。
技术介绍
行人重新识别是一项具有挑战性的任务，其目的是在多个摄像机上匹配具有相同身份的行人图像。随着深度学习方法的广泛使用，行人重识别性能迅速提高。由于不同尺度、距离和姿势的影响，在无约束的自然环境中背景的复杂性，场景中光照的变化、大气状况的变化以及天气等的影响会对检测目标造成严重干扰，检测出不同空间尺度的特定目标物体就更加具有挑战性。行人重识别在公安嫌疑人检索、交通管制、以及军事侦察、战场监视等诸多领域有着广阔的应用前景。面向视频监控的行人重识别研究是最活跃的研究领域之一。生成式对抗网络(GAN,GenerativeAdversarialNetworks)是一种深度学习模型，是近年来复杂分布上无监督学习最具前景的方法之一。模型通过框架中两个模块：生成模型(GenerativeModel)和判别模型(DiscriminativeModel)的互相博弈学习产生相当好的输出。利用GAN网络中博弈对抗的思维，联合训练编码器模型可以引导编码器网络模型更好编码目标特征；将GAN网络联合身份判别模型一起训练，可以提升身份判别网络判别能力。由于监控视频场景中人流量大且人群特征区分不明显，这严重影响了网络模型在视频监控中搜索出特定行人的性能。如何让模型将不同目标行人的特征区分开，学习到更有代表性的特征至关重要。因此，本专利技术提出基于生成对抗网络的行人重识别检测方法，身份判别模型的基础网络使用Inception-v2结构，与编码器模型的基础网络结构相同，可以共享网络参数。利用联...

【技术保护点】
1.一种基于生成对抗网络的行人重识别检测方法，其特征在于步骤如下：一.样本采集网络训练集采用Market‑1501数据集，利用Market‑1501数据集构建编码器网络的训练数据集，即三元组形式；二.训练编码器网络使用triple loss函数训练编码器网络，使得相同身份的行人类内距离减小，不同身份的行人类间距离增大；三.训练GAN网络训练生成判别模型，使用噪声向量维度256‑d，并将噪声向量与编码器网络提取的1024‑d进行拼接，产生1280‑d向量；四.训练身份判别网络身份判别网络确定了输入图像是否是同一个行人，利用来自编码器网络的两个输入图像的视觉特征；五.联合训练网络联合训练网络是同时更新三个网络的参数，联合不同任务互相促进网络性能；将编码器网络的编码特征应用到GAN网络中，通过博弈对抗思维联合训练身份判别网络，联合训练中输入图像的视觉特征只有GAN网络中生成的假图片，引导身份判别网络的判别能力、GAN网络判别能力和造假能力、编码器网络编码能力；网络联合训练完后，只利用编码器网络进行后续工作；六.将行人检测与行人重识别统一框架将检测模型YOLO‑V3与模型的编码器网络统一到一个...

【技术特征摘要】
1.一种基于生成对抗网络的行人重识别检测方法，其特征在于步骤如下：一.样本采集网络训练集采用Market-1501数据集，利用Market-1501数据集构建编码器网络的训练数据集，即三元组形式；二.训练编码器网络使用tripleloss函数训练编码器网络，使得相同身份的行人类内距离减小，不同身份的行人类间距离增大；三.训练GAN网络训练生成判别模型，使用噪声向量维度256-d，并将噪声向量与编码器网络提取的1024-d进行拼接，产生1280-d向量；四.训练身份判别网络身份判别网络确定了输入图像是否是同一个行人，利用来自编码器网络的两个输入图像的视觉特征；五.联合训练网络联合训练网络是同时更新三个网络的参数，联合不同任务互相促进网络性能；将编码器网络的编码特征应用到GAN网络中，通过博弈对抗思维联合训练身份判别网络，联合训练中输入图像的视觉特征只有GAN网络中生成的假图片，引导身份判别网络的判别能力、GAN网络判别能力和造假能力、编码器网络编码能力；网络联合训练完后，只利用编码器网络进行后续工作；六.将行人检测与行人重识别统一框架将检测模型YOLO-V3与模型的编码器网络统一到一个框架，针对视频序列进行端到端检索，完成目标检索。2.根据权利要求1所述的方法，其特征在于样本采集具体步骤如下：(1)下载Market-1501数据集，根据不同身份行人的各种角度照片，将相同身份行人的不同角度放在一个文件夹下，不同身份行人有不同的文件夹；(2)构建三元组，从上一步骤中整理好的训练数据集中随机选一个样本，该样本称为Anchor，然后再随机选取一个和Anchor属于同一类的样本和不同类的样本,这两个样本对应的称为Positive和Negative，由此构成一个Anchor，Positive，Negative三元组用于训练编码器模型；(3)将相同文件夹下的行人设定label为1，不同文件...

【专利技术属性】
技术研发人员：刘艳霞，张姗，
申请(专利权)人：北京联合大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人