一种支持循环神经网络对抗学习的目标跟踪方法技术

技术编号：21345142 阅读：32 留言：0更新日期：2019-06-13 23:05

一种支持循环神经网络对抗学习的目标跟踪方法，包括以下步骤：步骤1，构建目标跟踪生成对抗网络OTGAN模型；步骤2，预训练生成器，使其具有初步预测视频帧跟踪结果的能力；步骤3，预训练判别器，使其具有初步判别视频中运动目标运动轨迹真假的能力；步骤4，对抗训练目标跟踪生成对抗网络OTGAN。本发明专利技术将生成对抗网络和长短期记忆网络LSTM融合，形成了基于对抗训练的目标跟踪循环神经网络，将视频帧全局特征向量作为生成对抗网络的输入之一，而不是传统中将随机变量作为输入，从而学习到视频帧中目标信息，并学习从历史及当前视频帧信息到目标位置的映射关系，提升整体跟踪准确率；同时利用目标运动轨迹进行监督训练，能够极大地提升目标跟踪的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种支持循环神经网络对抗学习的目标跟踪方法
本专利技术涉及一种支持循环神经网络对抗学习的目标跟踪方法，属于计算机视觉领域。
技术介绍
目标跟踪是计算机视觉领域的重点和难点课题，一直以来都受到广泛关注，在无人机、智能交通、精确制导、机器人、人机交互等军用和民用领域都有着重要作用。目标跟踪的研究已有几十年的时间，目前也取得了不少成果。然而,尽管很多跟踪算法已经被提出，但是由于跟踪过程的复杂多变，同时实现实时、鲁棒跟踪仍然是一个巨大挑战。基于深度学习的目标跟踪的研究在近几年发展迅速，同时考虑到利用视频序列之间的时间相关性，循环神经网络(RecurrentNeuralNetwork)得到广泛关注。长短期记忆网络LSTM是一种RNN特殊的类型，可以学习长期依赖的信息。2017年，NingG等人（ZhangZ,HuangC，“Spatiallysupervisedrecurrentconvolutionalneuralnetworksforvisualobjecttracking”，IEEEInternationalSymposiumonCircuitsandSystems.IEEE,2017:1-4.）训练基于检测的循环神经网络应用于目标跟踪，但是基于检测的跟踪只能跟踪检测算法YOLO数据集中包含的20类目标，如猫、车等。GordonD等人(Gordon,A.Farhadi,andD.Fox,“Re3:Real-TimeRecurrentRegressionNetworksforObjectTracking”,2017,PP(99):1-1.)提出一种实时的循环回归...

【技术保护点】
1.一种支持循环神经网络对抗学习的目标跟踪方法，其特征在于：该方法包括以下步骤：步骤1，构建目标跟踪生成对抗网络OTGAN模型；步骤2，预训练生成器，使其具有初步预测视频帧跟踪结果的能力；步骤3，预训练判别器，使其具有初步判别视频中运动目标运动轨迹真假的能力；步骤4，对抗训练目标跟踪生成对抗网络OTGAN。

【技术特征摘要】
1.一种支持循环神经网络对抗学习的目标跟踪方法，其特征在于：该方法包括以下步骤：步骤1，构建目标跟踪生成对抗网络OTGAN模型；步骤2，预训练生成器，使其具有初步预测视频帧跟踪结果的能力；步骤3，预训练判别器，使其具有初步判别视频中运动目标运动轨迹真假的能力；步骤4，对抗训练目标跟踪生成对抗网络OTGAN。2.根据权利要求1所述的一种支持循环神经网络对抗学习的目标跟踪方法，其特征在于：所述步骤1中目标跟踪生成对抗网络OTGAN模型包括生成器和判别器，所述生成器用于生成视频帧跟踪结果，所述判别器用于判别输入是真实运动轨迹还是由生成器生成的跟踪结果构成的运动轨迹。3.根据权利要求2所述的一种支持循环神经网络对抗学习的目标跟踪方法，其特征在于：所述生成器包括用于提取视频帧全局特征的卷积网络和跟踪网络；所述卷积网络包括5个卷积层，3个最大池化层，1层全连接层，卷积层卷积核大小依次为11×11、5×5、3×3、3×3、3×3，最大池化层池化核为2×2，全连接层输出维度为4096维；所述跟踪网络由长短期记忆网络LSTM构成，所述长短期记忆网络LSTM输入参数包括：第i帧隐藏状态hi、第i帧细胞状态ci、所述卷积网络产生的4096维特征，得到的跟踪坐标为LSTM网络回归的向量最后四个参数构成的4维向量Pi=[xi,yi,wi,hi]，其中(xi,yi)为跟踪目标矩形框的中心坐标，(wi,hi)分别为跟踪目标矩形框的宽和高。4.根据权利要求2所述的一种支持循环神经网络对抗学习的目标跟踪方法，其特征在于：所述判别器由双向LSTM网络...

【专利技术属性】
技术研发人员：韩光，杜花，高燕，
申请(专利权)人：南京邮电大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人