一种结合卷积网络和递归网络的视频目标检测方法技术

技术编号：21399888 阅读：62 留言：0更新日期：2019-06-19 07:14

本发明专利技术公开了一种结合卷积网络和递归网络的视频目标检测方法。本方法利用连续多帧视频图像进行视频目标检测，采用深度卷积神经网络和递归神经网络相结合的方式，构建了一种端到端的深度学习模型，对输入的连续视频图像进行目标检测，输出视频目标概率图，能有效克服背景动态景观、摄像机抖动等带来的影响，实现高可靠性和高准确度的视频目标检测。

全部详细技术资料下载

【技术实现步骤摘要】
一种结合卷积网络和递归网络的视频目标检测方法
本专利技术涉及计算机视觉和视频图像处理领域，具体涉及一种结合卷积网络和递归网络的视频目标检测方法。
技术介绍
随着计算机视觉技术的进步，监控视频智能处理得到了学术界和工业界的广泛研究，视频目标检测作为视频监控的一个重要功能，一直是研究热点。视频目标检测常常采用背景建模的方式来分割前景目标。然而，当背景存在动态景观(如喷泉、颤动的树叶、波浪等)，或者摄像机存在微小抖动(如大型车辆通过时造成振动、强风造成相机抖动等)等情况，传统的基于背景建模的视频目标检测方法常常遇到严重的困难。近年来，深度学习技术的兴起给计算机视觉领域带来了广泛而深刻的影响，它使越来越多的视觉研究得到产业化应用，例如人脸识别、服装分类、车辆检测等等。深度学习网络主要有两种，一种是卷积神经网络(ConvolutionalNeuralNetworks,CNN)，网络主要结构是卷积层(Convolutionallayer)和池化层(Poolinglayer)，具有非常强的信息抽象能力，主要用来进行图像特征的提取，另一种是递归神经网络(RecurrentNeuralNetworks,RNN)，是一种具有内部状态的网络，适用于处理和预测时序数据。基于以上分析，本专利技术提出了一种结合卷积网络和递归网络的视频目标检测方法。本专利技术致力于无缝集成卷积神经网络和递归神经网络，构建端到端的视频目标检测深度学习模型，发挥两种神经网络在单帧图像特征提取和多帧图像时序信号处理方面的优势，研究和探索出一种具有高可靠性和准确度的视频目标检测方法。
技术实现思路
本专利技术为了...

【技术保护点】
1.一种结合卷积网络和递归网络的视频目标检测方法，包含以下步骤：步骤S1，构建视频数据样本集，所述数据集中的每一个样本包含多帧连续视频图像；步骤S2，构建深度学习网络模型，该模型包括编码网络、递归神经网络和解码网络；步骤S3，利用S1构建的视频数据样本集对步骤S2构建的深度学习模型进行训练；步骤S4，利用步骤S3训练好的模型进行视频目标检测。

【技术特征摘要】
1.一种结合卷积网络和递归网络的视频目标检测方法，包含以下步骤：步骤S1，构建视频数据样本集，所述数据集中的每一个样本包含多帧连续视频图像；步骤S2，构建深度学习网络模型，该模型包括编码网络、递归神经网络和解码网络；步骤S3，利用S1构建的视频数据样本集对步骤S2构建的深度学习模型进行训练；步骤S4，利用步骤S3训练好的模型进行视频目标检测。2.根据权利要求1所述的一种结合卷积网络和递归网络的视频目标检测方法，其特征在于：所述步骤S1具体为：步骤S1-1，采集M个图像序列，每个序列包含L帧连续的视频图像；对每个序列的最后一帧图像(即第L帧图像)标注视频目标的真值，得到标签；步骤S1-2，为了适应不同帧率条件的视频目标检测，对上述每个图像序列进行多步长等间隔采样，步长分别为1，2，和3，从而每个图像序列可以生成3个数据样本，使每个样本包含N帧图像；步骤S1-3，经过上面两步的处理，得到3×M个数据样本，每个样本包含N帧图像，并且第N帧标注有视频目标真值；将3×M个样本作为视频数据样本集。3.根据...

【专利技术属性】
技术研发人员：邹勤，
申请(专利权)人：武汉大学，
类型：发明
国别省市：湖北,42

全部详细技术资料下载我是这个专利的主人