The invention relates to a method of constructing the training sample and compromise measure convolutional neural network 3D, which is characterized in that the 3D convolutional neural network structure twin structure; loss function to set up the network, the loss function by positive sample and negative sample loss loss and regularized loss, combined with the Mahalanobis distance and Euclidean the distance in the regularized loss; use the softmax loss function, the use of video sequence data in the form of pre training set of network structure; the positive samples and negative samples of the pre-processing and segmentation of images; selective use of training samples to train the network. The invention has reasonable design, the selective use of training samples to improve training efficiency and inhibit the over fitting, at the same time, in the characteristic measure of Euclidean distance and Mahalanobis distance trade-off, so as to construct the convolutional neural network 3D model test shows that the model and the training strategy constructed by the invention of the whole system, greatly enhance the rate of.
【技术实现步骤摘要】
利用训练样本及折中度量的3D卷积神经网络构建方法
本专利技术属于视觉行人再识别
,尤其是一种利用训练样本及折中度量的3D卷积神经网络构建方法。
技术介绍
随着监控范围的增大,监控数据呈现爆炸式增长。依靠人眼识别监控画面中的行人身份显然十分低效,行人再识别技术的任务便是依靠计算机视觉技术解决不重叠监控视野中行人身份匹配的问题。行人再识别的传统方法主要分为两个步骤,首先对图像/视频进行特征提取,然后通过度量学习得到不同样本的相似度/距离。随着卷积神经网络技术的兴起,其在行人检测、目标跟踪等视觉任务中表现出了出色的性能,因此,基于深度学习的行人再识别也成为了备受关注的研究方向。然而,现有卷积神经网络存在一定局限性,即其仅仅对单张图像进行处理,而没有对监控视频的帧间信息进行利用,因此匹配效率较低。
技术实现思路
本专利技术的目地在于克服现有技术的不足,提出一种设计合理、匹配效率高且性能稳定的利用训练样本及折中度量的3D卷积神经网络构建方法。本专利技术解决其技术问题是采取以下技术方案实现的:一种利用训练样本及折中度量的3D卷积神经网络构建方法,包括以下步骤:步骤1、构造孪生结构的3D卷积神经网络;步骤2、设置网络的损失函数,该损失函数由正样本损失、负样本损失及正则化损失构成,并在正则化损失中结合了马氏距离和欧氏距离;步骤3、使用softmax损失函数,使用视频序列形式的数据集对网络进行预训练;步骤4、构造正样本对和负样本对,对图像进行预处理和分割;步骤5、有选择地利用训练样本对网络进行训练。步骤1构建的3D卷积神经网络,包括如下两个相同的分支网络结构:3D卷积层→ ...
【技术保护点】
一种利用训练样本及折中度量的3D卷积神经网络构建方法,其特征在于包括以下步骤:步骤1、构造孪生结构的3D卷积神经网络;步骤2、设置网络的损失函数,该损失函数由正样本损失、负样本损失及正则化损失构成,并在正则化损失中结合了马氏距离和欧氏距离;步骤3、使用softmax损失函数,使用视频序列形式的数据集对网络进行预训练;步骤4、构造正样本对和负样本对,对图像进行预处理和分割;步骤5、有选择地利用训练样本对网络进行训练。
【技术特征摘要】
1.一种利用训练样本及折中度量的3D卷积神经网络构建方法,其特征在于包括以下步骤:步骤1、构造孪生结构的3D卷积神经网络;步骤2、设置网络的损失函数,该损失函数由正样本损失、负样本损失及正则化损失构成,并在正则化损失中结合了马氏距离和欧氏距离;步骤3、使用softmax损失函数,使用视频序列形式的数据集对网络进行预训练;步骤4、构造正样本对和负样本对,对图像进行预处理和分割;步骤5、有选择地利用训练样本对网络进行训练。2.根据权利要求1所述的利用训练样本及折中度量的3D卷积神经网络构建方法,其特征在于:步骤1构建的3D卷积神经网络,包括如下两个相同的分支网络结构:3D卷积层→批量归一化层→激活层→Dropout层→3D卷积层→批量归一化层→激活层→Dropout层→最大池化层→3D卷积层→批量归一化层→激活层→Dropout层→最大池化层→3D卷积层→批量归一化层→激活层→Dropout层→3D卷积层→批量归一化层→激活层→Dropout层→最大池化层→第一全连接层→第二全连接层。3.根据权利要求2所述的利用训练样本及折中度量的3D卷积神经网络构建方法,其特征在于:所述3D卷积层的参数为3*3*3;所述激活层的参数为ReLU;所述Dropout层的参数为0.2;所述最大池化层的参数为1*2*2;所述第一全连接层的参数为4096*4096;所述第二全连接层的参数为4096*1000。4.根据权利要求1所述的利用训练样本及折中度量的3D卷积神经网络构建方法,其特征在于:所述步骤2的具体处理方法为:设孪生网络两个输出分别为Ψ(x1)和Ψ(x2),其中x1和x2为网络的原始输入数据,Ψ(x1)和Ψ(x2)为网络最后的全连接层输出的1000维特征,则这两个样本之间的距离定义为:d(x1,x2)=||Ψ(x1)-...
【专利技术属性】
技术研发人员:郑苏桐,郭晓强,李小雨,王东飞,周芸,姜竹青,门爱东,
申请(专利权)人:国家新闻出版广电总局广播科学研究院,北京邮电大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。