一种保留平移不变性的行人重识别方法、装置及存储介质制造方法及图纸

技术编号:25950659 阅读:43 留言:0更新日期:2020-10-17 03:42
本发明专利技术提出了一种保留平移不变性的行人重识别方法、装置及存储介质,该方法包括:训练步骤,使用样本集对卷积神经网络模型进行训练获得训练后的卷积神经网络模型,其中,所述神经网络的模型的下采样层由步长为1的最大池化层、步长为2的平均池化层依次连接组成,或者由步长为1的卷积层、ReLU激活函数层和步长为2的平均池化层依次连接组成;行人重识别步骤,使用训练后的卷积神经网络模型对摄像头获取的图像进行行人重识别获得识别结果。本发明专利技术对卷积神经网络的下采样层的结构进行了修改,仅使用平均池化层进行下采样操作,不会破坏整个网络的平移不变性,提高了行人重识别的准确性,且针对修改后的网络结构提出了样本集及损失函数的具体修改方法。

【技术实现步骤摘要】
一种保留平移不变性的行人重识别方法、装置及存储介质
本专利技术涉及人工智能
,具体涉及一种保留平移不变性的行人重识别方法、装置及存储介质。
技术介绍
随着社会和科技的进步,人脸识别越来越成为一项可依赖的安防技术。但是对于现今大部分摄像头而言,其分辨率往往不能达到人脸识别系统的要求,故可以应用于现有监控系统的行人重识别技术是极有必要的。行人重识别(Personre-identification)是利用图像处理技术来判定某一摄像头下的行人是否出现在其他摄像头中,从而可以描绘行人的活动路径,实现跨镜头追踪的目的。现阶段行人重识别常用方法主要有表征学习、度量学习、基于局部特征或视频序列等方法。CNN(卷积神经网络)架构由于采用多种下采样策略(最大池化、步长卷积等)导致网络最后提取到的图像特征丢失了平移不变性。而完整的行人重识别系统往往还需要叠加行人检测模型(通常为CNN架构)以抠取背景图中的行人图片,若行人重识别网络不具有良好的平移不变性,将受到行人检测模型的影响从而限制了整个系统的识别性能。
技术实现思路
本专利技术针对上述现有技术中一个或多个技术缺陷,提出了如下技术方案。一种保留平移不变性的行人重识别方法,该方法包括:训练步骤,使用样本集对卷积神经网络模型进行训练获得训练后的卷积神经网络模型,其中,所述神经网络的模型的下采样层由步长为1的最大池化层、步长为2的平均池化层依次连接组成,或者由步长为1的卷积层、ReLU激活函数层和步长为2的平均池化层依次连接组成;行人重识别步骤,使用训练后的卷积神经网络模型对摄像头获取的图像进行行人重识别获得识别结果。更进一步地,所述卷积神经网络模型包括全局特征识别部分和局部特征识别部分。更进一步地,对所述样本集中使用的三元组样本添加随机平移增强策略处理,所述三元组样本增强策略为:每个三元组由标准样本、正样本和负样本组成,以概率P1选取三元组中的某一样本对其进行随机平移调整,所述随机平移调整以概率P2对该样本随机平移m个像素。更进一步地,所述全局特征识别部分和局部特征识别部分使用的损失函数为Lsoftmax、Ltrihard和Lcenter。更进一步地,对损失函数为Lsoftmax、Ltrihard和Lcenter进行加权计算,得到全局特征识别部分和局部特征识别部分的总损失函数Ltotal:Ltotal=Lsoftmax+γtLtrihard+γcLcenter,其中,γt、γc为权重。本专利技术还提出了一种保留平移不变性的行人重识别装置,该装置包括:训练单元,使用样本集对卷积神经网络模型进行训练获得训练后的卷积神经网络模型,其中,所述神经网络的模型的下采样层由步长为1的最大池化层、步长为2的平均池化层依次连接组成,或者由步长为1的卷积层、ReLU激活函数层和步长为2的平均池化层依次连接组成;行人重识别单元,使用训练后的卷积神经网络模型对摄像头获取的图像进行行人重识别获得识别结果。更进一步地,所述卷积神经网络模型包括全局特征识别部分和局部特征识别部分。更进一步地,对所述样本集中使用的三元组样本添加随机平移增强策略处理,所述三元组样本增强策略为:每个三元组由标准样本、正样本和负样本组成,以概率P1选取三元组中的某一样本对其进行随机平移调整,所述随机平移调整以概率P2对该样本随机平移m个像素。更进一步地,所述全局特征识别部分和局部特征识别部分使用的损失函数为Lsoftmax、Ltrihard和Lcenter。更进一步地,对损失函数为Lsoftmax、Ltrih和Lcenter进行加权计算,得到全局特征识别部分和局部特征识别部分的总损失函数Ltotal:Ltotal=Lsoftmax+γtLtriha+γcLcenter,其中,γt、γc为权重。本专利技术还提出了一种计算机可读存储介质,所述存储介质上存储有计算机程序代码,当所述计算机程序代码被计算机执行时执行上述之任一的方法。本专利技术的技术效果在于:本专利技术的一种保留平移不变性的行人重识别方法、装置及存储介质,该方法包括:训练步骤,使用样本集对卷积神经网络模型进行训练获得训练后的卷积神经网络模型,其中,所述神经网络的模型的下采样层由步长为1的最大池化层、步长为2的平均池化层依次连接组成,或者由步长为1的卷积层、ReLU激活函数层和步长为2的平均池化层依次连接组成;行人重识别步骤,使用训练后的卷积神经网络模型对摄像头获取的图像进行行人重识别获得识别结果。本专利技术对卷积神经网络的下采样层的结构进行了修改,使用平均池化层进行下采样操作,不会破坏整个网络的平移不变性,提高了行人重识别的准确性,且针对修改后的网络结构提出了样本集及损失函数的具体修改方法。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显。图1是根据本专利技术的实施例的一种保留平移不变性的行人重识别方法的流程图。图2是根据本专利技术的实施例的卷积神经网络修改结构示意图。图3是根据本专利技术的实施例的一种保留平移不变性的行人重识别装置的结构图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了本专利技术的一种保留平移不变性的行人重识别方法,该方法包括:训练步骤S101,使用样本集对卷积神经网络模型进行训练获得训练后的卷积神经网络模型,其中,所述神经网络的模型的下采样层由步长为1的最大池化层、步长为2的平均池化层依次连接组成,或者由步长为1的卷积层、ReLU激活函数层和步长为2的平均池化层依次连接组成。CNN网络平移不变性丢失原因在于下采样部分(主要为最大池化层及步长为2的卷积层)对于输入特征图像素点移位较为敏感,而平均池化层虽然同样为下采样操作,但是由于其计算方式(相邻像素值求平均)的特殊性,并不会破坏整个网络的平移不变性。因此在整个网络设计中考虑使用仅仅使用平均池化来完成下采样操作,实现最大池化层及步长为2的卷积层的等效操作。在一个实施例中,使用resnet50作为backbone网络构建行人重识别识别网络,并对stage1、stage2及stage3用于下采样的中的最大池化层及步长为2的卷积层进行着重调整。具体地,参见图2,使用步长为1的最大池化层与步长为2的平均池化层依次连接后替代原来的步长为2的最大池化层,使用步长为1的卷积层、ReLU激活函数层和步长为2的平均池化层依次连接后替代原来的步长为2的卷积层与ReLU激活函数层,平均池化层。虽然同样为下采样操作,但是由于其计算方式(相邻像素值求平均)的特殊性,平均池化层并不会破坏整个本文档来自技高网...

【技术保护点】
1.一种保留平移不变性的行人重识别方法,其特征在于,该方法包括:/n训练步骤,使用样本集对卷积神经网络模型进行训练获得训练后的卷积神经网络模型,其中,所述神经网络的模型的下采样层由步长为1的最大池化层、步长为2的平均池化层依次连接组成,或者由步长为1的卷积层、ReLU激活函数层和步长为2的平均池化层依次连接组成;/n行人重识别步骤,使用训练后的卷积神经网络模型对摄像头获取的图像进行行人重识别获得识别结果。/n

【技术特征摘要】
1.一种保留平移不变性的行人重识别方法,其特征在于,该方法包括:
训练步骤,使用样本集对卷积神经网络模型进行训练获得训练后的卷积神经网络模型,其中,所述神经网络的模型的下采样层由步长为1的最大池化层、步长为2的平均池化层依次连接组成,或者由步长为1的卷积层、ReLU激活函数层和步长为2的平均池化层依次连接组成;
行人重识别步骤,使用训练后的卷积神经网络模型对摄像头获取的图像进行行人重识别获得识别结果。


2.根据权利要求1所述的方法,其特征在于,所述卷积神经网络模型包括全局特征识别部分和局部特征识别部分。


3.根据权利要求2所述的方法,其特征在于,对所述样本集中使用的三元组样本添加随机平移增强策略处理,所述三元组样本增强策略为:每个三元组由标准样本、正样本和负样本组成,以概率P1选取三元组中的某一样本对其进行随机平移调整,所述随机平移调整以概率P2对该样本随机平移m个像素。


4.根据权利要求3所述的方法,其特征在于,所述全局特征识别部分和局部特征识别部分使用的损失函数为Lsoftmax、Ltrihard和Lcenter。


5.根据权利要求4所述的方法,其特征在于,对损失函数为Lsoftmax、Ltrihard和Lcenter进行加权计算,得到全局特征识别部分和局部特征识别部分的总损失函数Ltotal:
Ltotal=Lsoftmax+γtLtrihard+γcLcenter,其中,γt、γc为权重。


6.一种保留平移不变性的行人重识别装置,其特征在于,该装置包括:

【专利技术属性】
技术研发人员:林修明吴鸿伟林淑强张永光蓝坤宏魏炜途
申请(专利权)人:厦门市美亚柏科信息股份有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1