【技术实现步骤摘要】
一种基于擦除显著性区域的行人重识别方法
本专利技术属于行人重识别领域,尤其是涉及一种基于擦除显著性区域的行人重识别方法。
技术介绍
行人重识别是一个非常重要的研究领域,给定一张人的图片,它需要返回在数据库中这个人的另外图片。由于深度学习的广泛应用,在过去几年,该领域有了飞快的发展和进步。但是由于遮挡,行人姿态的变化,背景的影响,相机视角的不同,行人重识别仍然是一个非常具有挑战性的任务。而行人重识别在安防领域有着非常重要的作用,比如可以查询在游乐园与父母走散的儿童,利用城市的摄像头快速定位追踪犯罪嫌疑人等。因此如何提升重识别的性能已经引起了学术界和各国政府的广泛关注。作为一个行人级别的查询任务,它需要尽可能学到丰富的视觉信息来提升它的准确性。但是随着训练的不断进行,模型会越来越关注显著性容易判断的视觉信息,从而导致模型忽视其他的视觉特征,降低它的准确性,尤其是2张图片的行人区分不明显的时候,效果会大大下降。比如2张图片,行人都穿着绿色的大衣,背着棕绿色的包,但是他们的鞋子是不一样的,而由于模型只关注显著性区域而忽视了其 ...
【技术保护点】
1.一种基于擦除显著性区域的行人重识别方法,其特征在于,包括以下步骤:/n(1)选择训练数据集,从训练数据集中随机采样,构建多组训练数据;每组训练数据的构建方式为:从训练数据集中随机选取P个不同人图片,每个人随机选取K张图片,得到P×K张图片作为一组训练数据;/n(2)对于每组训练数据,根据图片的相似程度,定位得到图片的显著性区域;/n(3)根据预先设置的擦除区域和概率,擦除一定比例的显著性区域;/n(4)提取擦除了显著性区域的图片的特征并且利用自适应全局池化层来进行池化操作,缓解过度擦除的问题,利用该特征计算误差;/n(5)计算原图的特征向量,防止信息损失,利用该特征向量 ...
【技术特征摘要】
1.一种基于擦除显著性区域的行人重识别方法,其特征在于,包括以下步骤:
(1)选择训练数据集,从训练数据集中随机采样,构建多组训练数据;每组训练数据的构建方式为:从训练数据集中随机选取P个不同人图片,每个人随机选取K张图片,得到P×K张图片作为一组训练数据;
(2)对于每组训练数据,根据图片的相似程度,定位得到图片的显著性区域;
(3)根据预先设置的擦除区域和概率,擦除一定比例的显著性区域;
(4)提取擦除了显著性区域的图片的特征并且利用自适应全局池化层来进行池化操作,缓解过度擦除的问题,利用该特征计算误差;
(5)计算原图的特征向量,防止信息损失,利用该特征向量计算误差;
(6)结合步骤(4)和(5)得到的误差,回传梯度训练网络模型;
(7)模型训练完毕,将待查询行人图片输入模型,将待查询行人图片的特征向量和图片库中每张图片特征向量进行相似度排序,选择排序最靠前的图片的身份作为最终识别结果。
2.根据权利要求1所述的基于擦除显著性区域的行人重识别方法,其特征在于,步骤(2)的具体过程如下:
(2-1)对于P个不同人图片中的每张图片,在其对应的K张图片中,找到和它余弦距离最小,并且属于同一个人的图片,计算它们之间的余弦距离;
(2-2)利用该余弦距离计算得到这个查询对的权重,将该权重乘以它们的余弦距离作为该查询对的贡献程度;
(2-3)将所有P张图片的贡献程度进行累加,作为该组训练数据的整体相似度,然后回传梯度;
(2-4)将梯度与特征值进行相乘,再缩放到输入图片的大小,得到最终的显著性图M;M中的值表示该位置对最终的匹配结果的贡献程度;公式如下:
式中,为定位显著性区域的特征值,为梯度,i,j表示像素位置,k表示第k层特征图,ReLU为激活函数;Mi,j表示原始图像域中(i,j)位置的重要程度
3.根据权利要求2所述的基于擦除显著性区域的行人重识别方法,其特征在于,步骤(2-1)中,所述余弦距离的计算公式为:
式中,fq和fg分别为2张图片对应的特征表达,分子为向量的点乘,||fq||和|...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。