一种基于混合注意力行人重识别方法技术

技术编号:36813375 阅读:15 留言:0更新日期:2023-03-09 00:58
本公开是关于一种基于混合注意力行人重识别方法。该方法包括:通过多尺度数据增强算法对图片数据集进行预处理,得到预处理后的图片数据集;其中,图片数据集为获取到的用于行人重识别的数据集;构建混合注意力网络模型,并对构建的混合注意力网络模型进行调整,得到行人重识别模型;将预处理后的图片数据集中的行人图片输入行人重识别模型中进行训练,得到训练好的所述行人重识别模型;将待识别图片和待识别视频输入训练好的行人重识别模型,输出识别结果。本公开通过该方法得到的行人重识别模型,可以提高行人重识别的效率与准确率。可以提高行人重识别的效率与准确率。可以提高行人重识别的效率与准确率。

【技术实现步骤摘要】
一种基于混合注意力行人重识别方法


[0001]本公开涉及计算机视觉
,尤其涉及一种基于混合注意力行人重识别方法。

技术介绍

[0002]随着计算机软硬件性能的提高,计算机视觉技术搭上了前进的快车道。但对于行人重识别这一领域来说仍然存在很多问题。通常,公共区域等场所的视频监控设备架设位置较高,导致镜头离行人距离相对较远,很难获得较为清晰的人脸特征,因此,行人重识别技术成为当今较为热门的研究方向,特别是在公安刑侦以及儿童丢失等公共安全问题上,急需在公共区域等场所来解决行人搜索这一问题。
[0003]相关技术中,传统的行人重识别方法依赖手工特征设计,不能适应数据量很大的复杂环境。近年来,以卷积神经网络为代表的深度学习在行人重识别领域取得了极大的成功。但提取的视觉特征易陷入局部最优,而忽略全局关系,导致识别准确率低下。
[0004]因此,有必要提供一种新的技术方案改善上述方案中存在的一个或者多个问题。
[0005]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0006]本公开的目的在于提供一种基于混合注意力行人重识别方法,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。
[0007]根据本公开实施例提供的一种基于混合注意力行人重识别方法,该方法包括:
[0008]通过多尺度数据增强算法对图片数据集进行预处理,得到预处理后的所述图片数据集;其中,所述图片数据集为获取到的用于行人重识别的数据集;
[0009]构建混合注意力网络模型,并对构建的所述混合注意力网络模型进行调整,得到行人重识别模型;
[0010]将预处理后的所述图片数据集中的行人图片输入所述行人重识别模型中进行训练,得到训练好的所述行人重识别模型;
[0011]将待识别图片和待识别视频输入训练好的所述行人重识别模型,输出识别结果。
[0012]本公开的实施例中,所述构建混合注意力网络模型,并对构建的所述混合注意力网络模型进行调整的步骤中包括:
[0013]选用残差网络作为基本网络结构,在所述残差网络的最后三个瓶颈块添加混合注意力模块,得到调整后的所述混合注意力网络模型。
[0014]本公开的实施例中,所述构建混合注意力网络模型,并对构建的所述混合注意力网络模型进行调整的步骤之后还包括:
[0015]对调整后的所述混合注意力网络模型进行添加辅助信息编码,得到所述行人重识别模型。
[0016]本公开的实施例中,所述辅助信息编码通过所述图片数据集中的域信息、视觉信息构建而成。
[0017]本公开的实施例中,所述将预处理后的所述图片数据集中的行人图片输入到所述行人重识别模型中进行训练,得到训练好的所述行人重识别模型的步骤中包括:
[0018]使用难样本下的三元组损失函数调整所述行人重识别模型的参数;其中,所述三元组包括正样本、负样本和原样本。
[0019]本公开的实施例中,所述损失函数如下:
[0020][0021]A表示锚点的特征向量,P表示正样本的特征向量,N表示负样本的特征向量,d为欧氏距离,所以d(A,P)表示正样本和锚点之间的欧氏距离,d(A,N)表示负样本和锚点之间的欧氏距离,max指的是两距离之间的一个最大间隔,min指的是两距离之间的一个最小间隔,括号右下角+表示,当表达式的值大于等于零的时候,损失值为当前表达式的值,当表达式的值小于零的时候,损失值为零。
[0022]本公开的实施例中,所述将预处理后的所述图片数据集中的行人图片输入到具有编码的所述混合注意力网络模型中进行训练,得到训练好的行人重识别模型的步骤中包括:
[0023]根据损失函数的值及损失函数曲线判断具有编码的所述混合注意力网络模型模型是否收敛。
[0024]本公开的实施例中,所述将预处理后的所述图片数据集中的行人图片输入到具有编码的所述混合注意力网络模型中进行训练,得到训练好的行人重识别模型的步骤中包括:
[0025]当损失函数在预设次数训练中取值变化不大时,则判断具有编码的所述混合注意力网络模型收敛,并停止训练,得到训练好的所述行人重识别模型。
[0026]本公开的实施例中,所述得到训练好的所述行人重识别模型的步骤之后还包括:
[0027]当编码的所述混合注意力网络模型模型收敛时,根据第一匹配率和平均精度均值判断收敛后的混合注意力模型性能。
[0028]本公开的实施例中,所述将待识别图片和待识别视频输入训练好的所述行人重识别模型,输出识别结果的步骤中包括:
[0029]当将所述待识别视频输入训练好的行人重识别模型时,提取视频每一帧的图像,通过计算每一帧图像的余弦相似度判断行人与数据库中的行人相似度并排序,输出识别结果。
[0030]本公开的实施例提供的技术方案可以包括以下有益效果:
[0031]本公开的一种实施例中,通过上述方法,通过多尺度数据增强算法随图片数据集进行预处理,得到预处理后的图片数据集;同时构建混合注意力网络模型,并对其进行调整,得到行人重识别模型,利用预处理后的图片数据集对行人重识别模型进行训练,得到训练好的行人重识别模型,便于后续将识别图片和待识别视频输入训练好的行人重识别模型,从而提高行人重识别的效率与准确率。
[0032]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不
能限制本公开。
附图说明
[0033]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0034]图1示意性示出本公开示例性实施例中一种基于混合注意力行人重识别方法的步骤流程图;
[0035]图2示意性示出本公开示例性实施例中行人重识别流程图;
[0036]图3示意性示出本公开示例性实施例中混合注意力模块结构图;
[0037]图4示意性示出本公开示例性实施例中混合注意力网络模型结构图;
[0038]图5示意性示出本公开示例性实施例中混合注意力网络模型训练流程图;
[0039]图6示意性示出本公开示例性实施例中对于视频数据的行人重识别流程图。
具体实施方式
[0040]现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
[0041]本示例实施方式中首先提供了一种基于混合注意力行人重识别方法。参考图1中所示,该方法可以本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于混合注意力行人重识别方法,其特征在于,该方法包括:通过多尺度数据增强算法对图片数据集进行预处理,得到预处理后的所述图片数据集;其中,所述图片数据集为获取到的用于行人重识别的数据集;构建混合注意力网络模型,并对构建的所述混合注意力网络模型进行调整,得到行人重识别模型;将预处理后的所述图片数据集中的行人图片输入所述行人重识别模型中进行训练,得到训练好的所述行人重识别模型;将待识别图片和待识别视频输入训练好的所述行人重识别模型,输出识别结果。2.根据权利要求1所述基于混合注意力行人重识别方法,其特征在于,所述构建混合注意力网络模型,并对构建的所述混合注意力网络模型进行调整的步骤中包括:选用残差网络作为基本网络结构,在所述残差网络的最后三个瓶颈块添加混合注意力模块,得到调整后的所述混合注意力网络模型。3.根据权利要求2所述基于混合注意力行人重识别方法,其特征在于,所述构建混合注意力网络模型,并对构建的所述混合注意力网络模型进行调整的步骤之后还包括:对调整后的所述混合注意力网络模型进行添加辅助信息编码,得到所述行人重识别模型。4.根据权利要求3所述基于混合注意力行人重识别方法,其特征在于,所述辅助信息编码通过所述图片数据集中的域信息、视觉信息构建而成。5.根据权利要求1所述基于混合注意力行人重识别方法,其特征在于,所述将预处理后的所述图片数据集中的行人图片输入到所述行人重识别模型中进行训练,得到训练好的所述行人重识别模型的步骤中包括:使用难样本下的三元组损失函数调整所述行人重识别模型的参数;其中,所述三元组包括正样本、负样本和原样本。6.根据权利要求5所述基于混合注意力行人重识别方法,其特征在于,所述损失函数如下:A表示锚点的特征向量,P表示正样本的...

【专利技术属性】
技术研发人员:屈军锁张海洋
申请(专利权)人:陕西烽火实业有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1