一种基于逐点特征匹配的跨域行人重识别方法技术

技术编号：38390270 阅读：14 留言：0更新日期：2023-08-05 17:43

本发明专利技术提出了一种基于逐点特征匹配的跨域行人重识别方法。首先，为解决网络对于跨域的行人图像风格、颜色等鲁棒性不高的问题，在Resnet50基础网络中引入实例归一化层来提取图像特征，提高模型的泛化能力。其次，为了更好的捕捉局部和全局信息，增强特征的表示能力，利用Transformer自注意力模块与卷积相结合。最后，通过在深层特征中建立一种逐点的特征映射关系，将图像匹配视为逐点寻找局部最优的过程，计算出图像匹配相似度，使用Focal loss进行损失约束。本发明专利技术主要应用于视频监控智能分析应用系统中，在图像检索，智能安防等领域具有开阔的应用前景。有开阔的应用前景。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于逐点特征匹配的跨域行人重识别方法

[0001]本专利技术涉及一种基于逐点特征匹配的跨域行人重识别方法，属于计算机视觉与智能信息处理领域。

技术介绍

[0002]行人重识别是计算机视觉领域中的热门研究内容，旨在解决跨摄像头下的相同身份的图像匹配问题。行人重识别在智能视频监控、智慧安防方面有着广泛的应用，例如搜寻丢失小孩老人、违法犯罪行为侦查、嫌疑人追踪等。但是在现实场景中，由于摄像头位置不同、角度不同，行人姿态、遮挡等影响，很多方法在新的未知场景下泛化能力差，给行人重识别任务带来较大挑战。
[0003]为了解决这个问题，研究者提出无监督域自适应(Unsupervised Domain Adaption)方法，主要包括基于聚类的伪标签法和基于风格迁移的方法，这些方法大都是对每一幅图像计算一个固定的表示向量，并使用典型的距离或相似度度量来进行图像匹配，没有考虑到两幅输入图像之间的实际内容对应关系，而是像分类一样，独立处理每幅图像，学习的模型提取固定的特征表示，没有领域适应和迁移学习时，学习到的模型是固定不变的，泛化能力差，不适合处理没有见过的场景。与传统的跨数据集方式相比，无监督域自适应方法在性能上有提升，但是此类方法都需要在目标域上进一步学习，部署时需要消耗大量的资源和时间，限制了在实际场景中的应用，因此，非常有必要提高基线模型的泛化能力。

技术实现思路

[0004]本专利技术提出了一种基于逐点特征匹配的跨域行人重识别方法，在Resnet50中引入IN层作为骨干网络，提升网络模型的域自适应

【技术保护点】

【技术特征摘要】
1.一种基于逐点特征匹配的跨域行人重识别方法，其特征在于包括以下步骤：(1)在Resnet50中引入IBN
‑
Net，使模型能够学习到风格、颜色等视觉变换的相关性，减小个体之间不同外观的差异，以增强模型的跨域重识别性能；(2)再将经过Resnet50
‑
IBN
‑
Net卷积网络的layer3特征图分成N个子特征图，并将所有子特征图转换为一维向量，把转换得到的一维向量输入到transformer encoder中，以提取更好的全局特征和局部特征；(3)再将得到的特征图进行逐点匹配，将最终得到的匹配向量经过归一化和全连接层输出最终的相似度结果。2.根据权利要求1所述的一种基于逐点特征匹配的跨域行人重识别方法，所述步骤(1)中在Resnet50中引入IBN
‑
Net模块，即在Resnet50 Block中第一个BN层中引入IN层，同时保留一半的BN层，形成Resnet50
‑
IBN
‑
a网络；在Resnet50Block残差连接之后引入IN层，形成Resnet50
‑
IBN
‑
b网络。3.根据权利要求1所述的一种基于逐点特征匹配的跨域行人重识别方法，所述步骤(2)中将经过Resnet50
‑
IBN
‑
Net卷积网络的layer3层的特征图，展平为N个二维的子特征图，将这N个二维子特征图转换为一维的向量输入transformer encoder，N即输入transformer的有效序列长度，transformer encoder中主要包含两个子层，分别是多头注意力层和全连接层；每个子层之间使用残差进行连接，transformer中的核心模块是多头注意力层，公式定义如下：其中，Q代表查询矩阵Query，K代表被查询矩阵Key，V代表实际特征矩阵Value，多头就是通过注意力机制来提取多重的语义信息，根据上式得出行人的特征向量，式中Q
×
K
T
计算出注意力矩阵，除以将注意力矩阵变为标准的正态分布，经过softmax归一化后计算出注意力矩阵对V进行加权。4.根据权利要求1所述的一种基于逐点特征匹配的跨域行人重识别方法，所述步骤(3)中每幅图像经过骨干CNN网络提取特征，再经过transformer后，得到[1，c，h，w]大小的特征图，其中c为输出的通道数量，h和w分别是特征图的高度和宽度；再将特征图缓存到特征缓存池中，将该特征图与缓存池中所有的行人特征图进行匹配；训练刚开始时，缓存池中并没有行人特征图，只能对行人身份特征进行缓存，若该行人的身份特征...

【专利技术属性】
技术研发人员：吴晓红，杨萍，刘强，李波，陈洪刚，何小海，
申请(专利权)人：四川大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人