基于Transformer的两步式领域自适应行人再识别方法技术

技术编号：36034606 阅读：13 留言：0更新日期：2022-12-21 10:37

本发明专利技术公开了基于Transformer的两步式领域自适应行人再识别方法，属于行人再识别技术领域，具体包括：将源域图像预处理并添加class token；构建Transformer识别模型，将所述源域图像和class token编码后输入Transformer识别模型，提取源域图像中的行人特征，并反向传播更新模型；获取目标域图像，将目标域图像进预处理并添加class token；将class token作为域指示器，固定模型中除class token以外的参数，将目标域图像编码后输入Transformer识别模型，提取目标域图像中的行人特征，并反向传播更新模型；开放模型中所有参数，将经过过滤的目标域图像输入Transformer识别模型，提取目标域图像的行人特征，并反向传播更新模型；本发明专利技术将Transformer应用到领域自适应行人再识别中，提升了识别模型的性能。提升了识别模型的性能。提升了识别模型的性能。

全部详细技术资料下载

【技术实现步骤摘要】
基于Transformer的两步式领域自适应行人再识别方法

[0001]本专利技术涉及行人再识别
，具体涉及基于Transformer的两步式领域自适应行人再识别方法。

技术介绍

[0002]行人再识别(Person re
‑
identification)也称行人重识别，是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术，广泛被认为是一个图像检索的子问题。给定一个监控行人图像，检索跨设备下的该行人图像，旨在弥补固定的摄像头的视觉局限，并可与行人检测/行人跟踪技术相结合，可广泛应用于智能视频监控、智能安保等领域。
[0003]有监督学习的行人再识别已经取得了较为理想的效果。具体为利用数据标签通过深度网络提取图像的特征，反向传播更新模型进行训练。应用/测试时，将待查询图像通过深度网络提取特征，与库中所有图像提取的特征比较，选中特征较为接近的图像，现有的深度网络一般使用卷积神经网络，然而实际应用中的场景图像与训练用的图像往往存在一定风格差异，会导致模型识别性能大幅下降，根本原因在于模型泛化能力差，在目标域人工标注部分数据可以解决该问题，但是人工标注需要很高的标注成本和时间。

技术实现思路

[0004]本专利技术的目的在于提供基于Transformer的两步式领域自适应行人再识别方法，解决以下技术问题：
[0005](1)现有的深度网络一般使用卷积神经网络，然而实际应用中的场景图像与训练用的图像往往存在一定风格差异，会导致模型识别性能大幅下降，根本原因在于...

【技术保护点】

【技术特征摘要】
1.基于Transformer的两步式领域自适应行人再识别方法，其特征在于，包括以下步骤：S1、从数据库获取有标签的源域图像，对源域图像进行预处理并添加作为提示的class token；S2、基于Transformer深度网络构建Transformer识别模型，将S1处理获得的源域向量经过position embedding编码排序后输入Transformer识别模型，提取所述源域图像中的行人特征，并利用源域标签反向传播更新模型，反复更新源域标签和当前模型，如此迭代直至收敛；S3、获取无标签的目标域图像，对目标域图像进行预处理并添加作为提示的class token；S4、将class token作为域指示器，固定Transformer识别模型中除class token以外的参数，将S3处理后获得的目标域向量经过position embedding编码排序后输入Transformer识别模型，提取目标域图像中的行人特征，聚类生成新的伪标签，并利用伪标签反向传播更新模型，反复更新伪标签与当前模型，如此迭代直至收敛；S5、开放Transformer识别模型所有参数，将S3处理后获得的目标域向量进行过滤并输入Transformer识别模型，再次提取目标域图像中的行人特征，聚类更新伪标签，并利用伪标签反向传播更新模型，反复更新伪标签与当前模型，如此迭代直至收敛。2.根据权利要求1所述的基于Transformer的两步式领域自适应行人再识别方法，其特征在于，所述预处理的过程为：将源域图像或目标域图像划窗为若干个尺寸相同的图像块，并将所述图像块线性映射为向量。3.根据权利要求2所述的基于Transformer的两步式领域自适应行人...

【专利技术属性】
技术研发人员：余盛铭，王生进，
申请(专利权)人：佛山市帆思科材料技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人