【技术实现步骤摘要】
基于Transformer的两步式领域自适应行人再识别方法
[0001]本专利技术涉及行人再识别
,具体涉及基于Transformer的两步式领域自适应行人再识别方法。
技术介绍
[0002]行人再识别(Person re
‑
identification)也称行人重识别,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术,广泛被认为是一个图像检索的子问题。给定一个监控行人图像,检索跨设备下的该行人图像,旨在弥补固定的摄像头的视觉局限,并可与行人检测/行人跟踪技术相结合,可广泛应用于智能视频监控、智能安保等领域。
[0003]有监督学习的行人再识别已经取得了较为理想的效果。具体为利用数据标签通过深度网络提取图像的特征,反向传播更新模型进行训练。应用/测试时,将待查询图像通过深度网络提取特征,与库中所有图像提取的特征比较,选中特征较为接近的图像,现有的深度网络一般使用卷积神经网络,然而实际应用中的场景图像与训练用的图像往往存在一定风格差异,会导致模型识别性能大幅下降,根本原因在于模型 ...
【技术保护点】
【技术特征摘要】
1.基于Transformer的两步式领域自适应行人再识别方法,其特征在于,包括以下步骤:S1、从数据库获取有标签的源域图像,对源域图像进行预处理并添加作为提示的class token;S2、基于Transformer深度网络构建Transformer识别模型,将S1处理获得的源域向量经过position embedding编码排序后输入Transformer识别模型,提取所述源域图像中的行人特征,并利用源域标签反向传播更新模型,反复更新源域标签和当前模型,如此迭代直至收敛;S3、获取无标签的目标域图像,对目标域图像进行预处理并添加作为提示的class token;S4、将class token作为域指示器,固定Transformer识别模型中除class token以外的参数,将S3处理后获得的目标域向量经过position embedding编码排序后输入Transformer识别模型,提取目标域图像中的行人特征,聚类生成新的伪标签,并利用伪标签反向传播更新模型,反复更新伪标签与当前模型,如此迭代直至收敛;S5、开放Transformer识别模型所有参数,将S3处理后获得的目标域向量进行过滤并输入Transformer识别模型,再次提取目标域图像中的行人特征,聚类更新伪标签,并利用伪标签反向传播更新模型,反复更新伪标签与当前模型,如此迭代直至收敛。2.根据权利要求1所述的基于Transformer的两步式领域自适应行人再识别方法,其特征在于,所述预处理的过程为:将源域图像或目标域图像划窗为若干个尺寸相同的图像块,并将所述图像块线性映射为向量。3.根据权利要求2所述的基于Transformer的两步式领域自适应行人...
【专利技术属性】
技术研发人员:余盛铭,王生进,
申请(专利权)人:佛山市帆思科材料技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。