关键细节属性自适应掩膜增强的跨模态行人重识别方法技术

技术编号：38349369 阅读：9 留言：0更新日期：2023-08-02 09:29

本发明专利技术涉及一种关键细节属性自适应掩膜增强的跨模态行人重识别方法，利用单模态显著属性掩膜模块，参考同一模态中的全局上下文语义来阐明不同属性的重要性；提出了跨模态显著属性掩膜模块，通过细粒度的跨模态关系，以确定不同属性的重要性；提出了属性建模平衡模块，随机选择用于跨模态对齐的掩膜特征的图像

全部详细技术资料下载

【技术实现步骤摘要】
关键细节属性自适应掩膜增强的跨模态行人重识别方法

[0001]本专利技术属于计算机视觉，信息检索，多模态计算，涉及一种关键细节属性自适应掩膜增强的跨模态行人重识别方法，特别涉及自适应掩膜增强关键细节属性建模的自然语言行人搜索方法。

技术介绍

[0002]基于自然语言的行人重识别是一个重要且具有挑战性的计算机视觉任务，在安防监控、智能视频分析、人员搜救等领域均具有广泛的应用。目前在提取容易学习的显著属性特征并通过显著属性进行跨模态对齐已经有了大量的研究进展，但是由于相似行人图像的显著属性往往差距较小，单独通过显著属性判断困难，突出的显著属性容易导致模型忽视其他关键细节属性等问题，模型在受到显著属性影响下，对关键细节属性建模的能力较差，难以区分相似的行人图像。对此，我们设计了显著属性掩膜方法，掩膜容易学习的显著属性，强制模型关注关键细节属性。这种强制掩膜操作带来的问题是，模型忽视容易学习的显著属性，仅关注关键细节属性，可能造成属性建模不平衡，影响检索精度。对此，我们设计了合理的方法平衡容易学习的显著属性建模与关键细节属性建模。最终，我们提出的基于关键细节属性自适应掩膜增强的跨模态行人重识别方法能够较好地关注容易学习的显著属性和关键细节属性，检索性能得到了提升。

技术实现思路

[0003]要解决的技术问题
[0004]为了避免现有技术的不足之处，本专利技术提出一种关键细节属性自适应掩膜增强的跨模态行人重识别方法。针对现有技术在跨模态行人重识别任务中遇到的忽视关键细节属性导致难以区分相似行人图像的困难...

【技术保护点】

【技术特征摘要】
1.一种基于关键细节属性自适应掩膜增强的跨模态行人重识别方法，其特征在于步骤如下：步骤1：在图像单模态掩膜支路中和文本单模态掩膜支路中，分别计算得到单模态显著属性掩膜的视觉特征图以及单模态显著属性掩膜的文本特征图在图像端：步骤a1：归一化训练集图像为统一大小，并对训练集图像进行数据增强，提取图像特征，获得初始视觉特征图V；步骤a2：在图像单模态掩膜支路中，计算初始视觉特征图V和全局视觉特征v之间的余弦相似度，获得单模态视觉相似度矩阵S
v
，其中，全局视觉特征v由初始视觉特征图V经最大池化层提取而来；步骤a3：计算单模态视觉相似度矩阵S
v
中相似度最大的个值：其中：h
v
，w
v
分别表示视觉特征图V的高度和宽度，r
m
表示掩膜位置比例参数；将与初始视觉特征图V的选定最大像素位置相对应的所有通道值设置为0，得到单模态显著属性掩膜的视觉特征图在文本端：步骤b1：统一原始训练集句子单词个数，利用现有的词向量嵌入方法将单词编码为词向量，然后，通过1
×
1卷积即文本卷积层获得初始文本特征图T；步骤b2：计算初始文本特征图T和全局文本特征t之间的余弦相似度，获得单模态文本相似度矩阵S
t
，其中，全局文本特征t由初始文本特征图T经最大池化层提取而来；步骤b3：计算单模态文本相似度矩阵S
t
中的相似度最大的个值：其中h
t
，w
t
分别表示文本特征图T的高度和宽度，r
m
为与图像单模态掩膜支路相同的掩膜位置比例参数；将与初始文本特征图T的选定最大单词位置相对应的所有通道值设置为0，得到单模态显著属性掩膜的文本特征图步骤2：在跨模态掩膜支路，计算初始视觉特征图V和初始文本特征图T之间的余弦相似度，并获得跨模态相似度矩阵S
c
；步骤3：根据跨模态相似度矩阵S
c
，分别找到相似度最大的和个值，即为跨模态搜索中认为最显著的视觉和文本属性，通过引入与单模态掩膜支路相同的掩膜位置比例参数r
m
,得到其中，对应于图像中的像素数，对应于文本中的单词数；步骤4：掩膜最显著的区域的特征值，找出S
c
中具有最大相似性的位置，该位置对应于图像中的个像素，并在整个通道中将V中的个像素设置为0，得到跨模态显著属性掩膜的视觉特征图
步骤5：将S
c
中具有最大相似性的位置对应于文...

【专利技术属性】
技术研发人员：牛凯，张艳宁，黄涛，
申请(专利权)人：西北工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人