【技术实现步骤摘要】
基于Transformer的多类别多特征尺度行人重识别方法及系统
[0001]本专利技术属于计算机视觉
,尤其涉及基于
Transformer
的多类别多特征尺度行人重识别方法及系统
。
技术介绍
[0002]行人重识别
(Pedestrian Re
‑
Identification)
是计算机视觉领域的一个关键研究领域,其主要目标是从不同摄像头或时间点捕获的视频或图像中,准确地识别和跟踪同一行人的身份
。
[0003]行人重识别技术在多个领域具有广泛的应用潜力
。
随着城市化的不断发展,监控系统的普及程度越来越高,这使得对行人进行准确的识别和跟踪成为一项至关重要的任务
。
在传统监控系统中,行人的识别和跟踪通常依赖于人工干预,这既费时又容易出错
。
行人重识别技术迎合了这一需求,克服了传统监控系统中的局限性
。
行人重识别技术可以实现自动化
、
高效率和高精度的行人识别,为安全监控
、
智能交通
、
城市规划等领域提供了巨大的潜力
。
在安全监控中,它可以用于追踪和识别犯罪嫌疑人,提高监控系统的效率
。
在智能交通领域,行人重识别有助于改善交通流量管理,提高交通安全性
。
在商场和零售领域,它可以用于优化商场布局,改善购物体验
。
在城市规划中,行人重识别可用于人流 ...
【技术保护点】
【技术特征摘要】
1.
基于
Transformer
的多类别多特征尺度行人重识别方法,其特征在于,包括以下步骤:
S1、
将行人图像进行大小不同的分割;行人图像分别分割为大分块图像块与小分块图像块,并分别送入两个线性投射层,得到每个行人两种不同的图像特征序列;
S2、
加入多个类别标签;在得到的两个图像特征序列中分别加入相同个数的类别标签
CLS_TOKEN
,并添加相应个数的位置编码
POS_TOKEN
;
S3、
两个图像特征序列各自通过
Transformer
网络,提取行人特征,分别获得相对应的行人图像特征和类别标签权重;
S4、
将通过
Transformer
网络的两个图像特征序列进行动态融合,得到合并后的一组包含分类标签与图像特征的向量;
S5、
将融合后的分类标签输入至全连接层分类器获取行人重识别结果
。2.
根据权利要求1所述的基于
Transformer
的多类别多特征尺度行人重识别方法,其特征在于,所述
S1
中使用对输入图像特征的多尺度提取,对行人图像进行大小不同的分割
。3.
根据权利要求1所述的基于
Transformer
的多类别多特征尺度行人重识别方法,其特征在于,所述
S2
中加入多个类别标签,具体包括如下步骤:
S201、
将图像块经过线性投影层得到相应的图像特征序列;
S202、
在图像特征序列前,加入多个类别标签
CLS_TOKEN
;
S203、
图像特征序列通过
Transformer
网络时,逐渐调整注意力机制中的查询值相互正交,使得
|cos(f1,f2)|
→0,以让不同的类别标签学习到不同的特征;其中,
f1,
f2为同一特征的不同表示
。4.
根据权利要求1所述的基于
Transformer
的多类别多特征尺度行人重识别方法,其特征在于,所述
S3
中
Transformer
网络的构建,具体如下:
Transformer
网络主要由多层堆叠的
Transformer
模块构成,单个
Transformer
层由多头注意力机制
MSA、
层归一化
LN
和多层感知器
MLP
构成,如下述公式所示:
F
l
′
=
MSA(LN(F
l
‑1))+F
l
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。