基于制造技术

技术编号：39773862 阅读：9 留言：0更新日期：2023-12-22 02:22

本发明专利技术公开了基于

全部详细技术资料下载

【技术实现步骤摘要】
基于Transformer的多类别多特征尺度行人重识别方法及系统

[0001]本专利技术属于计算机视觉
，尤其涉及基于
Transformer
的多类别多特征尺度行人重识别方法及系统
。

技术介绍

[0002]行人重识别
(Pedestrian Re
‑
Identification)
是计算机视觉领域的一个关键研究领域，其主要目标是从不同摄像头或时间点捕获的视频或图像中，准确地识别和跟踪同一行人的身份
。
[0003]行人重识别技术在多个领域具有广泛的应用潜力
。
随着城市化的不断发展，监控系统的普及程度越来越高，这使得对行人进行准确的识别和跟踪成为一项至关重要的任务
。
在传统监控系统中，行人的识别和跟踪通常依赖于人工干预，这既费时又容易出错
。
行人重识别技术迎合了这一需求，克服了传统监控系统中的局限性
。
行人重识别技术可以实现自动化
、
高效率和高精度的行人识别，为安全监控
、
智能交通
、
城市规划等领域提供了巨大的潜力
。
在安全监控中，它可以用于追踪和识别犯罪嫌疑人，提高监控系统的效率
。
在智能交通领域，行人重识别有助于改善交通流量管理，提高交通安全性
。
在商场和零售领域，它可以用于优化商场布局，改善购物体验
。
在城市规划中，行人重识别可用于人流...

【技术保护点】

【技术特征摘要】
1.
基于
Transformer
的多类别多特征尺度行人重识别方法，其特征在于，包括以下步骤：
S1、
将行人图像进行大小不同的分割；行人图像分别分割为大分块图像块与小分块图像块，并分别送入两个线性投射层，得到每个行人两种不同的图像特征序列；
S2、
加入多个类别标签；在得到的两个图像特征序列中分别加入相同个数的类别标签
CLS_TOKEN
，并添加相应个数的位置编码
POS_TOKEN
；
S3、
两个图像特征序列各自通过
Transformer
网络，提取行人特征，分别获得相对应的行人图像特征和类别标签权重；
S4、
将通过
Transformer
网络的两个图像特征序列进行动态融合，得到合并后的一组包含分类标签与图像特征的向量；
S5、
将融合后的分类标签输入至全连接层分类器获取行人重识别结果
。2.
根据权利要求1所述的基于
Transformer
的多类别多特征尺度行人重识别方法，其特征在于，所述
S1
中使用对输入图像特征的多尺度提取，对行人图像进行大小不同的分割
。3.
根据权利要求1所述的基于
Transformer
的多类别多特征尺度行人重识别方法，其特征在于，所述
S2
中加入多个类别标签，具体包括如下步骤：
S201、
将图像块经过线性投影层得到相应的图像特征序列；
S202、
在图像特征序列前，加入多个类别标签
CLS_TOKEN
；
S203、
图像特征序列通过
Transformer
网络时，逐渐调整注意力机制中的查询值相互正交，使得
|cos(f1,f2)|
→0，以让不同的类别标签学习到不同的特征；其中，
f1，
f2为同一特征的不同表示
。4.
根据权利要求1所述的基于
Transformer
的多类别多特征尺度行人重识别方法，其特征在于，所述
S3
中
Transformer
网络的构建，具体如下：
Transformer
网络主要由多层堆叠的
Transformer
模块构成，单个
Transformer
层由多头注意力机制
MSA、
层归一化
LN
和多层感知器
MLP
构成，如下述公式所示：
F
l
′
＝
MSA(LN(F
l
‑1))+F
l
...

【专利技术属性】
技术研发人员：熊继平，李正浩，
申请(专利权)人：浙江师范大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人