一种基于Attention-JDE网络的行人多目标跟踪方法技术

技术编号：34528144 阅读：19 留言：0更新日期：2022-08-13 21:19

本发明专利技术提供一种基于Attention

全部详细技术资料下载

【技术实现步骤摘要】
一种基于Attention
‑
JDE网络的行人多目标跟踪方法

[0001]本专利技术涉及图像处理的
，特别是一种基于Attention
‑
JDE网络的行人多目标跟踪方法。

技术介绍

[0002]目标跟踪是计算机视觉领域的研究热点，研究的内容主要为如何在视频序列中检测定位感兴趣的目标，随后利用算法预测这些目标在后续序列中的位置、状态等信息。多目标跟踪(Multiple Object Tracking，MOT)，是指在不需要事先知道目标的外观和数量的情况下，对视频中的多个物体进行识别和跟踪。MOT算法通常需要利用目标检测算法将感兴趣目标框出，然后将目标的ID与这些检测框进行关联，不同的目标应该分配不同的ID，以区分类内对象形成完整的跟踪轨迹。行人多目标跟踪是多目标跟踪的一个分支，是行人行为分析的底层基础，为场景理解、人群行为分析等高级语义任务服务，被广泛应用于智能视频监控、智能交通、无人驾驶等领域。在行人跟踪任务中，首先需要对视频数据中拆分出的每一帧图像进行行人目标的特征提取、处理和分析，然后将这些信息与下一帧中相应的信息进行匹配完成跟踪。
[0003]多目标跟踪的困难主要来源于目标之间的各种遮挡和交叉，这些目标之间通常还会具有高度相似的外观。因此，多数情况下MOT算法的设计都更为复杂，随着深度学习的迅速发展，越来越多的算法开始利用深度学习的表征能力来解决多目标跟踪任务。但是对于复杂场景下的行人目标，遮挡现象发生更为频繁，且行人目标尺度变化大，小尺度目标难以跟踪，这对于深...

【技术保护点】

【技术特征摘要】
1.一种基于Attention
‑
JDE网络的行人多目标跟踪方法，包括将调整分辨率的图片输入至DarkNet
‑
53骨干网络提取三个不同尺度的特征图，其特征在于，还包括以下步骤：步骤1：将三个尺度的所述特征图作为输入，构建特征金字塔；步骤2：将所述特征金字塔的输出分别送入特征增强模块，完成特征精炼，同样输出三个新尺度的新特征图；步骤3：将所述新特征图用于检测行人，生成检测框，利用检测框和对应的嵌入特征进行前后帧相同目标匹配形成轨迹。2.如权利要求1所述的基于Attention
‑
JDE网络的行人多目标跟踪方法，其特征在于，所述DarkNet
‑
53骨干网络使用Mish激活函数，所述Mish激活函数图像为f(x)＝x tanh(ln(1+e
x
))其中，x为输入特征。3.如权利要求2所述的基于Attention
‑
JDE网络的行人多目标跟踪方法，其特征在于，所述特征增强模块由通道注意力模块、空间注意力模块和空间金字塔池化模块组成。4.如权利要求3所述的基于Attention
‑
JDE网络的行人多目标跟踪方法，其特征在于，所述通道注意力模块的输入为前一次卷积的输出，表示为其中，表示通道数为C且宽为W高为H的输出维度。5.如权利要求4所述的基于Attention
‑
JDE网络的行人多目标跟踪方法，其特征在于，所述通道注意力模块的工作方法为：步骤201：利用最大池化和平均池化获取全局的通道特征分布信息，分别表示为和其中，表示通道数为C且宽高都为1的输出维度，为通过最大池化获得的通道特征分布信息，为通过平均池化获得的通道特征分布信息；步骤202：将上述两个特征向量经过含有一个隐藏层的多层感知机MLP；步骤203：将得到的特征向量相加并经过一次sigmoid操作σ得到最终的通道注意力权重M
C
(F)；步骤204：通过M
C
(F)与原输...

【专利技术属性】
技术研发人员：何宁，晏康，
申请(专利权)人：北京联合大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人