一种基于注意力机制和尺度融合的检测跟踪一体化算法研究制造技术

技术编号：40407396 阅读：2 留言：0更新日期：2024-02-20 22:28

本发明专利技术针对现有目标跟踪算法出现id频繁切换，目标丢失，轨迹中断等问题，提出一种基于注意力机制和尺度融合的检测跟踪一体化算法，本发明专利技术通过在特征提取网络处添加双重注意力机制和多尺度融合模块来增强复杂场景以及不同距离和角度下行人的检测能力，具体的，本发明专利技术设计了一种多尺度注意力融合网络，通过深层网络提取图片不同尺度特征，构建四级尺度特征图，结合双重注意力机制筛选关键信息，融合多级尺度特征，增强关键信息，完成增强信息提取，采用多级检测器，对多尺度目标进行联合检测。最终联合检测跟踪多帧目标，对不同帧目标进行相似度关联，构建目标轨迹，动态管理目标轨迹并叠加视频流输出。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于图像处理领域。

技术介绍

1、在当今世界，计算机视觉的快速发展已经改变了我们对视觉感知和交互的理解。视觉检测和跟踪一体化算法作为计算机视觉的关键分支，不仅在工业自动化、机器人技术、智能交通等领域有着广泛应用，还在日常生活中变得愈加不可或缺。然而，现实世界中的复杂环境对这些算法提出了极大的挑战，如光照变化、目标遮挡、背景混乱、目标形状和尺寸的多样性等。因此，复杂环境下的视觉检测跟踪一体化算法已成为研究人员和工程师们不断追求的目标，它要求在混乱和动态的情境中实现对目标的稳定检测和跟踪。

2、近年来，多目标跟踪(mot)得到了广泛的研究，其目的是跨视频帧关联检测到的目标，以获得整个运动轨迹。近年来出现了各种跟踪算法，从图聚类方法到图神经网络，这些算法可以跨帧和对象聚合信息；从按检测模式跟踪到联合检测和跟踪，以提高多帧的检测性能；从卡尔曼滤波到递归神经网络(rnn)和长短时记忆(lstm)，以提高与运动线索的关联性能。随着跟踪算法的发展，mot可以应用于许多任务，例如交通流分析、人类行为预测和姿势估计、自主驾驶辅助，甚至用于水下动物数量估计。

3、传统的目标跟踪算法主要分为一阶段跟踪(dft)和两阶段跟踪(dbt)。两阶段跟踪需要对视频的每一帧进行检测然后将其与轨迹关联，如bewley等人提出的sort方法，主要是利用卡尔曼滤波进行预测，将预测的结果利用匈牙利算法进行匹配，但是sort算法只使用iou匹配进行识别和匹配没有使用特征，这样会导致在行人重合度较高的时候发生id切换。wojke等人提出了d

4、尽管，上述算法流程已在统一识别领域取得显著的sota效果，但是，行人的运动并非都是线性的，对于一些非线性运动的行人，传统的算法可能会出现id频繁切换，目标丢失，轨迹中断等问题。

技术实现思路

1、为了解决上述问题，我们提出了一种新的多行人跟踪算法，通过在yolox主干特征提取网络处添加双重注意力机制和多尺度融合模块来增强行人的检测能力，并对视频流对象进行目标关联追踪检测，实现了多尺度高准确度的行人跟踪检测一体化算法。综上，本专利技术所提算法步骤如下：

2、步骤一：动态在训练集上进行多种数据集合增强，融合数据集多状态信息

3、步骤二：通过深层网络提取图片不同尺度特征，构建四级尺度特征图，结合双重注意力机制筛选关键信息。

4、步骤三：融合多级尺度特征，增强关键信息，完成增强信息提取，采用多级检测器，对多尺度目标进行联合检测。

5、步骤四：多帧目标联合检测跟踪，对不同帧目标进行相似度关联，构建目标轨迹，动态管理目标轨迹并叠加视频流输出。

6、步骤五：与现有的先进算法相比，该方法的准确性和实时性得到了有效的提升。

本文档来自技高网...

【技术保护点】

1.一种基于注意力机制和尺度融合的检测跟踪一体化算法，包括以下步骤：

2.如权利要求1所述方法，其特征在于，步骤2引入多尺度网络构建的思想，在网络中增加了多个CBS模块用于获得不同尺度的特征并在步骤3中进行了两阶段的特征提取，实现信息增强的目的，同时赋予模型一定的较少样本学习能力；具体地，本专利技术针对目标跟踪检测任务网络，设计一种多尺度融合网络，提取了不同层级的图像特征，实现了多尺度目标检测跟踪。

3.如权利要求1所述方法，其特征在于，步骤2引入双重注意力机制，使得模型学习不同通道以及不同像素的注意力，以此感知图像全局信息，并将这些信息作为一种隐性知识组织起来；通过注意力机制来感知各个通道以及像素的注意力，具体的，本专利技术提出了利用CBAM模块对权利要求2中构建的多尺度网络进一步进行信息增强，获取全局信息，得到更细粒度的特征，将注意力机制嵌入模型，降低了信息粒度不足导致的id频繁切换，目标丢失，轨迹中断等问题发生的概率。

【技术特征摘要】

1.一种基于注意力机制和尺度融合的检测跟踪一体化算法，包括以下步骤：

2.如权利要求1所述方法，其特征在于，步骤2引入多尺度网络构建的思想，在网络中增加了多个cbs模块用于获得不同尺度的特征并在步骤3中进行了两阶段的特征提取，实现信息增强的目的，同时赋予模型一定的较少样本学习能力；具体地，本发明针对目标跟踪检测任务网络，设计一种多尺度融合网络，提取了不同层级的图像特征，实现了多尺度目标检测跟踪。

3...

【专利技术属性】
技术研发人员：江雪婷，贾海涛，焦昊良，黄婧，陈泓秀，张植尹，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人