一种基于多注意力模块的用于密集人群运动追踪的方法技术

技术编号:32785364 阅读:15 留言:0更新日期:2022-03-23 19:44
一种基于多注意力模块的用于密集人群运动追踪的方法,包括以下步骤:S1.选取基本模型:选取通过特征模板和高斯混合模型完成特征提取任务的密集人群追踪框架为基本模型;S2.搭建多注意力模块,在基本模型的特征提取部分(即,特征模板)中搭建多注意力模块,以优化特征模板所提取的特征,从而产生高质量的注意力特征;S3.采用多注意力模块改进基本模型。本发明专利技术的基于多注意力模块的用于密集人群运动追踪的方法可以获得目标个体的精确位置,提高了检测目标个体位置的准确率。检测目标个体位置的准确率。检测目标个体位置的准确率。

【技术实现步骤摘要】
一种基于多注意力模块的用于密集人群运动追踪的方法


[0001]本专利技术属于计算机视觉领域,更具体地涉及一种基于多注意力模块的用于密集人群运动追踪的方法。

技术介绍

[0002]作为在计算机视觉领域的重要研究方向,密集人群场景下的目标运动追踪问题不仅在学术界是一个很大的挑战,在工业界也是一个具有重要应用价值的方向。针对密集人群运动追踪问题,主要的解决思路是先把一张包含密集人群场景的视频帧输入到用于特征提取的算法模型中,该算法模型也会根据提取到的行人特征,把每个目标个体的位置都检测出来,最后从一段连续的视频序列中识别出每个目标个体的运动轨迹。
[0003]在过去,很多不同类型的方法都被用于解决密集人群运动追踪问题。其中,一部分模型被用于从视频帧中提取颜色和边界等低级特征,用这样的方法确定目标个体的位置;此外,也有一部分模型被创造出来去获取视频帧中目标个体的语义信息和时序信息等高级特征,进而更好地追踪到目标个体在视频中的运动轨迹。然而,随着实际生活中很多场所的人群密度不断增加,传统的特征提取模型已经不足以在高密度人群中准确追踪目标个体。在这种情况下,深度学习(Deep Learning)模型由于具有强大的特征提取能力而被使用到密集人群运动追踪的挑战中。但是深度学习模型不仅需要配置高的设备去运行,其运算处理时间也很长。而在实际应用中,用于数据处理的模型都是需要实时对数据进行处理,所以即使深度学习模型在物体检测等任务中能达到很高精度,但它并不适用于密集人群运动追踪的实际应用。
[0004]现阶段,注意力机制(Attention Mechanism)由于其有效的特征提取能力而被广泛应用于计算机视觉领域,以此去获取目标特征。
[0005]在原来用于密集人群运动追踪的模型中,其流程是先使用特征模板作为卷积核与被输入的视频帧进行一次卷积操作,从而生成特征图。接着,该特征图中的某个特定区域会被提取出来与高斯混合模型中的高斯核进行运算,以此计算出目标个体所在的位置。当所有目标个体的位置都被预测后,运动趋势算法则根据连续帧中目标个体的位置去预测其运动轨迹。
[0006]但是,现阶段主要存在的问题及解决问题的难度是:在特征提取步骤中,仅仅使用特征模板与被输入视频帧进行一次卷积操作不足以获取高质量特征。这种做法很容易出现错误识别的情况,例如某个目标个体的特征没有被提取而这个目标被错误地当成是背景。
[0007]因此,需要一种具有较高检测准确率的适用于密集人群运动追踪的方法。

技术实现思路

[0008]本专利技术提供了一种基于多注意力模块的用于密集人群运动追踪的方法,可以获得目标个体的精确位置,提高了检测目标个体位置的准确率。
[0009]本专利技术的技术方案如下:
[0010]一种基于多注意力模块的用于密集人群运动追踪的方法,包括以下步骤:S1.选取基本模型:基本模型包括特征模板和高斯混合模型;S2.搭建多注意力模块;S3.采用多注意力模块改进基本模型。
[0011]优选的,在上述基于多注意力模块的用于密集人群运动追踪的方法中,在步骤S2中,在多注意力模块中设置两次注意力机制操作:第一次注意力机制操作用于进一步提取目标个体的特征;第二次注意力机制操作用于把输入到多注意力模块的特征图与经优化后的第一次注意力机制操作的特征图相融合。
[0012]优选的,在上述基于多注意力模块的用于密集人群运动追踪的方法中,在步骤S3中,还包括将已搭建的多注意力模块加入到基本模型的特征提取部分中。
[0013]优选的,在上述基于多注意力模块的用于密集人群运动追踪的方法中,在步骤S3中,特征模板从被输入的视频帧中获取特征并生成特征图,特征图被输入到上述多注意力模块中进一步完成特征提取及优化任务生成已优化的特征图;多注意力模块所输出的已优化特征图输入到人群运动轨迹预测部分中进行算法处理,输出包含目标个体运动轨迹的结果图。
[0014]优选的,在上述基于多注意力模块的用于密集人群运动追踪的方法中,多注意力模块所输出的已优化特征图,则被输入到至高斯混合模型中,从而获取包含目标个体位置的高斯分布特征图,该特征图会作为已优化的输出结果从特征提取部分输出并传送至人群运动轨迹预测部分。
[0015]根据本专利技术的技术方案,产生的有益效果是:
[0016]与现有的依赖提取低级特征如颜色或轮廓的传统算法相比较,本专利技术通过加入多注意力模块去优化经特征模板所提取到的特征,从而产生高质量的注意力特征。该注意力特征能让高斯混合模型更好地检测出目标个体的位置,让运动趋势预测算法更准确预测目标个体的运动轨迹。
[0017]与现有的通过深度学习模型所搭建成的框架相比较,本专利技术能以更高速度获取视频帧特征并输出结果。由于深度学习的运算量较大,尽管它在很多识别和检测的任务中能输出高准确度的结果,但其处理数据所花费的时间比较长,不适用于实际场景的应用。然而,本专利技术处理数据所需的时间较短,因此其更适合应用到实际场景中
[0018]为了更好地理解和说明本专利技术的构思、工作原理和专利技术效果,下面结合附图,通过具体实施例,对本专利技术进行详细说明如下:
附图说明
[0019]为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。
[0020]图1是本专利技术的基于多注意力模块的用于密集人群运动追踪的方法的流程图;
[0021]图2是本专利技术方法涉及的算法流程图;
[0022]图3是包含多注意力模块的特征提取部分的流程图;
[0023]图4是本专利技术方法涉及的多注意力模块的两次注意力机制操作的示意图。
具体实施方式
[0024]为使本专利技术的目的、技术方法及优点更加清晰,下面结合附图及具体实例做进一步的详细说明。这些实例仅仅是说明性的,而并非对本专利技术的限制。
[0025]为了把该多注意力模块应用于密集人群运动追踪任务中,本专利技术在一个结合特征模板、高斯混合模型和运动趋势预测算法的框架模型基础上,在特征提取部分中加入多注意力模块去提高特征模板所提取的特征质量,从而产生高质量特征图。通过把这些高质量特征图输入到高斯混合模型,可以得到密集人群中目标个体的准确位置,而这些准确位置有助于提高运动趋势预测的准确率。通过使用包含多个注意力机制的模块在视频帧中提取更可靠的行人特征。通过这种策略,可以改善特征模板和高斯混合模型等传统方法只能提取低质量特征这个缺点,从而更好地识别密集人群中每个目标的位置,进而完成运动追踪任务。
[0026]图1是本专利技术的基于多注意力模块的用于密集人群运动追踪的方法的流程图,如图1所示,包括以下步骤:
[0027]S1.选取基本模型:基本模型包括特征模板和高斯混合模型。为了能把本专利技术应用于密集人群的实际场景中,本专利技术选取了通过特征模板和高斯混合模型完成特征提取任务的密集人群追踪框架为基本模型。此外,选取该模型的另一个原因是其运算量较小,在实际场景中处理数据的响应效率比较高,能达到本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多注意力模块的用于密集人群运动追踪的方法,其特征在于,包括以下步骤:S1.选取基本模型:所述基本模型包括特征模板和高斯混合模型;S2.搭建多注意力模块;以及S3.采用多注意力模块改进基本模型。2.根据权利要求1所述的基于多注意力模块的用于密集人群运动追踪的方法,其特征在于,在步骤S2中,在所述多注意力模块中设置两次注意力机制操作:第一次注意力机制操作用于进一步提取目标个体的特征;第二次注意力机制操作用于把输入到多注意力模块的特征图与经优化后的第一次注意力机制操作的特征图相融合。3.根据权利要求1所述的基于多注意力模块的用于密集人群运动追踪的方法,其特征在于,在步骤S3中,还包括将已搭建的多注意力模块加入到所述基本模型的特征提取...

【专利技术属性】
技术研发人员:黎俊良张世雄魏文应陶键源
申请(专利权)人:广东博华超高清创新中心有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1