一种基于注意力机制的行人轨迹预测方法技术

技术编号:29406364 阅读:148 留言:0更新日期:2021-07-23 22:45
本发明专利技术涉及一种基于注意力的行人轨迹预测方法,用于更准确快速地预测行人的未来轨迹。具体包括三个模块,个体注意力编码模块,用于计算行人自身历史轨迹中隐藏向量的相似性并输出个体注意力特征矩阵,以获取在运动过程中行人自身的主要影响因素;社会注意力池化模块,用于接收个体注意力编码模块的计算结果,即个体注意力特征矩阵,计算场景中所有行人的历史轨迹中隐藏向量的相似性并输出综合运动特征矩阵,以获取在运动过程中行人之间的相互影响关系;门控循环单元解码模块,用于接收社会注意力池化模块的计算结果,即综合运动特征矩阵,利用门控循环单元计算并输出行人的未来轨迹坐标;本方法有效地提高了预测精度和速度。

【技术实现步骤摘要】
一种基于注意力机制的行人轨迹预测方法
本专利技术涉及计算机视觉技术和自动驾驶领域,是一种基于注意力机制的行人轨迹预测方法。
技术介绍
行人轨迹预测问题是计算机视觉应用中重要的研究方向之一,研究成果可以广泛应用于行人规避、自动导航、街道规划、自动驾驶等领域。轨迹预测问题可以看成是一种序列问题,即根据场景中行人的历史轨迹预测行人的未来轨迹。因为行人运动灵活多变,并且行人之间的交互运动复杂又抽象,所以行人轨迹预测的主要挑战就是如何准确找到行人的运动规律并对行人之间的交互运动建模。在行人轨迹预测中,大多先进的方法都从两个方面提高预测方法的性能。一种从模拟行人运动规律的角度出发,学习行人的行走规律。另一种是从行人社会交互的角度出发,对场景中所有行人的运动建模。现有的技术缺陷:目前的方法忽略了行人意图对运动的影响,导致不能正确地模拟行人的运动状态;目前的编码模块局限于使用循环神经网络,来编码当前时刻的行人的位置信息。但循环神经网络包含大量的重复计算导致模型运行时间长的问题,并且循环神经网络存在梯度消失和梯度爆炸等问题。因此,设计一种充分考虑本文档来自技高网...

【技术保护点】
1.一种基于注意力的行人轨迹预测方法,该方法根据场景中所有N个行人的过去一段时间的历史轨迹来预测行人的未来轨迹,其特征在于:所述的行人轨迹预测方法包括三个模块,个体注意力编码模块、社会注意力池化模块和门控循环单元解码模块,其中,/n所述个体注意力编码模块,用于计算行人自身历史轨迹中隐藏向量的相似性,并输出个体注意力特征矩阵,以获取行人自身在运动过程中的主要影响因素;/n所述社会注意力池化模块,用于接收个体注意力编码模块的计算结果,即个体注意力特征矩阵,计算场景中所有行人的历史轨迹中隐藏向量的相似性,并输出综合运动特征矩阵,以获取在运动过程中行人之间的相互影响关系;/n所述门控循环单元解码模块,...

【技术特征摘要】
1.一种基于注意力的行人轨迹预测方法,该方法根据场景中所有N个行人的过去一段时间的历史轨迹来预测行人的未来轨迹,其特征在于:所述的行人轨迹预测方法包括三个模块,个体注意力编码模块、社会注意力池化模块和门控循环单元解码模块,其中,
所述个体注意力编码模块,用于计算行人自身历史轨迹中隐藏向量的相似性,并输出个体注意力特征矩阵,以获取行人自身在运动过程中的主要影响因素;
所述社会注意力池化模块,用于接收个体注意力编码模块的计算结果,即个体注意力特征矩阵,计算场景中所有行人的历史轨迹中隐藏向量的相似性,并输出综合运动特征矩阵,以获取在运动过程中行人之间的相互影响关系;
所述门控循环单元解码模块,用于接收社会注意力池化模块的计算结果,即综合运动特征矩阵,利用门控循环单元计算并输出行人的未来轨迹坐标;
所述行人轨迹预测方法的整体步骤包括:
(1)获取一段视频,以相同间隔将视频划分为若干帧,每T帧为一组,获取每组中每个行人的轨迹坐标X={(xt,yt)∈R2|t=1,2,...,T};
(2)将一组中每个行人的轨迹坐标输入到个体注意力编码模块中,利用注意力机制计算得到每个行人的个体注意力特征矩阵,以下称该模块中的注意力机制为个体注意力机制;
(3)输入个体注意力特征矩阵到社会注意力池化模块,利用注意力机制计算行人之间的相互影响,得到综合运动特征矩阵,以下称该模块中的注意力机制为社会注意力机制;
(4)输入综合运动特征矩阵到门控循环单元解码模块,通过门控循环单元计算得到未来n帧的行人轨迹坐标;
(5)重复(2)-(4)的步骤,不断输入一组历史轨迹生成一组未来轨迹。


2.根据权利要求1所述的一种基于注意力的行人轨迹预测方法,其特征在于:所述的个体注意力编码模块具体工作过程如下:
(1)输入一组帧中行人的历史轨迹,即T帧行人的绝对位置坐标,一组帧中包括多个行人的历史轨迹;
(2)将每个人的每一帧的绝对坐标减去上一帧的绝对坐标,共得到T帧行人相对于上一帧位置坐标;
(3)将相对坐标输入到全连接层,得到嵌入特征向量et,t=1,2,...,T,嵌入特征向量et构成该组视频中该行人对应的嵌入特征矩阵,一组视频中每个行人都对应一个嵌入特征矩阵,保留第T帧的嵌入特征向量作为门控循环单元解码模块的初始输入;
(5)通过嵌入特征向量,利用个体注意力机制计算得到每个行人的个体注意力特征矩阵Tim,具体过程如下:
将嵌入特征矩阵分别与三个不同的矩阵相乘,即查询权重矩阵、键权重矩阵和值权重矩阵,分别得到查询矩阵Q、键矩阵K和值矩阵V,并设置注意力机制中的dk;
计算得到个体注意力特征矩阵,具体计算公式如下:



其中,一个行人的个体注意力特征矩阵Tim是由该行人的每帧对应的个体注意力特征向量timt组成的,即Tim={timt|t=1,2,...,T}。


3.根据权利要求1所述的一种基于注意力的行人轨迹预测方法,其特征在于:所述的社会注意力池化模块的具体工作过程如下:
(1)将第一帧所有行人的个体注意力特征向量...

【专利技术属性】
技术研发人员:杨金福闫雪李明爱李亚萍李智勇
申请(专利权)人:北京工业大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1