一种使用频谱信息的行人轨迹预测方法技术

技术编号：40029009 阅读：13 留言：0更新日期：2024-01-16 17:56

本发明专利技术公开了一种使用频谱信息的行人轨迹预测方法，属于行人轨迹预测领域。首先获取行人的历史轨迹视频，得到场景中每个行人的历史轨迹信息，并对行人的历史轨迹信息建模，得到行人历史运动模式特征的编码结果以及交互和历史信息编码结果。然后由CVAE模型对行人的未来轨迹的多模态进行建模，在训练的时候CVAE的潜变量分布由对未来轨迹的编码产生，在测试的时候潜变量分布由对历史轨迹的编码产生。将行人的历史和交互信息编码结果作为输入，和CVAE模型的潜变量进行拼接，并使用GRU作为解码器对行人未来轨迹进行解码，得到行人的预测运动轨迹。最后构建损失函数进行参数迭代，直至得到最终的行人运动轨迹的预测结果。本发明专利技术预测结果更加准确，且效率更高。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于行人轨迹预测领域，涉及行人的运动模式信息提取、行人运动意图分析，具体涉及一种使用频谱信息的行人轨迹预测方法。

技术介绍

1、行人轨迹预测问题是指在给定行人的历史运动状态后预测行人在未来一段时间之内的可能轨迹。随着高级别自动驾驶和机器人导航技术的发展，轨迹预测算法的进一步研究也得到了重视，是重点研究方向之一。

2、近来汽车产业由电动化向智能化快速转型，辅助驾驶系统逐渐成为标配。行人轨迹预测算法作为关键的核心技术，在自动驾驶系统中有至关重要的作用。为了使自动驾驶车辆和机器人等在与人交互的复杂场景中安全通行，防止机器人和行人碰撞或产生交通堵塞，机器人需要判断其周边行人的历史运动数据得到未来的运动趋势、方向、速度信息，然后再规划自身的未来运动。此外，在城市公共安全的监视系统中也需要轨迹预测模块来跟踪分析行人的运动和行为，从而对潜在发生的安全和违规行为进行预警。因此，行人轨迹预测问题具有现实意义，且比较复杂，因此具有比较高的研究价值。

3、行人轨迹预测是一项基础研究内容，其问题的复杂性主要体现在两个方面：

4、1.需要提取行人历史轨迹中的运动模式信息，包括行人的运动方向、运动意图、运动习惯偏好等。行人在不同时间跨度下的运动特征分别代表了这个行人的运动模式的不同组成部分，所以同时建模行人的运动模式中的长时和短时分量是一项很有挑战性的任务。

5、2.行人的行动过程中会受到场景中其他行人和环境对自身运动轨迹的影响，需要对交互信息(例如和其他行人的合理运动距离、其他人对自身造成的影响会

6、目前，现有的行人轨迹预测方法的流程一般可以分为以下的三个阶段：

7、1.根据行人的历史运动信息对行人运动状态信息编码。

8、2.对第一阶段编码的行人运动状态进行交互建模。对行人周围的场景信息进行编码。

9、3.根据第一、第二阶段的编码结果进行解码，预测未来轨迹。

10、近几年有许多基于深度学习的方法被提出，来改进上述流程。其中与本专利技术相关的技术主要为：(1)social-stgcnn模型；(2)v^2net模型。两个模型可以分别参考如下文献1和2。

11、(1)social-stgcnn模型，通过构建时空图网络，对行人运动的特性与交互进行建模。

12、该模型的创新之处在于，并未使用常见的长短期记忆神经网络(lstm)，而是别具一格地运用卷积神经网络(cnn)来获取时间维度的特征。这种设计无需迭代，因而具有更高的运行效率。同时本方法利用图卷积神经网络实现行人交互建模，然后利用时空图对轨迹进行编码，最后利用外推卷积神经网络进行解码得到未来轨迹。

13、现有方法缺点与不足：把历史轨迹简单的编码为时间序列然后用cnn来提取历史的运动模式。本方法使用cnn来提取时间序列特征，cnn受到其感受野大小的影响只能捕捉到局部的时间序列信息，而不能提取长程的依赖关系。此外cnn缺乏对输入数据的空间不变性的识别能力，不利于建模时间序列。行人历史轨迹的运动模式在不同时间尺度的运动中都有体现，可以有效的用频谱中的频率分量表示。

14、(2)v^2net模型，是一种全新双阶段模型，通过利用历史轨迹的频域表示进行建模和预测。

15、该模型的创新之处在于，并未把历史轨迹作为时间序列输入模型，而是使用离散傅里叶变换(discrete fourier transform)来获得了时间序列的频谱特征。这种方法可以提取出轨迹的频谱，频谱中的不同频段可以表现出行人的粗糙运动趋势和精细运动变化，是一种新的建模思路。同时本方法利用transformer对历史轨迹的频谱进行编码，在第一阶段得到粗糙的频谱。最后在第二阶段对频谱进行插值，利用transformer解码得到精细的最终轨迹。

16、现有方法缺点与不足：本方法虽然提出了使用傅里叶变换来提取轨迹的频域表示，但是没有利用频域信息的特征，建模不同频率分量之间的相互作用。v^2net模型利用了transformer编码器和解码器模块编码dft的输出频谱来获得行人的历史信息的编码和解码输出未来轨迹，带来了大量不必要的计算开销，同时双阶段的网络模型所需的计算量更大，时间更长。没有显式的考虑环境或者附近行人对行人未来轨迹的影响。对于频域特征应当用滤波器提取和结合多种频率分量之间的交互。

17、参考文献：

18、[1]mohamed a,qian k,elhoseiny m,et al.social-stgcnn:asocial spatio-temporal graph convolutional neural network for human trajectory prediction[c]//proceedings of the ieee/cvf conference on computer vision and patternrecognition.2020:14424-14432.

19、[2]wong,conghao,et al."view vertically:ahierarchical network fortrajectory prediction via fourier spectrums."european conference on computervision.cham:springer nature switzerland,2022.

技术实现思路

1、针对现有对行人轨迹的建模方法不能直接的建模出行人历史运动中的运动模式，不能充分提取行人历史轨迹中的信息的问题，本专利技术提出了一种使用频谱信息的行人轨迹预测方法，通过多频率结合编码器(multi-frequency combination encoder,mfc)和频率交互编码器(frequency interaction encoder,fi)两个阶段的历史轨迹建模和环境交互信息建模，使行人的历史信息建模更合理，利用更充分，达到提升轨迹预测精度的效果，具有更高运行效率的优势，对行人历史轨迹建模分析提供另一个全新思路。

2、所述使用频谱信息的行人轨迹预测方法，包括以下步骤：

3、步骤一，获取行人的历史轨迹视频，得到场景中每个行人的历史轨迹信息；

4、在行人的历史轨迹视频中，通过目标跟踪算法得到二维的行人位置坐标，进而得到场景中每个行人在th时间跨度内的历史轨迹信息

5、行人i每个时刻的历史轨迹信息包括行人的位置速度加速度

6、步骤二，对本文档来自技高网...

【技术保护点】

1.一种使用频谱信息的行人轨迹预测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种使用频谱信息的行人轨迹预测方法，其特征在于，步骤二中所述对行人历史轨迹信息进行预处理，具体过程为：

3.根据权利要求1所述的一种使用频谱信息的行人轨迹预测方法，其特征在于，步骤四所述行人未来轨迹信息的编码结果为：

4.根据权利要求1所述的一种使用频谱信息的行人轨迹预测方法，其特征在于，步骤六中所述行人的预测运动轨迹的迭代过程为：

5.根据权利要求1所述的一种使用频谱信息的行人轨迹预测方法，其特征在于，步骤七中所述的网络参数包括GRU网络、空洞卷积网络和多层感知机的参数。

【技术特征摘要】

1.一种使用频谱信息的行人轨迹预测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种使用频谱信息的行人轨迹预测方法，其特征在于，步骤二中所述对行人历史轨迹信息进行预处理，具体过程为：

3.根据权利要求1所述的一种使用频谱信息的行人轨迹预测方法，其特征在于，步骤四所述行人未来...

【专利技术属性】
技术研发人员：刘绍华，朱英龙，
申请(专利权)人：北京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人