一种行人轨迹预测模型的构建方法技术

技术编号:36122572 阅读:19 留言:0更新日期:2022-12-28 14:28
本发明专利技术公开了一种行人轨迹预测模型的构建方法,属于行人轨迹预测领域。一种行人轨迹预测模型的构建方法,包括以下步骤:构建时空注意力图卷积网络模型;输入时间嵌入,并通过添加时间位置编码向量进行时间标记;输入空间嵌入,并通过空间位置编码向量进行行人位置标记;采用注意力机制计算注意矩阵;从时间图输入中获得表示时间交互的时间交互图,从空间图形输入中获得了表示空间交互的空间交互图;通过图卷积网络聚合最终时间相互作用矩阵和最终空间相互作用矩阵,并学习轨迹表示;通过数据集对模型进行训练,获得最终的行人轨迹预测模型。模型。模型。

【技术实现步骤摘要】
一种行人轨迹预测模型的构建方法


[0001]本专利技术涉及行人轨迹预测领域,具体涉及一种行人轨迹预测模型的构建方法。

技术介绍

[0002]预测行人轨迹需要对图1所示的两个关键维度进行建模:(1)时间维度,其中我们对行人过去轨迹中的位置和速度等有效信息进行建模,以捕捉时间相关性,然后预测行人的下一个位置;(2)空间维度,其中我们为同时在同一场景中的行人构建空间有向图,以获得行人之间的空间交互。通过空间交互预测行人轨迹可以避免碰撞。
[0003]行人轨迹预测是自动驾驶仪中的一项关键技术,由于行人之间的复杂交互以及每个行人未来行动的不确定性,这项技术仍然很困难。以往的工作主要依靠行人的位置关系来独立地建模时间依赖性或空间交互,这不足以代表真实情况下的复杂情况。行人轨迹预测的一个主要挑战是与时间依赖性和空间交互耦合的建模。因为行人的空间和时间动态相互紧密依赖。具体地说,现有技术总是使用时间模型来独立地总结每个行人的随时间变化的特征,以预测行人的下一个位置,或者使用空间模型对每个行人的空间交互进行建模,以预测步行轨迹。这些方法是次优的,因为没有综合考虑行人在时间维度和空间维度上的信息。

技术实现思路

[0004]针对现有技术的不足,本专利技术提出了一种行人轨迹预测模型的构建方法。
[0005]本专利技术的目的可以通过以下技术方案实现:
[0006]一种行人轨迹预测模型的构建方法,包括以下步骤:
[0007]构建时空注意力图卷积网络模型;
[0008]输入时间嵌入,并通过添加时间位置编码向量进行时间标记;输入空间嵌入,并通过空间位置编码向量进行行人位置标记;
[0009]采用注意力机制计算注意矩阵;
[0010]从时间图输入中获得表示时间交互的时间交互图,从空间图形输入中获得了表示空间交互的空间交互图;
[0011]通过图卷积网络聚合最终时间相互作用矩阵和最终空间相互作用矩阵,并学习轨迹表示;
[0012]通过数据集对模型进行训练,获得最终的行人轨迹预测模型。
[0013]可选地,所述数据集包括ETH数据集和UCY数据集。
[0014]可选地,所述空间图表示场景中所有行人的空间交互,所述时间图表示每个行人的完整轨迹。
[0015]可选地,通过位置编码器层将注意力机制给予输入/输出顺序数据中的顺序概念。
[0016]上述的行人轨迹预测模型的构建方法所构建的预测模型。
[0017]本专利技术的有益效果:
[0018]1本专利技术所构建的行人预测模型时间图嵌入和空间图嵌入与位置编码机制相结合,以解决注意模块对位置不敏感的问题。GCN用于耦合时间特征和空间特征,以防止关键时空信息的丢失。
[0019]2本专利技术所构建的行人预测模型提供了一种新的解码器,其层数比TCNs卷积层少,能够避免传统的RNN受梯度消失和高计算成本的影响的缺陷。
[0020]3本专利技术的实施例中在完善的行人数据集ETH和UCY上评估了本专利技术的方法。在ETH/UCY上,本实施例验证了本专利技术所构建的方法在过去4年中的表现优于最先进的行人轨迹预测方法,并取得了显著的性能改进(平均位移误差为10%,最终位移误差为21%)。本专利技术的实施例中进一步进行了广泛的消融研究,以证明STAGCN优于各种时间和空间模型组合。
附图说明
[0021]下面结合附图对本专利技术作进一步的说明。
[0022]图1现有技术中行人轨迹预测的两个关键维度;
[0023]图2为本申请的时空注意力图卷积网络;
[0024]图3为本申请的行人并排行走、相遇和转弯场景中轨迹的可视化;
[0025]图4为本申请的行人转弯和静止场景中轨迹的可视化。
具体实施方式
[0026]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。
[0027]本专利技术的实施例中,公开了一种用于行人轨迹预测的时空注意力图卷积网络(STAGCN)。如图2所示,我们使用注意机制来获得时间依赖性和空间交互。在使用注意机制之前,我们在时间图嵌入和空间图嵌入中添加了位置编码,以解决注意机制对输入元素序列不敏感的问题。两层图卷积网络可以聚合时间依赖性和空间交互并学习轨迹表示。通过将高斯噪声添加到轨迹表示来获得最终轨迹表示。给定最终的轨迹表示,我们可以使用解码器在时间维度上预测双高斯分布的参数,用于未来的轨迹点预测。
[0028]本专利技术的实施例中,公开了一种行人轨迹预测模型的构建方法,包括以下步骤;
[0029]初步构建模型的公式,假设在一段时间内一个场景中有N个行人t∈{1,

,T
obs
,

,T
pred
}。在时间步t,行人i的位置由一对二维笛卡尔坐标表示然后给出行人的位置i=1,2,

,N,在时间步长t=1,

,T
obs
,对从时间步长预测未来轨迹的问题感兴趣t=T
obs
+1tot=T
pred

[0030]给定输入轨迹和其中d表示2D笛卡尔坐标的维度,N表示时间步长t处的所有行人,T
obs
表示前8个时间步长。构造了一系列时间图来表示每个行人的完整轨迹。从时间步长t=1到t=T
obs
,每个坐标被连接以形成时间图G
tem
(V
i
,U
i
),表示G
tem
的节点,并且的属性是时间步长t处第
i个行人的坐标i个行人的坐标表示G
tem
的边,其中表示节点是否连接,它们表示为1,否则表示为0。由于时间依赖性,U
i
中的元素初始化为1(Shi等人,2021)。为了让注意力机制处理输入,通过一个简单的完全连接层将它们嵌入到更高的D维空间中:
[0031]e
tem
=φ(G
tem
,W
etem
)
ꢀꢀꢀꢀ
(1)
[0032]式中,φ(.)表示线性变换,是时间图嵌入,是时间图嵌入权重。
[0033]空间图表示场景中所有行人的空间交互。在时间步t,所有行人的坐标被连接以形成空间图G
spa
(V
t
,U
t
)。是G
spa
的顶点集,代表时间步长t处的所有行人。的初始值是观察到的坐标位置的初始值是观察到的坐标位置的初始值是观察到的坐标位置是G
spa
的边集,其中表示节点表示节点是连接的(表示为1)还是断开的(表示0)。U
t
初始化为填充1的上三角矩阵本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种行人轨迹预测模型的构建方法,其特征在于,包括以下步骤:构建时空注意力图卷积网络模型;输入时间嵌入,并通过添加时间位置编码向量进行时间标记;输入空间嵌入,并通过空间位置编码向量进行行人位置标记;采用注意力机制计算注意矩阵;从时间图输入中获得表示时间交互的时间交互图,从空间图形输入中获得了表示空间交互的空间交互图;通过图卷积网络聚合最终时间相互作用矩阵和最终空间相互作用矩阵,并学习轨迹表示;通过数据集对模型进行训练,获得最终的行人轨迹预测模型。2.根据权利要求1所述的行人轨迹预测模型的构建方法,其特征在于,所述数据集包括ETH数据集和UCY数据集。3.根据权利要求1所述的行人轨迹...

【专利技术属性】
技术研发人员:王斌段安盛
申请(专利权)人:上海师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1