一种基于时空特征的行人路径预测方法技术

技术编号:39835712 阅读:7 留言:0更新日期:2023-12-29 16:19
本发明专利技术公开了一种基于时空特征的行人轨迹预测方法

【技术实现步骤摘要】
一种基于时空特征的行人路径预测方法


[0001]本专利技术属于人工智能领域,具体地说,涉及一种基于时空特征的行人路径预测方法


技术介绍

[0002]当前机器学习按照学习模式的不同,基本实现方法不同,大体上能够分为三大类,即:有监督学习
Supervised Learning(
基于拥有样本标签的数据
)
,无监督学习
Unsupervised Le arning(
训练数据中不存在事先人工标记的标签
)
和强化学习
(
一种基于马尔可夫决策模型的代理

环境互动探索模型
)。
其中,强化学习
(Reinforcement Learning)
作为机器学习的一种实现,已经在越来越多决策问题领域发挥至关重要的作用,并且在一些策略游戏中也已经展现了出色的成绩,如
DeepMind
公司推出的
AlphaGo、AphaZero
等围棋机器人系列;同时在智慧城市交通信号控制等研究中也表现出了巨大潜力,基于传统的强化学习和深度神经网络的发展,深度强化学习
(Deep Reinforcement Learning)
也随之诞生,基于目前机器学习前沿的深度学习算法所具备的优异的特征感知能力,将其与传统强化学习优秀的多步连续问题中的决策能力相合并,开拓了新的天地;接下来,为了解决在奖励函数很难完整定义等场景问题,研究人员又提出了逆向强化学习
>(Inverse Reinforcement Learning)
,通过
Agent
代理与环境交互过程的数据中,尽可能学习到一个近似最优的专家奖励函数,从而指导策略更新,学到一个近似专家的策略,最终给出预测结果;而在
2016
年,
GAIL(Generative Adversarial Imitation Learning)
的作者证明了该算法在实施上与
Inverse RL
的等效性,同时在具体实现过程中通过减少内层冗余的强化学习过程,极大地节省了计算资源,是一个优秀的模拟学习的算法

[0003]现有技术中也提出了部分行人路径预测方法,例如:
[0004]现有技术一,如公开号
CN113888638A
,公开了一种基于注意力机制的图神经网络行人路径预测方法,在交互技术中同时关注空间相关性和时间相关性,并通过注意力机制将有效信息最大化,其提出的技术方案包括:采集行人轨迹信息,提取轨迹运动特征,构建行人轨迹原始节点图,其中所述行人轨迹原始节点图包含行人轨迹的空间信息和时间信息;对所述行人轨迹原始节点图进行融合

舍弃和放大,过滤出对形成行人轨迹影响重大的信息,生成行人轨迹最终节点图,其中所述融合

舍弃和放大由图通道注意力机制完成;利用时空图卷积神经网络提取行人轨迹最终节点图的时空特征,根据所述时空特征构建行人轨迹的原始时空特征图,并利用图通道注意力机制筛选出重要的时空特征组成新的时空特征图;将所述新的时空特征图输入预测器,预测器输出预测的预设时间内的行人轨迹,其中所述预测器采用时间外推神经网络,预测的行人轨迹包含多种不同结果;给所述预测的行人轨迹分配权重,以权重最大的轨迹作为最终的预测结果,其中所述分配权重由时间通道注意力机制完成

[0005]现有技术二,如公开号为
CN113658228B
,公开了一种基于卷积神经网络的行人路径预测系统和方法,其提出的技术方案包括:重新构建了基于卷积神经网络的行人路径预
测的解决方案,优化了行人路径预测系统的整体系统架构,提高了数据处理的速率和现实场景下的预测能力,综合考虑了现实世界场景下的各种上下文背景和环境因素

[0006]对于模型性能评估的指标主要有两个:平均位移误差
(ADE)
和最终位移误差
(FDE)。
具体来说,
ADE
评价的是模型沿轨迹的平均预测性能
,

FDE
只考虑最后的预测精度

两个指标的数值越小
,
网络的表现性能越优

两个指标的定义如下:
[0007]ADE
:用来衡量模型预测轨迹点的坐标和真实值坐标的差距
(
越小预测精度越高
)。
[0008][0009]其中,
t
表示时间帧,
p
t
表示时间帧为
t
时行人的坐标位置

[0010]在上式中,
n
表示第
n

Agent
或者同一个
Agent
的第
n
轮预测,假设场景存在5个
Agent
,此时
N
为5,
n
从0到4,
T
表示总预测时间帧数,因此上式表示每个
Agent
每一步采取行动之后,当前预测坐标与真实坐标的二范数值即距离

[0011]FDE
:用来衡量模型预测到最终点的坐标和真实最终点的差距
(
越小离真实目标越近
)。
[0012][0013]其中,符号定义同
ADE
过程

此时只取每个
Agent
的最终坐标值进行衡量;因此只在
t

T
的时候衡量其距离的平均值

[0014]但是,行人运动轨迹和模式受规则常识

相互作用

步态特征等影响
,
研究中仍存在一些问题导致以上两个指标难以提升

问题比较集中在:
[0015]1)
交互缺乏可解释性

网络模型在进行训练时
,
使用的数据都是能客观测量的数据
,
对行人运动意图把握不准
,
缺少依赖于人的主观判断来训练算法的数据

例如
,
在自动驾驶场景中
,
自动驾驶辅助系统关心的是此时的行人是否会过马路

有的模型利用头部姿势
,
结合行人行为预测进行了一些尝试
,
但获取数据的方式单一
,
行人的主观意图研究的少

所以
,
目前的模型对计算到的交互缺乏可解释性
,
仍然依赖于数据驱动

[0016]2)
动态图缺少时序特征

基于图结构的网络架构
,
在时序构建动态图的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种基于时空特征的行人路径预测方法,其特征在于,包括以下步骤:步骤
S1
:构建基于
GAN
网络的
GAIL
模型,包括:步骤
S11
:构建
GAIL
模型,如下式
(I)
:在上式
(I)
中,
E
表示策略的期望或策略为专家的期望,
π
是训练得到的策略模型,
E
π
即为对策略
π
求取期望运算;
E
π
E
表示对专家数据蕴含的专家策略求取期望运算;
log
表示求以
10
为底的对数;
D
为判别器,
s
表示当前时刻的状态,
H
表示
λ
参数控制的策略调整器,同时根据所学习的策略,输出对应的动作值记作
a
π

a
π
E
表示采用专家策略生成的动作值;
action
所对应的动作空间是
A<v
x

v
y
>
;步骤
S12

GAIL
模型对照到
GAN
网络,可以得到公式
(II)
:其中,
s

a
分别表示状态空间和动作空间,
S

A
分别表示
s

a
的取值范围;其余参数同公式
(I)
;其训练过程是一个最小化和最大化的过程,同时进行生成器和策略网络的博弈,使得策略网络在生成器的打分中不断优化模型参数,得到最小值,同时,对判别器不断进行判别能力训练,以便最大化以上的目标函数值;步骤
S2
:在所述
GAIL
模型中融合
Mogrifier LSTM
提取的历史信息,基于前
n
个可变步长的预测过程,给出下一时刻的结果预测,其中,
n
为自然数;步骤
S3
:构建与
Mogrifier LSTM
模型适配的缓冲区;步骤
S4
:构建基于
Mogrifier LSTM

MogrifierGAIL
模型;步骤
S5
:将判别器模型和生成器进行优化,直至达到一种稳态即纳什均衡点;步骤
S6
:输入行人轨迹数据至
S5
得到的训练好的模型;将所观测到的轨迹作为输入,所观测的长度可以是1个五元组
【x1,y1,x,y,t

1】
至8个五元组组成的序列;步骤
S7
:利用训练好的模型进行输出,得到该行人的预测轨迹数据
。2.
根据权利要求1所述基于时空特征的行人路径预测方法,其特征在于,还包括:步骤
S13
:对于策略
π
进行优化,将问题归类为最小化
JS
散度的问题,具体包括:步骤
S131
:首先将度量两种策略的占用度量公式转化为特殊的风险期望值;步骤
S132
:为了最小化策略度量,可以对风险期望值进行最小化探索,将对于正则化项的推导进一步转化成为对于风险期望函数的推导;步骤
S133
:最终得到对于策略更新过程中的自然梯度更新
。3.
根据权利要求1所述基于时空特征的行人路径预测方法,其特征在于:步骤
S2
中,在
GAIL
模型中融合
Mogrifier LSTM
提取的历史信息的操作如下:步骤
S21
:对行人的下一步位置或者行人所采取的行动进行预测,提出加入
Mogrifier LSTM
进行前几步长的时序特征隐藏层输出值融入模型中;步骤
S22
:将前几步长的时序特征与当前的观测状态同时进行考量,做出基于前几个时间步而言在合理接受的阈值范围内的行为动作;步骤
S23
:得到较为可靠的预测精确度
。4.
根据权利要求1所述基于时空特征的行人路径预测方法,其特征在于:其中,前
n
个时刻的历史轨迹将会被作为模型的记忆信息输入
Mogrifier LSTM
网络中,
基于上述历史轨迹的绝对坐标信息,提取出对应的输出状态;将上述输出状态在后续应用到多层感知器中进行特征融合,使用
Mogrifier LSTM
提取时序特征
。5.
根据权利要求1所述基于时空特征的行人路径预测方法,其特征在于:步骤
S3
中,构建与
Mogrifier LSTM
适配的缓冲区的具体操作如下:步骤
S31
:假设我们目前设定的观测值为
n
,在前期,从开始到当前观测时刻
t...

【专利技术属性】
技术研发人员:李爱民周昊田崔世淼费蓉周中银周红芳李军怀刘雅君黑新宏拓守恒
申请(专利权)人:西安理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1