一种基于时空特征的行人路径预测方法技术

技术编号:39835712 阅读:21 留言:0更新日期:2023-12-29 16:19
本发明专利技术公开了一种基于时空特征的行人轨迹预测方法

【技术实现步骤摘要】
一种基于时空特征的行人路径预测方法


[0001]本专利技术属于人工智能领域,具体地说,涉及一种基于时空特征的行人路径预测方法


技术介绍

[0002]当前机器学习按照学习模式的不同,基本实现方法不同,大体上能够分为三大类,即:有监督学习
Supervised Learning(
基于拥有样本标签的数据
)
,无监督学习
Unsupervised Le arning(
训练数据中不存在事先人工标记的标签
)
和强化学习
(
一种基于马尔可夫决策模型的代理

环境互动探索模型
)。
其中,强化学习
(Reinforcement Learning)
作为机器学习的一种实现,已经在越来越多决策问题领域发挥至关重要的作用,并且在一些策略游戏中也已经展现了出色的成绩,如
DeepMind
公司推出的
AlphaGo、AphaZero
等围棋机器人系列;同时在智慧城市交通信号控制等研究中也本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种基于时空特征的行人路径预测方法,其特征在于,包括以下步骤:步骤
S1
:构建基于
GAN
网络的
GAIL
模型,包括:步骤
S11
:构建
GAIL
模型,如下式
(I)
:在上式
(I)
中,
E
表示策略的期望或策略为专家的期望,
π
是训练得到的策略模型,
E
π
即为对策略
π
求取期望运算;
E
π
E
表示对专家数据蕴含的专家策略求取期望运算;
log
表示求以
10
为底的对数;
D
为判别器,
s
表示当前时刻的状态,
H
表示
λ
参数控制的策略调整器,同时根据所学习的策略,输出对应的动作值记作
a
π

a
π
E
表示采用专家策略生成的动作值;
action
所对应的动作空间是
A<v
x

v
y
>
;步骤
S12

GAIL
模型对照到
GAN
网络,可以得到公式
(II)
:其中,
s

a
分别表示状态空间和动作空间,
S

A
分别表示
s

a
的取值范围;其余参数同公式
(I)
;其训练过程是一个最小化和最大化的过程,同时进行生成器和策略网络的博弈,使得策略网络在生成器的打分中不断优化模型参数,得到最小值,同时,对判别器不断进行判别能力训练,以便最大化以上的目标函数值;步骤
S2
:在所述
GAIL
模型中融合
Mogrifier LSTM
提取的历史信息,基于前
n
个可变步长的预测过程,给出下一时刻的结果预测,其中,
n
为自然数;步骤
S3
:构建与
Mogrifier LSTM
模型适配的缓冲区;步骤
S4
:构建基于
Mogrifier LSTM

MogrifierGAIL
模型;步骤
S5
:将判别器模型和生成器进行优化,直至达到一种稳态即纳什均衡点;步骤
S6
:输入行人轨迹数据至
S5
得到的训练好的模型;将所观测到的轨迹作为输入,所观测的长度可以是1个五元组
【x1,y1,x,y,t

1】
至8个五元组组成的序列;步骤
S7
:利用训练好的模型进行输出,得到该行人的预测轨迹数据
。2.
根据权利要求1所述基于时空特征的行人路径预测方法,其特征在于,还包括:步骤
S13
:对于策略
π
进行优化,将问题归类为最小化
JS
散度的问题,具体包括:步骤
S131
:首先将度量两种策略的占用度量公式转化为特殊的风险期望值;步骤
S132
:为了最小化策略度量,可以对风险期望值进行最小化探索,将对于正则化项的推导进一步转化成为对于风险期望函数的推导;步骤
S133
:最终得到对于策略更新过程中的自然梯度更新
。3.
根据权利要求1所述基于时空特征的行人路径预测方法,其特征在于:步骤
S2
中,在
GAIL
模型中融合
Mogrifier LSTM
提取的历史信息的操作如下:步骤
S21
:对行人的下一步位置或者行人所采取的行动进行预测,提出加入
Mogrifier LSTM
进行前几步长的时序特征隐藏层输出值融入模型中;步骤
S22
:将前几步长的时序特征与当前的观测状态同时进行考量,做出基于前几个时间步而言在合理接受的阈值范围内的行为动作;步骤
S23
:得到较为可靠的预测精确度
。4.
根据权利要求1所述基于时空特征的行人路径预测方法,其特征在于:其中,前
n
个时刻的历史轨迹将会被作为模型的记忆信息输入
Mogrifier LSTM
网络中,
基于上述历史轨迹的绝对坐标信息,提取出对应的输出状态;将上述输出状态在后续应用到多层感知器中进行特征融合,使用
Mogrifier LSTM
提取时序特征
。5.
根据权利要求1所述基于时空特征的行人路径预测方法,其特征在于:步骤
S3
中,构建与
Mogrifier LSTM
适配的缓冲区的具体操作如下:步骤
S31
:假设我们目前设定的观测值为
n
,在前期,从开始到当前观测时刻
t...

【专利技术属性】
技术研发人员:李爱民周昊田崔世淼费蓉周中银周红芳李军怀刘雅君黑新宏拓守恒
申请(专利权)人:西安理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1