【技术实现步骤摘要】
一种融合运动目标分析的行人轨迹预测方法
[0001]本专利技术属于行人轨迹预测领域,涉及行人运动特征获取、行人运动意图分析以及动态场 景信息的建模,具体涉及一种融合运动目标分析的行人轨迹预测方法。
技术介绍
[0002]轨迹预测是指根据目标行人、车辆、机器人等智能体的历史运动状态,预测智能体在未 来一段时间内可能的运动轨迹。轨迹预测算法是无人驾驶、机器人导航技术中的重要一环, 也是当前的热点研究方向之一。伴随着5G网络商用和城市现代化的发展,国家高度重视智 慧城市、公共交通、智能机器人等重点方向的建设,工业和信息化部在2021年指出要加强核 心技术攻关,突破机器人信息感知与导航等共性技术。行人轨迹预测算法作为关键的基础性 研究技术,在机器人导航、行人意图分析等现实场景中起到关键作用。为了使机器人在复杂 场景中的移动更接近人类,避免与行人发生碰撞,机器人需要根据行人的位置、运动方向、 速度、加速度等信息,对附近行人进行高效的运动意图预测,再进行有效的避障操作。用于 城市公共安全的监视系统和智能跟踪模块同样需要对人群的运动和行为进行分析来理解人群 相互作用模式,对行人可能进入的禁止区域或发生的违规行为进行预警,从而更好地管理基 础设施,以优化资源配置。因此,人群轨迹预测问题具有现实意义,且比较复杂,具有比较 高的研究价值。
[0003]轨迹预测是一项基础性的研究内容,也是路径规划中的一个重要环节,其中一个关键需 求是对行人的意图目标进行分析,如周围车辆是否要需变更车道,前方行人是否要横穿马路 等。行人的终点目标作 ...
【技术保护点】
【技术特征摘要】
1.一种融合运动目标分析的行人轨迹预测方法,其特征在于,包括如下步骤:步骤一:从行人历史轨迹视频中提取多精度数据,包括行人的粗精度坐标信息、细精度坐标信息和动态场景信息;所述粗精度坐标是将场景区域划分后确定的行人所在的子区域坐标,细精度坐标是指行人在场景中的坐标;所述粗精度坐标信息和细精度坐标信息均包括行人坐标位置、速度和加速度;步骤二:构建主网络
‑
子网络联合的行人轨迹预测模型;所述行人轨迹预测模型的子网络,对输入的行人粗精度坐标信息、行人细精度坐标信息和动态场景信息三种数据进行编码,再利用门控循环神经网络模型GRU
sub
进行序列建模,预测输出当前时刻的行人运动意图向量,然后将行人运动意图向量输入三个子任务模型;第一个子任务模型利用多层感知机f
fine
对行人运动意图向量进行映射,得到行人终点的细精度坐标;第二个子任务模型利用多层感知机f
coarse
对行人运动意图向量进行映射,得到行人终点的粗精度坐标;第三个子任务模型先利用矩阵W
score
对行人运动意图向量进行映射,再接ReLU激活函数,然后使用Softmax函数对场景内各子区域进行重要性评分;所述行人轨迹预测模型的主网络,利用多层感知机f
e
对输入的行人细精度坐标信息编码后,再与当前时刻行人的目标意图向量一起输入门控循环神经网络模型GRU中,GRU输出行人在当前时刻的行人运动状态向量,再利用多层感知机f
goal
对GRU的输出进行映射,预测行人终点坐标;所述行人的目标意图向量由子网络的GRU
sub
输出和主网络的GRU输出利用注意力机制融合计算获得;步骤三:在轨迹解码阶段,利用条件变分自动编码器CVAE生成多模态轨迹。2.根据权利要求1所述的方法,其特征在于,所述的步骤1中,行人的粗精度坐标信息生成方式是:将场景区域按照m
×
n的粗精度进行划分,根据粗精度和细精度坐标计算每个行人的粗精度坐标;对每位行人,以每个观察时刻最后一帧图像中的坐标位置为原点,将观察时刻中抽取的各帧图像中行人坐标位置转换为相对坐标位置;然后以相对坐标位置计算行人在各时刻的速度和加速度;m和n均为正整数。3.根据权利要求1所述的方法,其特征在于,所述的步骤2中,将行人在t时刻的粗精度坐标信息和细精度坐标信息,分别利用多层感知机进行编码,对动态场景信息利用卷积神经网络进行编码。4.根据权利要求1所述的方法,其特征在于,所述的步骤2中,行人的目标意图向量通过如下方式获得:首先,通过子网络对场景中各子区域的重要性评分,选取分数最高的Top K个子区域作为重点区域,并利用卷积神经网络对K个子区域编码;设对t时刻多精度数据处理,选取的第i个子区域的动态场景信息的编码向量为子区域重要性分数为score
i
,i=1,2,
…
K,则根据重要性分数对K个子区域编码进行加权平均,得到行人的重要区域信息然后,利用多头注意力机制和残差连接将子网络和主网络的输出进行融合,得到行人在t时刻的目标意图向量g
t
,如下:
其中,<.,.>是内积操作,W
Q
、W
K
和W
V
是可训练的参数矩阵,h
t
为主网络GRU的输出向量,D为h
t
的维度数,p为多头注意力机制的表头数量,s
r
为注意力分数;是将进行多头注意力机制映射得到的第r个映射向量,是将h
t
进行多头注意力机制映射得到的第r个映射向量。5.根据权利要求1所述的方法,其特征在于,所述的步骤2中,行人的目标意图向量通过如下方式获得:设行人轨迹预测模型对t时刻多精度数据处理,获得子网络的GRU
sub
的输出与主网络GRU的输出h
t
,利用多头注意力机制和残差连接将子网络和主网络的输出进行融合,得到当前t时刻的目标意图向量g
t
,如下:如下:其中,<.,.>是内积操作,W
Q
、W
K
和W
V
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。