A pedestrian trajectory prediction method for crowded scenes based on social affinity long-term and short-term memory network model is composed of data preprocessing, pooling operation based on social affinity mapping map, target trajectory prediction, training model and constructing prediction trajectory steps. The invention combines a data-driven long-and short-term memory network which is good at dealing with continuous sequence problems with a social affinity map for trajectory prediction. The model is driven by sequence data and can be trained to learn the general trajectory pattern of pedestrians, and then combines the trajectory characteristics of individuals extracted from the prediction with the trajectory of pedestrians around them. Trace features can be used to predict pedestrian trajectories in complex scenes. Compared with the prior art, the present invention has the advantages of simple method and environment-independent, and can be used to capture the customary social habits and subtle interactions between pedestrians and predict future interactions.
【技术实现步骤摘要】
基于社会亲和力长短期记忆网络模型的拥挤场景行人轨迹预测方法
本专利技术属于图像处理
,具体涉及到采用社会亲和力长短期记忆网络实现拥挤场景行人轨迹预测。
技术介绍
行人轨迹预测是指通过目标已有的运动轨迹对其未来固定时刻的位置坐标进行预测。行人轨迹预测是计算机视觉领域的核心问题,有很多应用方向,如自动驾驶汽车,智能追踪系统,送餐机器人等。现有的行人轨迹预测方法有SocialForce(SF)模型,Gaussianprocesses方法,CorrelationFilter(CF)模型,ConvolutionalNeuralNetworks(CNN)方法和Social长短期记忆网络模型。SF模型由能量函数驱动,函数将行人间和行人与障碍物间的吸引和排斥转化为能量来预测行人轨迹。Gaussianprocesses方法通过高斯混合模型分布来预测速度、角偏量等参数。CorrelationFilter(CF)模型通过设计滤波模板,使得模板和输入图片做相关时,能在目标中心位置得到最大响应值。ConvolutionalNeuralNetworks(CNN)方法和RecurrentNeuralNetworks(RNN)方法都应用了神经网络来进行轨迹预测。ConvolutionalNeuralNetworks(CNN)方法输入为图像,Social长短期记忆网络模型输入为轨迹坐标序列。SocialForce(SF)模型,Gaussianprocesses方法,CorrelationFilter(CF)模型都要由复杂的公式或函数驱动,SocialForce(SF)模型只能捕获吸引 ...
【技术保护点】
1.一种基于社会亲和力长短期记忆网络模型的拥挤场景行人轨迹预测方法,其特征在于由以下步骤组成:(1)对获取的数据进行预处理行人轨迹数据来源于公开的数据集ETH、UCY中所有坐标序列集合
【技术特征摘要】
1.一种基于社会亲和力长短期记忆网络模型的拥挤场景行人轨迹预测方法,其特征在于由以下步骤组成:(1)对获取的数据进行预处理行人轨迹数据来源于公开的数据集ETH、UCY中所有坐标序列集合数据集中共有5个场景,为目标Ok在时间步t的坐标,时间步t与时间步t+1之间的步长为tstep,T是集合坐标序列的总数、为有限的正整数,k是在T个坐标序列集合中的任意一个坐标序列,{Ok|k∈[1,T]}为目标集合,在目标集合中任意选取一个目标Oi,i∈[1,T]进行轨迹预测,所有xy坐标都经过归一化处理,即xy坐标像素除以相应的视频分辨率;(2)基于社会亲和力映射图的池化操作社会亲和力长短期记忆网络模型包括输入层、隐含层、池化层、输出层,每个目标有一个单层长短期记忆网络,所有的目标共享相同的长短期记忆网络参数,池化层对与目标相邻的长短期记忆网络进行池化操作;每个行人规划有一个半径为L像素的圆形区域,根据目标间的空间相对位置将圆形区域聚类划分为G0个区域,G0个区域代表G0种社会亲和力,聚类后的圆形区域为社会亲和力映射图;在时间步t,目标Oi的任一邻近目标Om位于社会亲和力映射图范围内,为目标Oi的任一邻近目标,任一邻近目标Om有大小为G0×1的相对位置矩阵为任一邻近目标Om在社会亲和力映射图中相对于目标Oi的位置,一个空间相对位置为区域1的邻近目标Om位置矩阵如下:矩阵中元素1为任一邻近目标Om相对位置,元素0为非任一邻近目标Om相对位置,通过张量保存目标Oi所有邻居的位置信息和相对应的长短期记忆网络时间步t-1的隐含层状态,张量通过公式(2)、(3)获得:其中,为任一邻近目标Om在时间步t-1的长短期记忆网络隐含层状态,是包含任一邻近目标Om在时间步t相对位置的隐含层状态,是社会亲和力映射图范围内所有任一邻近目标Om的集合,将所有邻近目标的长短期记忆网络的隐含层状态累加;通过池化层的池化操作连接相邻的长短期记忆网络,得池化层状态其中,φ(.)为ReLU函数,Ws为池化权重矩阵,bs为池化偏置矩阵,以池化权重矩阵中不同的值连接不同社会亲和力映射图区域所有邻近目标Om的长短期记忆网络;(3)目标轨迹预测通过张量获取目标Oi在时间步t的xy坐标信息:式中φ(.)为ReLU函数,We为xy坐标的权重矩阵,为目标Oi在时间步t的xy坐标,be为xy坐标的偏置矩阵;目标Oi的长短期记忆网络在时间步t的隐含层状态包含有时间步t-1的池化层状态时间步t-1目标Oi的隐含层状态时间步t目标Oi的位置信息通过公式(6)得隐含层状态式中Wl为长短期记忆网络输入的权重矩阵,bl为长短期记忆网络输入的偏置矩阵;用隐含层状态预测时间步t+1目标Oi的xy坐标长短期记忆网络的输出层状态通过公式(7)得:式中Wo为长短期记忆网络隐含层状态的权重矩阵,bo为长短期记忆网络隐含层状态的偏置矩阵,为均值,为标准差,均为二维,为xy坐标的相关系数;在预测坐标之前,输出层状态通过公式(8)、(9)、(10)进行更新:用双变量高斯函数预测时间步t+1目标Oi的xy坐标(4)训练模型通过交叉验证的方式对社会亲和力长短期记忆网络模型进行训练,即用4个场景的坐标序列集合训练模型,用...
【专利技术属性】
技术研发人员:裴炤,张艳宁,齐晓宁,马苗,汪西莉,徐航,
申请(专利权)人:陕西师范大学,
类型:发明
国别省市:陕西,61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。