一种多特征融合的串联RNN结构及行人预测方法技术

技术编号:26172520 阅读:33 留言:0更新日期:2020-10-31 13:50
本发明专利技术公开了一种多特征融合的串联RNN结构及行人预测方法,结构包括:信息采集模块、信息处理模块、串联GRU模块、全连接层模块、激活函数模块和预测模块;信息采集模块采集车辆在不同道路和人群密度的环境中驾驶时的行人和周围环境的视频图像、自车车速;信息处理模块对上述采集到的数据进行处理生成数据集;串联GRU模块中每级GRU处理数据集中的不同的信息和串联的前一级GRU的隐藏状态的输入,将不同的信息进行融合计算;全连接层模块对上述多维矩阵进行整合得到一维向量;激励函数模块对上述一维向量信息处理;预测模块得到行人轨迹的预测结果。本发明专利技术将来自多个来源的信息根据其复杂性,在不同的神经网络层逐层融合,实现行人行为理解和轨迹预测。

A multi feature fusion based serial RNN structure and pedestrian prediction method

【技术实现步骤摘要】
一种多特征融合的串联RNN结构及行人预测方法
本专利技术属于汽车智能驾驶计算机视觉领域,具体指代一种多特征融合的串联RNN(循环神经网络)结构及行人预测方法。
技术介绍
自动驾驶技术的快速发展对准确理解行人活动、预测行人运动轨迹提出了更高的要求;准确理解行人活动、预测行人运动轨迹有助于帮助汽车驾驶系统选择正确的行驶路线,避免发生潜在的人车碰撞及其导致的交通流中断。此外,神经网络在自动驾驶领域中关于理解行人活动、预测行人运动轨迹获得较大的应用。目前,解决行人行为预测问题的主要方法是基于行人本身的运动模式预测其在未来某个时间的轨迹,但是由于周围各种因素的干扰,例如:信号灯、自车运动、道路结构,行人表现出高度可变的运动模式,所以这类方法不足以准确理解行人的完整行为。例如:中国专利技术专利申请号为CN201910097865,名称“一种基于卷积神经网络的无人驾驶行人轨迹预测方法”中将样本数据中即将通过斑马线的人群进行划分,并从中获取行人位置-比例信息序列、行人骨架信息序列、视觉传感器自身运动序列等信息,将这几类信息输入卷积神经网络进行训练测试评估,最终输出预测轨迹和动作类别,但是在输入卷积神经网络时没有考虑到几类信息归一化处理以及融合的先后顺序,也没有考虑到自车的运动状态,导致卷积神经网络的训练效果不好;中国专利技术专利申请号为CN201810294015,名称为“基于社会亲和力长短期记忆网络模型的拥挤场景行人轨迹预测方法”中应用长短期记忆网络结合社会亲和力映射图,结合提取到的个人轨迹模式和周围相关行人的轨迹特征实现复杂场景的行人轨迹预测,但是该方法中特征选择太少,易造成预测结果准确度不高。
技术实现思路
针对于上述现有技术的不足,本专利技术的目的在于提供一种多特征融合的串联RNN结构及行人预测方法,以解决现有技术中未充分考虑行人周围情况而导致的行人轨迹预测准确度不高的问题。本专利技术将来自多个来源的信息(包括行人外观、周围道路环境、行人姿势和自车速度)根据其复杂性,在不同的神经网络层逐层融合,实现行人行为理解和轨迹预测。为达到上述目的,本专利技术采用的技术方案如下:本专利技术的一种多特征融合的串联RNN结构,包括:信息采集模块、信息处理模块、串联GRU模块、全连接层模块、激活函数模块和预测模块;信息采集模块,其包括:车载单目摄像头和车速传感器,车载单目摄像头用于采集车辆在不同道路和人群密度的环境中驾驶时的行人和周围环境的视频图像;车速传感器用于采集自车车速;信息处理模块,其对上述信息采集模块采集到的数据进行处理生成数据集;串联GRU模块,其对上述数据集中的信息进行处理,串联GRU模块中每级GRU处理数据集中的不同的信息和串联的前一级GRU的隐藏状态的输入,将不同的信息进行融合计算,并将融合计算得到的多维矩阵输入给全连接层模块;全连接层模块,其对上述多维矩阵进行整合得到一维向量;激励函数模块,其对上述一维向量信息采用ReLU函数处理;预测模块,其对上述激励函数模块处理后的信息进行分类,计算行人轨迹概率,辨别行人意图,得到行人轨迹的预测结果。进一步地,所述数据集包含:行人的二维边框注释及自车车速数据;数据集中的数据被随机分为训练集和测试集,样本比例为6:4。进一步地,所述串联GRU模块由一级GRU、二级GRU、三级GRU、四级GRU、五级GRU组成。本专利技术的一种基于多特征融合的串联RNN结构的行人预测方法,包括步骤如下:步骤1:利用车载单目摄像头采集车辆在不同街道行驶时的行人和周围环境的图像数据,利用车速传感器采集自车车速;步骤2:对上述步骤1中采集到的图像数据及自车车速数据进行处理,将行人过街预测定义为一个二元分类问题来预测第i个行人在采集的时间m内的行走轨迹,对预测依赖的行人特征、周围环境特征、行人姿势特征、行人二维框、自车车速五个信息源进行信息处理;步骤3:将上述步骤2处理得到的数据分别输入到一级GRU、二级GRU、三级GRU、四级GRU、五级GRU中依次进行信息融合计算,得到多维矩阵;步骤4:对上述得到的多维矩阵进行整合,得到一维向量;步骤5:采用ReLU函数对上述一维向量进行激活处理;步骤6:采用softmax逻辑回归对上述步骤5中处理后的数据进行分类预测,得到行人轨迹的预测结果。进一步地,所述步骤2具体包括:将行人特征及周围环境特征表示为{Cpi,Csi},Cpi={cpi1,…,cpim},Csi={csi1,…,csim},cpi、csi为第i个行人特征和周围环境的坐标表示,由数据集中的图像数据得到,行人姿势特征表示为Pi={pi1,…,pim},pi为第i个行人姿势特征的坐标表示,由数据集中的图像数据得到;行人二维框用坐标Bi={bi1,…,bim}来表示,其中,bi是两点坐标[(x1i;y1i)(x2i;y2i)],两点坐标(x1i;y1i)和(x2i);y2i)指的是数据集标注后的图像数据中第i个行人对应的边界框的左上角和右下角;自车车速表示为S={si1,…,sim};在对行人特征、周围环境特征、行人姿势特征、行人二维框、自车车速五个信息源进行处理后分别用多维矩阵vp1:m、vb1:m、vs1:m来表示。对于行人,使用裁剪成框架中围绕行人的二维边界框大小的图像来捕获的,裁剪过程中将原始边界框坐标中的像素值设置为中性灰色来抑制行人外观;对于周围环境,通过放大二维边界框坐标,并对尺寸进行平方运算,以使缩放边界框的宽度与其高度匹配,从而提取出行人周围的区域;使用1:5x缩放版本的2D边界框裁剪周围环境,裁剪后的图像中包含感兴趣的行人的部分用中性灰色和RGB为(128;128;128),将这些图像的大小调整为224*224;使用在ImageNet上预先训练的VGG16层来处理图像,然后生成512维的特征向量;行人特征和周围环境特征使用卷积神经网络处理产生两个特征向量和对于行人姿态特征,主要是在一帧包含人体的深度图像中确定人体关节点位置,关节点主要是:手、肘部、腕部、肩部、头部、踝部、膝盖、臀部等人的骨骼关节;在COCO数据集上预先训练出行人姿态网络,该网络为每个行人样本生成18个关节;每个关节对应于二维空间中的一个点,即用每个关节用一个二维坐标表示,18个关节坐标被规范化并拼接成36维特征向量vp1:m;其中,行人姿态网络的训练使用文献Realtimemulti-person2dposeestimationusingpartaffinityfields.InCVPR,pages7291–7299,2017中的多人2d姿态实时估计方法;对于行人二维框,将其转换为初始位置的相对位移,形成特征向量vb1:m;自车车速用向量vs1:m表示,单位为km/h。进一步地,所述步骤3具体包括:五个信息源特征从一级GRU开始依次进行信息融合计算,第j级GRU由下式给出:其中,sigm代表sigmoid本文档来自技高网
...

【技术保护点】
1.一种多特征融合的串联RNN结构,其特征在于,包括:信息采集模块、信息处理模块、串联GRU模块、全连接层模块、激活函数模块和预测模块;/n信息采集模块,其包括:车载单目摄像头和车速传感器,车载单目摄像头用于采集车辆在不同道路和人群密度的环境中驾驶时的行人和周围环境的视频图像;车速传感器用于采集自车车速;/n信息处理模块,其对上述信息采集模块采集到的数据进行处理生成数据集;/n串联GRU模块,其对上述数据集中的信息进行处理,串联GRU模块中每级GRU处理数据集中的不同的信息和串联的前一级GRU的隐藏状态的输入,将不同的信息进行融合计算,并将融合计算得到的多维矩阵输入给全连接层模块;/n全连接层模块,其对上述多维矩阵进行整合得到一维向量;/n激励函数模块,其对上述一维向量信息采用ReLU函数处理;/n预测模块,其对上述激励函数模块处理后的信息进行分类,计算行人轨迹概率,辨别行人意图,得到行人轨迹的预测结果。/n

【技术特征摘要】
1.一种多特征融合的串联RNN结构,其特征在于,包括:信息采集模块、信息处理模块、串联GRU模块、全连接层模块、激活函数模块和预测模块;
信息采集模块,其包括:车载单目摄像头和车速传感器,车载单目摄像头用于采集车辆在不同道路和人群密度的环境中驾驶时的行人和周围环境的视频图像;车速传感器用于采集自车车速;
信息处理模块,其对上述信息采集模块采集到的数据进行处理生成数据集;
串联GRU模块,其对上述数据集中的信息进行处理,串联GRU模块中每级GRU处理数据集中的不同的信息和串联的前一级GRU的隐藏状态的输入,将不同的信息进行融合计算,并将融合计算得到的多维矩阵输入给全连接层模块;
全连接层模块,其对上述多维矩阵进行整合得到一维向量;
激励函数模块,其对上述一维向量信息采用ReLU函数处理;
预测模块,其对上述激励函数模块处理后的信息进行分类,计算行人轨迹概率,辨别行人意图,得到行人轨迹的预测结果。


2.根据权利要求1所述的多特征融合的串联RNN结构,其特征在于,所述数据集包含:行人的二维边框注释及自车车速数据;数据集中的数据被随机分为训练集和测试集,样本比例为6:4。


3.根据权利要求1所述的多特征融合的串联RNN结构,其特征在于,所述串联GRU模块由一级GRU、二级GRU、三级GRU、四级GRU、五级GRU组成。


4.一种基于多特征融合的串联RNN结构的行人预测方法,其特征在于,包括步骤如下:
步骤1:利用车载单目摄像头采集车辆在不同街道行驶时的行人和周围环境的图像数据,利用车速传感器采集自车车速;
步骤2:对上述步骤1中采集到的图像数据及自车车速数据进行处理,将行人过街预测定义为一个二元分类问题来预测第i个行人在采集的时间m内的行走轨迹,对预测依赖的行人特征、周围环境特征、行人姿势特征、行人二维框、自车车速五个信息源进行信息处理;
步骤3:将上述步骤2处理得到的数据分别输入到一级GRU、二级GRU、三级GRU、四级GRU、五级GRU中依次进行信息融合计算,得到多维矩阵;
步骤4:对上述得到的多维矩阵进行整合,得到一维向量;
步骤5:采用ReLU函数对上述一维向量进行激活处理;
步骤6:采用softmax逻辑回归对上述步骤5中处理后的数据进行分类预测,得到行人轨迹的预测结果。


5.根据权利要求4所述的基于多特征融合的串联RNN结构的行人预测方法,其特征在于,所述步骤2具体包括:
将行人特征及...

【专利技术属性】
技术研发人员:汪桉旭赵万忠周小川栾众楷章波
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1