一种基于强化学习的车辆泊位预测方法技术

技术编号:22944906 阅读:24 留言:0更新日期:2019-12-27 17:13
本发明专利技术公开了一种基于强化学习的车辆泊位预测方法,按下述步骤进行:a、获取目标停车场的停车泊位历史数,并对所述停车泊位历史数进行归一化处理形成数据集,以数据集中60‑90%的数据作为训练集,以数据集中10‑40%的数据作为测试集;b、基于强化学习理论构建停车场泊位预测模型,将训练集输入至停车场泊位预测模型进行训练;c、利用训练后的停车场泊位预测模型进行目标停车场的车辆泊位预测,以测试集验证停车场泊位预测模型的预测准确性。本发明专利技术能够达到预测出停车场的泊位情况的目的,泊位情况的预测准确性高。

A method of parking prediction based on Reinforcement Learning

【技术实现步骤摘要】
一种基于强化学习的车辆泊位预测方法
本专利技术涉及神经网络和强化学习领域,具体为一种基于强化学习的车辆泊位预测方法。
技术介绍
随着国内人民消费水平的普遍提高,我国城乡居民机动车保有数量显著增加,停车问题也逐步在人民的日常生活、工作中凸显,在城市中心区域尤为明显。为了缓解机动车泊位供需矛盾问题,许多应用人工智能的机动车泊位预测方法对该问题进行了分析,进而凭借准确的泊位预测,判断机动车附近的泊位供需状况,为驾驶员提供可靠的泊位需求,缓解城乡的停车问题。传统的泊位预测方法主要是单一的网络预测技术或BP神经网络预测方法,通过对停车场的泊位数据进行处理,能够对停车泊位进行有效的短时预测,但对数据的波动性处理能力不足,得到的预测数据稳定性较差。如公开号为CN108648449A的专利技术公开了一种基于卡尔曼滤波和NAR神经网络组合的车位预测方法,根据预测的数据,比较卡尔曼滤波和NAR神经网络两种预测模型的准确度,以准确度高的次数作为两种模型进行组合预测的权重,进而得到该组合模型的预测值。但在许多的停车场中,很难为上述组合模型提供大量的泊位数据进行本文档来自技高网...

【技术保护点】
1.一种基于强化学习的车辆泊位预测方法,其特征在于:按下述步骤进行:/na、获取目标停车场的停车泊位历史数,并对所述停车泊位历史数进行归一化处理形成数据集,以数据集中60-90%的数据作为训练集,以数据集中10-40%的数据作为测试集;/nb、基于强化学习理论构建停车场泊位预测模型,将训练集输入至停车场泊位预测模型进行训练;/nc、利用训练后的停车场泊位预测模型进行目标停车场的车辆泊位预测,以测试集验证停车场泊位预测模型的预测准确性。/n

【技术特征摘要】
1.一种基于强化学习的车辆泊位预测方法,其特征在于:按下述步骤进行:
a、获取目标停车场的停车泊位历史数,并对所述停车泊位历史数进行归一化处理形成数据集,以数据集中60-90%的数据作为训练集,以数据集中10-40%的数据作为测试集;
b、基于强化学习理论构建停车场泊位预测模型,将训练集输入至停车场泊位预测模型进行训练;
c、利用训练后的停车场泊位预测模型进行目标停车场的车辆泊位预测,以测试集验证停车场泊位预测模型的预测准确性。


2.根据权利要求1所述的基于强化学习的车辆泊位预测方法,其特征在于:所述步骤a中停车泊位历史数为某一时间段的目标停车场的泊位数,对所述停车泊位历史数进行归一化处理,将其压缩为0到1之间的实数,其归一化处理的公式如下:



其中,d为归一化处理之前的原始数据,d*为归一化处理后的数据,dmax为原始数据各字段中数据最大值,dmin为原始数据各字段中数据最小值。


3.根据权利要求2所述的基于强化学习的车辆泊位预测方法,其特征在于:所述停车场泊位预测模型采用基于Actor-Critic架构的PPO算法;所述Actor-Critic架构包括Actor网络和Critic网络;所述Critic网络通过值函数反馈给Actor网络用于反馈训练的好坏;
Critic网络的计算过程如下:
hc,1=relu(xj*wc,1+bc,1)
hc,2=relu(hc,1*wc,2+bc,2)



hc,5=relu(hc,4*wc,5+bc,5)
L_criticj=relu(hc,5*wc,out+bc,out)
Actor网络的计算过程如下:
ha,1=relu(xj*wa,1+ba,1)
ha,2=relu(ha,1*wa,2+ba,2)



ha,5=relu(ha,4*wa,5+ba,5)
L_actorj=relu(ha,5*wa,out+ba,out)






其中,xj为输入序列第j个数据,wc,i和bc,i分别是Critic网络的权重和偏置,i=1,2,...,5,wc,out和bc,out相应的为Critic网络输出层的权重和偏值,L_criticj作为判定Actor网络训练好坏的值函数,wa,i和ba,i分别是Actor网络的权重和偏置,i=1,2,...,5,wa,out和ba,out相...

【专利技术属性】
技术研发人员:岑跃峰张晨光岑岗马伟锋程志刚徐昶周闻王佳晨蔡永平张宇来
申请(专利权)人:浙江科技学院
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1