一种基于强化学习的车辆泊位预测方法技术

技术编号：22944906 阅读：24 留言：0更新日期：2019-12-27 17:13

本发明专利技术公开了一种基于强化学习的车辆泊位预测方法，按下述步骤进行：a、获取目标停车场的停车泊位历史数，并对所述停车泊位历史数进行归一化处理形成数据集，以数据集中60‑90％的数据作为训练集，以数据集中10‑40％的数据作为测试集；b、基于强化学习理论构建停车场泊位预测模型，将训练集输入至停车场泊位预测模型进行训练；c、利用训练后的停车场泊位预测模型进行目标停车场的车辆泊位预测，以测试集验证停车场泊位预测模型的预测准确性。本发明专利技术能够达到预测出停车场的泊位情况的目的，泊位情况的预测准确性高。

A method of parking prediction based on Reinforcement Learning

全部详细技术资料下载

【技术实现步骤摘要】
一种基于强化学习的车辆泊位预测方法
本专利技术涉及神经网络和强化学习领域，具体为一种基于强化学习的车辆泊位预测方法。
技术介绍
随着国内人民消费水平的普遍提高，我国城乡居民机动车保有数量显著增加，停车问题也逐步在人民的日常生活、工作中凸显，在城市中心区域尤为明显。为了缓解机动车泊位供需矛盾问题，许多应用人工智能的机动车泊位预测方法对该问题进行了分析，进而凭借准确的泊位预测，判断机动车附近的泊位供需状况，为驾驶员提供可靠的泊位需求，缓解城乡的停车问题。传统的泊位预测方法主要是单一的网络预测技术或BP神经网络预测方法，通过对停车场的泊位数据进行处理，能够对停车泊位进行有效的短时预测，但对数据的波动性处理能力不足，得到的预测数据稳定性较差。如公开号为CN108648449A的专利技术公开了一种基于卡尔曼滤波和NAR神经网络组合的车位预测方法，根据预测的数据，比较卡尔曼滤波和NAR神经网络两种预测模型的准确度，以准确度高的次数作为两种模型进行组合预测的权重，进而得到该组合模型的预测值。但在许多的停车场中，很难为上述组合模型提...

【技术保护点】
1.一种基于强化学习的车辆泊位预测方法，其特征在于：按下述步骤进行：/na、获取目标停车场的停车泊位历史数，并对所述停车泊位历史数进行归一化处理形成数据集，以数据集中60-90％的数据作为训练集，以数据集中10-40％的数据作为测试集；/nb、基于强化学习理论构建停车场泊位预测模型，将训练集输入至停车场泊位预测模型进行训练；/nc、利用训练后的停车场泊位预测模型进行目标停车场的车辆泊位预测，以测试集验证停车场泊位预测模型的预测准确性。/n

【技术特征摘要】
1.一种基于强化学习的车辆泊位预测方法，其特征在于：按下述步骤进行：
a、获取目标停车场的停车泊位历史数，并对所述停车泊位历史数进行归一化处理形成数据集，以数据集中60-90％的数据作为训练集，以数据集中10-40％的数据作为测试集；
b、基于强化学习理论构建停车场泊位预测模型，将训练集输入至停车场泊位预测模型进行训练；
c、利用训练后的停车场泊位预测模型进行目标停车场的车辆泊位预测，以测试集验证停车场泊位预测模型的预测准确性。

2.根据权利要求1所述的基于强化学习的车辆泊位预测方法，其特征在于：所述步骤a中停车泊位历史数为某一时间段的目标停车场的泊位数，对所述停车泊位历史数进行归一化处理，将其压缩为0到1之间的实数，其归一化处理的公式如下：

其中，d为归一化处理之前的原始数据，d*为归一化处理后的数据，dmax为原始数据各字段中数据最大值，dmin为原始数据各字段中数据最小值。

3.根据权利要求2所述的基于强化学习的车辆泊位预测方法，其特征在于：所述停车场泊位预测模型采用基于Actor-Critic架构的PPO算法；所述Actor-Critic架构包括Actor网络和Critic网络；所述Critic网络通过值函数反馈给Actor网络用于反馈训练的好坏；
Critic网络的计算过程如下：
hc,1＝relu(xj*wc,1+bc,1)
hc,2＝relu(hc,1*wc,2+bc,2)

hc,5＝relu(hc,4*wc,5+bc,5)
L_criticj＝relu(hc,5*wc,out+bc,out)
Actor网络的计算过程如下：
ha,1＝relu(xj*wa,1+ba,1)
ha,2＝relu(ha,1*wa,2+ba,2)

ha,5＝relu(ha,4*wa,5+ba,5)
L_actorj＝relu(ha,5*wa,out+ba,out)

其中，xj为输入序列第j个数据，wc,i和bc,i分别是Critic网络的权重和偏置，i＝1,2,...,5，wc,out和bc,out相应的为Critic网络输出层的权重和偏值，L_criticj作为判定Actor网络训练好坏的值函数，wa,i和ba,i分别是Actor网络的权重和偏置，i＝1,2,...,5，wa,out和ba,out相...

【专利技术属性】
技术研发人员：岑跃峰，张晨光，岑岗，马伟锋，程志刚，徐昶，周闻，王佳晨，蔡永平，张宇来，
申请(专利权)人：浙江科技学院，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人