【技术实现步骤摘要】
一种基于强化学习的车辆泊位预测方法
本专利技术涉及神经网络和强化学习领域,具体为一种基于强化学习的车辆泊位预测方法。
技术介绍
随着国内人民消费水平的普遍提高,我国城乡居民机动车保有数量显著增加,停车问题也逐步在人民的日常生活、工作中凸显,在城市中心区域尤为明显。为了缓解机动车泊位供需矛盾问题,许多应用人工智能的机动车泊位预测方法对该问题进行了分析,进而凭借准确的泊位预测,判断机动车附近的泊位供需状况,为驾驶员提供可靠的泊位需求,缓解城乡的停车问题。传统的泊位预测方法主要是单一的网络预测技术或BP神经网络预测方法,通过对停车场的泊位数据进行处理,能够对停车泊位进行有效的短时预测,但对数据的波动性处理能力不足,得到的预测数据稳定性较差。如公开号为CN108648449A的专利技术公开了一种基于卡尔曼滤波和NAR神经网络组合的车位预测方法,根据预测的数据,比较卡尔曼滤波和NAR神经网络两种预测模型的准确度,以准确度高的次数作为两种模型进行组合预测的权重,进而得到该组合模型的预测值。但在许多的停车场中,很难为上述组合模型提 ...
【技术保护点】
1.一种基于强化学习的车辆泊位预测方法,其特征在于:按下述步骤进行:/na、获取目标停车场的停车泊位历史数,并对所述停车泊位历史数进行归一化处理形成数据集,以数据集中60-90%的数据作为训练集,以数据集中10-40%的数据作为测试集;/nb、基于强化学习理论构建停车场泊位预测模型,将训练集输入至停车场泊位预测模型进行训练;/nc、利用训练后的停车场泊位预测模型进行目标停车场的车辆泊位预测,以测试集验证停车场泊位预测模型的预测准确性。/n
【技术特征摘要】
1.一种基于强化学习的车辆泊位预测方法,其特征在于:按下述步骤进行:
a、获取目标停车场的停车泊位历史数,并对所述停车泊位历史数进行归一化处理形成数据集,以数据集中60-90%的数据作为训练集,以数据集中10-40%的数据作为测试集;
b、基于强化学习理论构建停车场泊位预测模型,将训练集输入至停车场泊位预测模型进行训练;
c、利用训练后的停车场泊位预测模型进行目标停车场的车辆泊位预测,以测试集验证停车场泊位预测模型的预测准确性。
2.根据权利要求1所述的基于强化学习的车辆泊位预测方法,其特征在于:所述步骤a中停车泊位历史数为某一时间段的目标停车场的泊位数,对所述停车泊位历史数进行归一化处理,将其压缩为0到1之间的实数,其归一化处理的公式如下:
其中,d为归一化处理之前的原始数据,d*为归一化处理后的数据,dmax为原始数据各字段中数据最大值,dmin为原始数据各字段中数据最小值。
3.根据权利要求2所述的基于强化学习的车辆泊位预测方法,其特征在于:所述停车场泊位预测模型采用基于Actor-Critic架构的PPO算法;所述Actor-Critic架构包括Actor网络和Critic网络;所述Critic网络通过值函数反馈给Actor网络用于反馈训练的好坏;
Critic网络的计算过程如下:
hc,1=relu(xj*wc,1+bc,1)
hc,2=relu(hc,1*wc,2+bc,2)
hc,5=relu(hc,4*wc,5+bc,5)
L_criticj=relu(hc,5*wc,out+bc,out)
Actor网络的计算过程如下:
ha,1=relu(xj*wa,1+ba,1)
ha,2=relu(ha,1*wa,2+ba,2)
ha,5=relu(ha,4*wa,5+ba,5)
L_actorj=relu(ha,5*wa,out+ba,out)
其中,xj为输入序列第j个数据,wc,i和bc,i分别是Critic网络的权重和偏置,i=1,2,...,5,wc,out和bc,out相应的为Critic网络输出层的权重和偏值,L_criticj作为判定Actor网络训练好坏的值函数,wa,i和ba,i分别是Actor网络的权重和偏置,i=1,2,...,5,wa,out和ba,out相...
【专利技术属性】
技术研发人员:岑跃峰,张晨光,岑岗,马伟锋,程志刚,徐昶,周闻,王佳晨,蔡永平,张宇来,
申请(专利权)人:浙江科技学院,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。